Математики из Калифорнийского университета в Лос-Анджелесе (США) разработали алгоритм для выявления того, какие уличные банды совершали нераскрытые преступления.
Это первое в своём роде академическое исследование группового насилия.
Специалисты проанализировали более тысячи преступлений, совершённых бандами (или в совершении которых банды подозреваются, поскольку около половины из них не раскрыты) за десятилетний период на востоке Лос-Анджелеса, в районе Холленбек. Там насчитывается около тридцати группировок, в которые входят почти семьдесят банд.
Для тестирования алгоритма исследователи создали набор модельных данных, которые очень похожи на то, что происходит в Холленбеке. Затем они отбросили некоторую ключевую информацию — о жертве, преступнике или о том и другом вместе — и взглянули на то, насколько хорошо алгоритм может вычислить недостающие сведения.
«Если полиция считает, что преступление могло быть совершено одной из семи или восьми соперничающих банд, наша система проанализирует недавние события и вычислит вероятность, с которой каждый из этих «коллективов» был способен на преступное деяние», — поясняет Андреа Бертоцци, проводившая эту работу с математиком Алексеем Стомахиным.
Примерно в 80% случаев учёные смогли сузить количество вероятных участников преступления до трёх банд, одна из которых и впрямь оказывалась виновной. При этом «правильная» банда становилась номером один в 50% случаев (при случайном распределении — только в 17%).
«Мы можем сделать алгоритм ещё лучше, — говорит г-жа Бертоцци. — Работа в самом начале. Нужны более сложные методы».
Практическое применение алгоритма выходит далеко за рамки борьбы с преступностью. «Метод может применяться к более широкому классу задач, в том числе к активности в социальных сетях, — отмечает эксперт. — Неважно, о каком событии идёт речь — о преступлении или о чём-то другом. Главное — они должны происходить в определённом временнóм промежутке и в пределах известной сети, между узлами которой есть некое взаимодействие: в данном случае — одна банда нападает на другую. Участники одних событий вам известны, других — нет. Задача состоит в том, чтобы сделать наиболее обоснованное суждение о том, кто этот неизвестный».
Один из примеров — определение хакеров. Другой — помощь компаниям с целевой рекламой с одновременной защитой потребителей от вмешательства в частную жизнь. «Рекламодатель не будет знать, что это за человек, но получит информацию о том, как он ведёт себя», — поясняет г-жа Бертоцци.
Результаты исследования опубликованы в журнале Inverse Problems.
Подготовлено по материалам Калифорнийского университета в Лос-Анджелесе.
ДМИТРИЙ ЦЕЛИКОВ