Machine Learning: ¿Minority Report en Ciudad Neza?

Analytikus
8 nov 2021
4 Min. de lectura

Sr. Marks, por la autoridad de la División de Precrimen está arrestado por el futuro asesinato de Sarah Marks y Donald Dubin que se iba a realizar a las 8:04 a.m.

- ¡No! Yo no hice nada...

Minority Report

La cinta cinematográfica de Minority Report trata sobre un cuerpo policial en el futuro que es capaz de predecir con un 100 % de certeza cuando alguien va a cometer un crimen. El departamento de “Precrimen” de la policía de Washington DC usa visiones del futuro que son provistas por tres mutantes precognitivos (precogs) para detener a los criminales antes de que cometan el delito.

Si bien esta visión de ciencia ficción futurista basada en “precogs” pareciera casi inverosímil hoy en día, resulta que el uso de una combinación de tecnologías pudiera no estar tan lejos de proveer habilidades predictivas en el ámbito policial bastante parecidas a las que John Anderton (Tom Cruise) contaba en su equipo para realizar detenciones anticipadas.

La forma en que es posible sustituir “precogs” por tecnología en el contexto de la seguridad, consta de tres componentes ampliamente usados en arquitecturas de distintas aplicaciones tecnológico-analíticas hoy en día:

a) un ejército de dispositivos de IoT colocados en el contexto de la vida pública y que fungen como sentidos amplificados que son capaces de captar lo que sucede, en particular en nuestro ejemplo, en el contexto de seguridad (cámaras, micrófonos, dispositivos de geolocalización, etc.);
b) infraestructura de Big Data en la Nube que es capaz de integrar, almacenar y procesar el flujo continuo de datos provistos por los dispositivos, conformando una especie de memoria ilimitada;
c) una serie de herramientas de análisis avanzado de datos que, a través de la implementación de algoritmos estadísticos y matemáticos, es capaz de calcular la probabilidad que existe de que un hecho en particular que ha pasado muchas veces, pase otra vez, en nuestro ejemplo, un crimen.

Estos tres componentes, que claramente emulan la forma en que funciona nuestro cerebro y en este caso en particular el de los “precogs”, se comunican entre sí a partir de redes de datos que permiten el flujo de intercambio y la posibilidad de accionar operativos policiales guiados por inteligencia predictiva

Para ilustrar este “pseudo-precog tecnológico-analítico” de forma más palpable expondremos parte del trabajo que realizamos en Analytikus junto con la Dirección de Seguridad del municipio de Nezahualcóyotl durante los años 2017-2018.

Tal como se ha llamado en diversos foros nacionales e internacionales, el “milagro de Ciudad Neza” en términos de seguridad, el cual ha logrado disminuciones constantes en los índices delictivos, se debe al exitoso programa impuesto por el director de su policía, el jefe Amador, desde hace ya más de una década. Una de las muchas aristas de dicho programa, que está compuesto por estrategias tan radicales e innovadoras como cursos de ajedrez a la fuerza policial o la conformación de redes ciudadanas de seguridad encabezadas por la policía, es la incorporación de un área de gestión de datos formal (cosa con la que muy pocas policías municipales cuentan).

Esta área ha sido la encargada de sistematizar y estructurar la data que da cuenta del crimen en el municipio. Desde la estandarización de la forma en cómo se recaba la información sobre cualquier delito, hasta la incorporación de dispositivos como cámaras o geolocalizadores en un C4 , el área de gestión de datos de la Dirección de Seguridad de Neza ha logrado concentrar un acervo de información viva que permite la toma de decisiones tácticas, operativas y estratégicas óptimas en el día a día de la policía.

Con fondos del Programa Nacional de Prevención de la Violencia, la Dirección de Seguridad del municipio definió una iniciativa para sofisticar la forma en cómo se estaban explotando sus datos sistematizados, en la que tuvimos la suerte de participar. Desde el principio, uno de los subproyectos que mayor relevancia tomó fue la construcción de un modelo de Machine Learning que permitiera calcular la probabilidad que existe de que un tipo de crimen suceda en una zona geográfica y en un horario en particular.

La información utilizada para construir el modelo constaba de: el detalle histórico de varios años de todos los crímenes cometidos en el municipio (incluidas variables de modus operandi y geolocalización) y el detalle de la geolocalización de toda la infraestructura del municipio: escuelas, bancos, bares, puntos de venta de drogas, direcciones de criminales, etc.

Utilizando este set de datos entrenamos múltiples modelos de clasificación de machine learning segmentados por algunas variables de corte obvias: a) tipo de crimen, es distinto el comportamiento del robo de autos que el de homicidios, por lo que es importante entrenar modelos separados; b)horarios, igualmente, los comportamientos son muy distintos según horarios por lo que se entrenaron modelos diferenciados: c) cuadrantes, los cuales son áreas geográficas definidas por la policía que definen gran parte de su logística de operación. Entrenamos modelos para ocho técnicas estadísticas diferentes, entre ellas distintos tipos de regresiones, árboles de decisión y redes neuronales para elegir, en cada caso, aquella técnica que tuviera mejores resultados de precisión.

El resultado de los modelos fue bastante sorprendente pues, como es posible imaginarse, la tasa de incidencia a nivel cuadrante, horario y tipo de crimen no es muy alta, lo cual hace difícil la predicción. Las tasas de recall para el primer decil resultaron muy superiores a la tasa de incidencia de la variable objetivo. Comportamiento suficiente para poder utilizar los modelos para priorizar zonas y horarios de patrullaje con base en las probabilidades de incidencia que éstos arrojan.

Si bien, claramente, estas tasas de predicción distan mucho del 100 % de certeza de los "precogs" de la policía de Washington DC en la película de Steven Spielberg, dan cuenta del potencial que este tipo de soluciones tienen para complementar estrategias policiales tácticas y operativas utilizando el poder de los datos.

Por: Roberto Suarez y Armando Alvarez Govela

#data #bigdata #InteligenciaArtificial #MachineLearning #CienciadeDatos #Analíticas

Machine Learning: ¿Minority Report en Ciudad Neza?

Entradas recientes

BLOG