Ciencia de datos en política pública
Inteligencia artificial, ¿aliada o enemiga?

Apasionada de utilizar la inteligencia artificial en beneficio de la ciudadanía mediante soluciones transparentes, justas, equitativas y eficientes. Maestría en Ciencia de Datos y en Computación Financiera. Directora de la Iniciativa de Inteligencia Artificial en la Escuela de Gobierno y Transformación Pública del Tec de Monterrey. Twitter: @minuli_

Ciencia de datos en política pública
La ciencia de datos puede ser un elemento auxiliar en el diseño de políticas públicas. Foto: geralt/Pixabay.

El caso de uso se trata de una solución implementada en la ciudad de Syracuse, Nueva York. La ciudad quiere cambiar su proceso reactivo de arreglo de fugas de agua causado por ruptura de tuberías, por uno preventivo que le permita concentrar sus esfuerzos y recursos limitados de manera eficiente y eficaz.

En el 2016, Syracuse tenía alrededor de 200 rupturas al año, a veces más de una ruptura en un mismo día. Para arreglar la tubería, la ciudad debe romper el pavimento y detener el abastecimiento de agua a ese bloque, por lo que las viviendas, negocios, oficinas, hospitales y escuelas de la zona se quedan sin servicio.

La solución de ciencia de datos incluye un componente de machine learning (ML) que utilizando datos históricos de los servicios que el departamento de agua de Syracuse ha realizado en el pasado, datos de nivel de flujo, toxicidad, tipos de inclinación, arquitectura de las tuberías y otras características de los predios permite predecir con tres años de anticipación qué bloques de la ciudad tienen alta probabilidad de sufrir una ruptura.

Con los recursos con los que cuenta Syracuse es posible arreglar 52 bloques en tres años, que corresponden al 1% del total de bloques de la ciudad. El modelo de ML ha logrado tener una eficiencia del 62% y una cobertura del 7% enfocado en los 52 bloques que el departamento de aguas puede atender en los siguientes tres años.

¿Qué significa esto? Que de los 52 bloques que el modelo predictivo indica que tendrán una ruptura en los siguientes tres años, el modelo acierta en 32 de ellos –esta es la eficiencia del modelo–. Y, por otro lado, que esos 32 aciertos corresponden al 7% del total de rupturas que realmente ocurrieron en los tres años donde se realizó la validación de la eficiencia del modelo. ¿Y qué tan buena o mala es esta solución? Las soluciones que antes había implementado Syracuse llegaban a lo más a un 48% de eficiencia.

Hay cuatro puntos sobre los cuales vale la pena enfocarnos: 1) Esta solución particular de ML le permite a Syracuse planear los siguientes tres años de mantenimientos preventivos. 2) La solución de ML utiliza los recursos disponibles mejorando la eficiencia. 3) Es posible cuantificar el desempeño de la solución de ML y comparar con el desempeño de la solución actual sin que ésta sea necesariamente de ML. 4) Es posible generar un menú de opciones al tomador de decisiones para conocer el desempeño de la solución si se disminuye el número de recursos disponibles o bien si se aumenta el número de recursos disponibles. Este último punto, resulta de gran utilidad para el tomador de decisión, pues permite identificar sin ambigüedad cuánto más sube el desempeño si se aumentan recursos y cuánto se disminuye si se cuenta con menos recursos, ambos escenarios comunes en política pública.

Si quieres conocer más de este caso de uso, puedes leer sobre su detalle en el paper Using Machine Learning to Assess the Risk of and Prevent Water Main Breaks publicado en KDD 2018. Así como el video que explica la solución perteneciente al fellowship de Data Science for Social Good (DSSG) del 2016.

Síguenos en

Google News
Flipboard