5 grandes preguntas sobre Big Data y Evaluación de Impacto
La acumulación y análisis de datos a escala masiva debe tener un espacio de intersección con la agenda de evaluación de impacto.
La acumulación y análisis de datos a escala masiva es uno de los fenómenos tecnológicos más distintivos de los últimos 20 años; ha revolucionado la gestión empresarial y se perfila también como una herramienta muy potente en la gestión pública. A continuación describo algunos de sus elementos, aplicaciones de uso en la administración pública y, finalmente, el espacio de intersección con la agenda de evaluación de impacto.
1. ¿Qué es Big Data?
Big Data es un concepto muy fluido; Oracle, por ejemplo, usa como referencia la definición de Gartner (2001), en la que se reconoce Big Data como un gran volumen de datos de gran variedad que se genera y mueve a gran velocidad (las tres “v”). Wikipedia, por otra parte, enfoca la noción de Big Data en el hecho de que conforma “bases de datos que son demasiado grandes o complejas para que softwares tradicionales de procesamiento de datos sean capaces de manejarlas”. Como último ejemplo, el diccionario de Google –que usa contenido de los Diccionarios Oxford–, habla de “análisis de grandes y variadas bases de datos que permite revelar patrones, tendencias y asociaciones, especialmente relativas al comportamiento e interacciones humanas”.
Si bien la concepción de Big Data se enfocó inicialmente en el tamaño de las bases de datos y en la complejidad de su análisis, con el paso del tiempo se ha ido otorgando más importancia a la utilidad o al uso de los datos y a los procesos desarrollados para tal fin. Hoy en día, incluso hay quien centra su definición en la manera como se vinculan datos de distinto tipo con fines predictivos y descriptivos para generar valor, independientemente de si los datos son abundantes y complejos o no.
Una forma de resumir de manera sencilla esta discusión abierta, sería: gran cantidad de datos que se procesan para generar valor agregado.
2. ¿De qué magnitudes estamos hablando?
En 2017 se estimaba que había 3.700 millones de usuarios de Internet en el mundo. Esto se tradujo, por ejemplo, en que por cada minuto, se hicieron más de 3,6 millones de búsquedas en Google, se enviaron más de 450.000 tweets, se hicieron más de 150.000 llamadas de Skype, se publicaron 46.000 posts en Instagram, se coordinaron 45.000 viajes por UBER y se registraron más de 4 millones de vistas en Youtube. Esta interacción masiva con el mundo digital, y la posibilidad de aprender algo de ella, ha llevado a las empresas a prestarle particular atención.
Cifras de Newvantage Venture Partners Survey y Statista muestran que 84% de una muestra global de empresas entrevistadas habían iniciado en 2018 alguna iniciativa de análisis avanzado de datos para mejorar sus decisiones empresariales, y 69% declaraba haber tenido éxito en ello. Las empresas ven las iniciativas de Big Data como posibles fuentes de mejora en el servicio al cliente, para bajar gastos, para generar innovaciones, para llegar al mercado más rápidamente e, incluso, como fuente directa de ingresos.
Empresas como Amazon y Google han creado líneas de negocios a partir de esta tecnología: después de haber implementado Big Data en las estrategias del núcleo de su negocio (e-commerce, información), ambas empresas evolucionaron y desarrollaron líneas de negocios que tienen el Big Data como oferta de valor. Amazon Web Services provee, por ejemplo, servicios de almacenamiento y procesamiento de información y Google ha desarrollado productos como los automóviles autónomos y los asistentes personales, cuya oferta de valor es la inteligencia artificial.
3. ¿Es aplicable al sector público?
No cabe duda que el fenómeno de Big Data ha tenido, y seguirá teniendo, una importancia capital en el sector privado. Pero en el sector público… ¿qué podemos esperar? ¿cuál es el potencial que tiene para mejorar la calidad de la gestión pública?
Vale la pena mencionar una iniciativa de CAF, que ha realizado ya su primer piloto en Argentina, llamada “Manos en la Data”. La idea es vincular problemas de política pública con soluciones de inteligencia artificial o machine learning; para esto, se juntaron en mesas de trabajo a funcionarios públicos con científicos de datos, con la intermediación de la fundación Sadosky, SIEMPRO y CAF, contando con la asesoría académica de Walter Sosa Escudero de la Universidad de San Andrés. Como resultado, se lograron desarrollar soluciones “piloto” para seis problemas de política.
Por ejemplo, para el sistema de transporte público de la ciudad de Córdoba se utilizaron datos de georreferencia (GPS) de los autobuses de la ciudad para determinar los desvíos de las rutas contratadas/acordadas con los choferes y detectar así el grado en el que la entrega efectiva de servicios se ajusta o no a lo planificado. Esto tiene mucha utilidad para la implementación de incentivos de desempeño o para el rediseño de las rutas óptimas en caso de ser necesario. Por otra parte, se utilizaron los datos de inspecciones a más de 100 mil empresas y de registros administrativos de la seguridad social para estimar la probabilidad de que una empresa tenga trabajadores no registrados formalmente; esto con el fin de mejorar los esfuerzos de fiscalización de este tipo de actividad. Estos son solo dos ejemplos puntuales en los que la CAF ha apoyado directamente, e ilustran que el espectro de posibilidades y de aplicaciones es muy extenso.
4. ¿Cuáles son los dilemas éticos asociados al uso de Big Data?
A nadie escapa la idea de que estas fuentes masivas de información, muchas veces muy personal, dan poder a quien las controla. Tanto en lo privado como en lo público, emergen dilemas éticos importantes: ¿para qué se usa la información? ¿Quiero usar la información para vender un par de zapatos o para influir en algún tema de interés colectivo? ¿Cómo se define ese interés colectivo? ¿Está bien utilizar información sobre los patrones de gasto de la ciudadanía para focalizar la asistencia social? Y si esa información se utilizara con fines políticos, ¿dónde están los límites y quién los impone?
Estas preguntas no tienen necesariamente respuestas inequívocas. Son preguntas que emergen en la medida en que las posibilidades de explotar las herramientas de Big Data van dejando en claro los riesgos que suponen, y las sociedades responden a estos dilemas de diversas formas, incluyendo regulación pública, derechos de propiedad explícitos sobre los datos que nuestra acción cotidiana genera (consentimiento informado) y autorregulación de empresas e instituciones.
5. ¿Cómo pueden complementarse las agendas de Big Data y de Evaluación de Impacto?
La evaluación de impacto es una herramienta que cuantifica el impacto o efecto de una política pública específica; es decir, determina qué parte de los cambios observados en las variables de interés son atribuibles a la política. Por tanto, la evaluación de impacto sirve para saber en qué medida un programa o iniciativa logra su cometido.
La evaluación de impacto sirve aprender sobre lo que funciona y lo que no, pero participar en una evaluación también mejora las capacidades de las instituciones para utilizar herramientas científicas en la gestión pública, incluyendo una mayor valoración de la calidad del registro de datos administrativos. Big Data brinda la posibilidad de aprovechar la data disponible y su cruce con información primaria, para medir el impacto de políticas de una manera que hace un par de décadas no hubiera sido posible. Algunos de los proyectos impulsados por la Dirección de Evaluación de Impacto y Aprendizaje de Políticas (DEIAP) de CAF se han movido en esta dirección.
En Venezuela, por ejemplo, usamos información sobre miles de contribuyentes morosos para hacerles llegar mensajes de pago a través de Facebook y de correo electrónico, para luego medir la efectividad de los canales de comunicación en estimular el pago. En Bogotá y en Medellín usamos información de GPS de las patrullas policiales cada seis segundos y de la ubicación de delitos reportados a la policía, para medir el impacto de una estrategia de focalización territorial de la presencia policial sobre el delito: los datos de patrullas nos permiten medir con precisión el grado con el que los patrulleros cumplen el protocolo de vigilancia sobre el territorio y, por tanto, tener una medida más precisa del efecto del patrullaje sobre el delito.
Por último, en Perú estamos trabajando de la mano con SUTRAN para intentar reducir la accidentalidad vial que involucra a transportistas de carga. Con datos de GPS se puede saber el sitio y la velocidad de desplazamiento de cada unidad de transporte de carga en el país en cada momento del día y estamos evaluando el efecto de impartir una capacitación a los conductores en manejo defensivo sobre los excesos de velocidad. Con estos datos esperamos se puedan identificar ciertos patrones para generar diagnósticos sobre los sitios más peligrosos y poder estudiar la posibilidad de evaluar el efecto sobre la accidentalidad de, por ejemplo, mejoras en la señalización u otras acciones disuasivas como el posicionamiento de patrullas policiales.
La evaluación de impacto como el Big Data son herramientas muy útiles para mejorar la calidad de las decisiones sobre recursos públicos y, aunque ocupan espacios que parecen independientes, existen muchas instancias donde se intersectan y donde se pueden complementar de manera provechosa.