Análisis exploratorio de datos abiertos para el fortalecimiento de democracias

En este artículo encontrás el contenido técnico de tecnología (notebook) y las diapositivas de la charla “Análisis exploratorio de datos abiertos para el fortalecimiento de democracias” presentada en la PyCon US 2022 (PyCon Charlas).

Para empezar, todo el análisis de datos hay que tener un contexto. Lo nuestro es la existencia, en Brasil, de una ley que permite a las mujeres votaren y seren votadas, además las legislaciones de cuota de género (Ley 9.504/1997 y 12.034/2009) y el tema de las propuestas legislativas.

Los temas de las proposiciones son interesante porque la Organización de los Estados America (OEA) prevé que a partir de 30% de mujeres en las casas legislativas se nota aumento sustancial en proposiciones legislativas en favor de la democracia y protección de derechos de grupos históricamente marginados, ejemplo: campesinos, mujeres, población LGTQIA+, negros, ancianos, discapacitados, artistas, poblaciones económicamente vulnerables y pueblos indígenas.

Si tienes interés en el tema de datos abiertos y nivel de transparencia de datos en América Latina, invitote a leer el artículo con el contenido teórico de la charla.

Pipeline

El pipeline de este análisis es compuesto por colecta, pre-procesamiento y análisis de datos. Todavía, antes del análisis de las proposiciones hizo falta estandarizar sus palabras claves, por lo tanto fue desarrolado un classificador (modelo de aprendizaje de máquina).

Los datos fueron colectados del Portal de Datos Abiertos de la Cámara de Diputados de Brasil y corresponden a las candidaturas electas en el periodo de 1934 y 2021. El objetivo del análisis es compreender la evolución de la cantidad de mujeres elegidas como diputadas federal, el impacto de las legislaciones de cuotas de género y si ya se nota cambio en las temáticas de las propuestas legislativas.

Colecta de datos

Fue usada la API RestFul en Python para recolectar los datos, excepto los de las proposiciones legislativas que no estaban disponible por API, en este caso los datos fueron descargados manualmente año a año.

Es importante decir que en el Portal de Datos Abiertos de la Cámara de Diputados de Brasil no están disponibles todas las proposiciones legislativas hasta el año 2000. Entonces, puede que los resultados del análisis no refleje la realidad, todavía creo que es un buen ejercicio para tener ideas de cómo podemos manejar datos abiertos y actuar desde la sociedad civil.

Pre procesamiento

Las seguintes etapas del pipeline puedes encontrar en este notebook.

Consideraciones finales

Desde la sociedad civil, hay un montón de iniciativas que trabajan y luchan por mejoras en nuestra sociedad. Únete a una de ellas!! Nadie cambia el mundo sola, todavía puedes aportar tu granito de arena.

Organizaciones que promueven uso de la tecnología para el fortalecimiento de democracias


Este texto son los apuntes de la charla “Análisis exploratorio de datos abiertos para el fortalecimiento de democracias” presentada en la PyCon US 2022 (PyCon Charlas) en el 29 abr 2022 en la ciudad de Salt Lake City(EUA).

Recursos:

También puedes leer este texto en: 🇧🇷

Ana Cecília Vieira Analista de datos experta en calidad de datos.Entusiasta de datos abiertos, código abierto y de las comunidades autogestionadas como instrumento para el cambio social. Embajadora del programa 'Ciencia de Datos para Innovación Cívica' de la Open Knowledge Brasil y podcaster en el Pizza de Dados.

-----

Lea también: