Durante la tarde del sábado 2 de julio de 2023, casi una semana posterior a las elecciones generales de Guatemala y al parlamento centroamericano, me encontraba jugando una partida del Call Of Duty Modern Warfare 2, cuando recibí un mensaje inesperado en un grupo de Whatsapp acerca de un hilo que se estaba convirtiendo en tendencia y a partir de ese momento, supe que una larga jornada tenía por delante.
Empecemos diciendo que era una tarde normal de julio (en la medida de lo posible, porque definitivamente tenía sus peculiaridades), durante toda la semana se había sentido una vibra de esperanza en la mayoría de mis conocidos. ¿El motivo? El candidato socialdemócrata del partido Movimiento Semilla había podido colarse a la segunda vuelta de las elecciones para presidente de la República, era un hecho que nadie había visto de ninguna manera. La gente mencionaba que por fin podría ser el cambio tan esperado que el país necesitaba, gente de toda trasfondo compartía sus buenos ánimos en cada una de las redes sociales más populares de Guatemala.
Sin embargo, el motivo de esta nota no es hablar de los hechos presidenciales. Aunque las elecciones para presidente habían traído un gran regocijo, había varias inquietudes en la legitimidad de las elecciones para los distintos puestos públicos. Una de estas inquietudes eran para las elecciones de la corporación Municipal de Ciudad de Guatemala, las cuales los datos preliminares mostraban que el actual alcalde Ricardo Quiñonez había vuelto a reelegirse con una diferencia mínima sobre el candidato Roberto – Canela – Gónzalez. En la página oficial del Tribunal Supremo Electoral, https://www.trep.gt/#!/tc4/DIV/e0/m1, los resultados eran los siguientes:
¿Qué se escuchaba en las redes?
Distintas cuentas de Twitter manifestaban un fraude electoral del alcalde Quiñonez, pero los argumentos parecían ser bastante empíricos y fácilmente debatibles. A pesar de eso, ciertas cuentas habían empezado a hacer análisis de los datos, pero fue realmente un hilo de Twitter que desencadenó el análisis que estaré detallando en la siguiente sección. El hilo en cuestión es el siguiente:
========================
— André (@DerekUrizar) July 1, 2023
Votos totales: 212893
Votos totales Unionista: 106570
Votos totales Creo: 106323
Diferencia: 247
=========================
El github ya esta actualizado con los nuevos cambios. Así todos tenemos la misma data 😀
Luego de hacer un análisis riguroso a los datos que dicha persona presentaba, encontré diversas discrepancias en su metodología que me provocaron replicar su procedimiento y comprobar las cuestiones que encontraba poco rigurosas. Mi análisis de los datos de dicha persona pueden encontrarse en el siguiente repositorio: https://github.com/RudiksChess/analisis_alcalce_ciudad_guatemala_elecciones_2023
De este ejercicio, se pueden comentar una diversidad de cuestiones (espero publicar una nota metodológica en un par de días). Pero mi conclusión preliminar es que el análisis de escaneo de imágenes y luego hacer un procesamiento con OCR, no es una manera efectiva de detectar el posible fraude en las actas. Como referencia, mi propio análisis con OCR se puede verificar a continuación:
En donde los datos extraídos con AWS Textract (herramienta de OCR hecha por Amazon) puede encontrarse aquí:
Los resultados de dicho análisis se muestran a continuación:
Como referencia, mi análisis únicamente lo basé para los partidos CREO y VALOR-UNIONISTA. Sin embargo, reitero que los resultados no son efectivos y que solamente son la punta del iceberg de lo que encontré posteriormente y que en unos párrafos detallaré.
Por otra parte, también tengo conocimiento que otra organización ha trabajado un análisis de datos con la misma metodología de análisis de imágenes, sin embargo, sin una metodología rigurosa de qué es lo se hizo, no puedo darle mi confianza a dicho análisis:
Guatemala Visible, como observador elecotoral registrado ante el @TSEGuatemala y las organizaciones abajo firmantes, se han dado a la tarde de realizar un Ejercicio de Observación Ciudadana, que consiste en llevar a cabo un trabajo de verificación de actas para la elección de… pic.twitter.com/fiqR5fg9ZP
— Guatemala Visible (@guatevisible) July 4, 2023
El análisis de datos completo
Para un análisis de datos efectivo, evidentemente se depende de la calidad de los datos, ¿y en este caso dónde se consiguen datos de calidad? Pues, la respuesta siempre estuvo enfrente de nuestros ojos: la página oficial del TSE. La cual cuenta con una base de datos ya bastante ordenada y tabulada, desagregado por cada uno de los centros de votación y JRV. Dichos datos, se encuentran en la parte superior derecha de la página web https://www.trep.gt/#!/tc1/ENT.
Los análisis que iré detallando a continuación, son la explicación de su contraparte en código, que puede verificarse detalladamente en este enlace:
Entonces, ¿cuáles son los errores?, ¿hay evidencia de fraude?
Para la primera pregunta, sí, hay múltiples errores y pareciera ser que no fueron malintencionados, simplemente los miembros de las JRV cometieron errores al confundir las papeletas. Por ejemplo, usaron la papeleta de diputados por lista nacional en lugar de la de corporación municipal; en algunas casos empezaron a paniquear e hicieron un montón de testados, lo que a su vez provocó una mala digitación de los datos. Sin embargo, no siempre fue el caso y en situaciones muy concretas los digitadores colocaron mal los números, confundieron los 6s y 9s con 0s. Pero de igual forma, fueron pocos casos y definitivamente se podría considerar estadísticamente insignificante. De momento no hay indicios de fraude. Los errores encontrados son los siguientes:
JRV (mesa/s) | Problema |
1, 1432, 1567, 1675 | No hay problema en los votos de los partidos, pero no se digitó la variable de ‘VÁLIDO’ |
1294 | Dos partidos sin datos, se tuvo que hacer un arreglo a eso datos |
242 | Dice acta ilegible, pero tiene varios testados y se logra entender |
368 | Se confundieron de papeleta, usaron la de diputados distritales, la correcta está en este link: https://www.trep.gt/#!/tc2/CAS/e0/m1/30?casId=M368; el COMITE CIVICO LA GOTA DE AGUA no aparece en la papeleta entonces 0; Foppa X La Ciudad como Semilla |
599 | Aparece como acta ilegible – Pero simplemente el testado no era para los datos de los partidos sino las sumatorias, los datos están correctos. |
604 | Se confundieron de papeleta – el link de la papeleta está aquí: https://www.trep.gt/#!/tc2/CAS/e0/m1/47?casId=M604; el COMITE CIVICO LA GOTA DE AGUA no aparece en la papeleta entonces 0; Foppa X La Ciudad como Semilla (aunque aparece como 0, hay algo raro); no está el partido PODER |
1319 | No se ve muy bien, pero a lo lejos se ve entendible |
1649 | Dice acta ilegible, pero se logra ver más o menos bien |
1688 | Aparece como acta ilegible, yo lo veo bien |
1834 | Aparece como acta ilegible, yo lo veo bien, solo es de ver los testados |
Considerando esto, algunos de los ejemplos de estas papeletas se ven así
Posteriormente a esto, los datos proporcionados por el TSE tiene una variable con observaciones, hay una que llama demasiado la atención: Sumas Asentadas Sin Cuadrar. Esta variable nos hace intuir que hay actas en donde las sumas de los partidos y las actas recibidas no coinciden. Uno podría considerar que las actas son mínimas y que no deberían ser estadísticamente significativas, sin embargo un análisis superficial nos indica que hay 222 actas en donde las sumas no son correctas, lo que definitivamente levanta las alarmas. Un análisis más minucioso de las mesas que tiene mayores discrepancias muestran lo siguiente:
JRV (mesa/s) | VOTOS JRV | VOTOS SUMAS | DIFERENCIA | COMENTARIO |
112 | 252 | 144 | 108 | Hay votos faltantes en la parte superior, afecta directamente a valor unionista. |
1643 | 256 | 153 | 103 | 100 votos para FOPPA X LA CIUDAD faltantes, hay 3 votos desaparecidos |
133 | 229 | 329 | 100 | Se confundieron en la sumatoria |
991 | 119 | 219 | 100 | Se confundieron en la sumatoria |
1173 | 165 | 265 | 100 | Está bien, el digitador no tomó en cuenta el testado |
1335 | 264 | 174 | 90 | Le pusieron 1 en lugar de 91 a CREO |
571 | 263 | 184 | 79 | El digitador no tomó en cuenta el testado |
269 | 279 | 348 | 69 | Se confundieron en la sumatoria |
Hasta este punto, aparentemente no hay ningún indicio que nos muestre que haya fraude. De hecho, parecieran ser errores asociados a simplemente no haber escrito claramente los números.
Pero aquí es cuando empiezan las cosas raras, por ejemplo en las mesas 112, 1433 y 1386 los datos para el partido VALOR-UNIONISTA no tiene registrados votos, lo que hace que la sumatorias no cuadren. En el caso de la 112 no aparece ningún número y en el caso 1433 y 1386 tienen 0 votos directamente (cuando prácticamente en ninguna mesa de las 2023 mesas, VALOR-UNIONISTA ha obtenido 0 votos). A continuación se adjunta la mesa 112:
La mesa 1433:
Pues bueno, 3 casos aislados no parecen ser nada significantes. El problema es que cuando se extrapola, parece ser un problema también para la coalición FOPPA X LA CIUDAD, en la cual directamente en múltiples mesas tienen 0, cuando la tendencia general en los centros de votación no indica que sea esa la tendencia. Por listar algunas casos, tenemos la mesas 921, 1228 y 1720 (curiosamente sin fiscal de la coalición):
JRV (mesa/s) | VOTOS JRV | VOTOS SUMAS | DIFERENCIA |
921 | 249 | 203 | 46 |
1228 | 238 | 193 | 45 |
1720 | 256 | 210 | 46 |
Hasta este momento, uno podría decir que no es bastante clara una manipulación de las actas, incluso podría ser asociados a errores de cálculo humano (ajá, 46 votos desaparecidos). Sin embargo, al detectar todas las actas que tienen este tipo de error, uno se lleva la friolera sorpresa de que son 177 actas en donde hay votos que desaparecieron y no cuadran las sumas, de esas actas, se contabilizan 2004 votos desaparecidos en sumas que no cuadran.
Para este momento, es que las cosas se ponen turbias, 2004 votos perfectamente podrían decidir al futuro alcalde la Ciudad de Guatemala. Por motivos de transparencia, todos los errores se encuentran en el siguiente drive (los errores que aún no tiene explicación son los que dicen ‘Pendiente’ y los que empiezan con ‘No cuadran’: https://docs.google.com/spreadsheets/d/16jwEHeBrQoR1u4qSEwdKuxr8MWnXdJ3S/edit#gid=773558466
El robo hormiga
De esas 177 actas que no cuadran, algunas actas parecieran ser pequeños errores al hacer las sumatorias por las JRV. Por ejemplo, un ejemplo sería la mesa 6, en donde llegaron a votar 228 personas, esto se observa en la papeleta de presidente y vicepresidente:
Pero en la acta de corporación municipal, se encuentra que solamente se usaron 227 papeletas. ¿Acaso una persona se robó una papeleta? ¿O quizás no le contabilizaron a algún partido su voto?
El robo de elefante
El patrón se repite en grandes proporciones también, por ejemplo en la mesa 3, en la acta de Presidente y Vicepresidente en teoría se presentaron 215 personas a votar (hasta aquí todo bien).
Sin embargo, cuando nos vamos a la acta de corporación municipal nos encontramos que la sumatoria de los partidos da 155, cuando en el acta dice que hay 203 votos válidos ¿volvieron a desaparecer los votos? ¿se esfumaron? Hay 48 votos que desaparecieron. Incluso en los espacios para marca la cantidad de papeletas recibidas y no usadas, intentan aparentar que no hay ningún problema.
Análisis de geolocalización
Aunque de momento no puedo afirmar que exista una correlación entre el lugar geográfico y las inconsistencias, podría servir para un análisis posterior. Por lo que hago público los datos geográficos para cada una de las JRV concatenadas con los datos arreglados del TREP (esta es la base de datos final, la que debería usarse para el análisis):
https://drive.google.com/file/d/1CNwsH35voYdaw8fTLjpaklyEseDryhdR/view?usp=share_link
Para las inconsistencias, se observa lo siguiente (aunque nada concluyente):
Conclusiones
En resumen, como anteriormente mencioné, en el drive se encuentran detalladas las 177 actas que contienen estos errores. Además en este enlace se encuentran las 2023 actas descargadas: https://drive.google.com/file/d/19wpyYK15MiLgCB07yuw28C_gNuoG1hHX/view?usp=share_link
Este es un proyecto en desarrollo y no estaba planificado salir a luz tan pronto, pero viendo que el plazo para el reconteo de votos se acaba, este análisis tuvo que salir lo más pronto posible. Los siguientes pasos serán aplicar técnicas de distribuciones estadísticas, machine y deep learning para determinar con más certeza desde el punto matemático las posibles manipulaciones de los votos. Este análisis también se piensa aplicar a las actas para las presidenciables.
De momento, se aclara que es un proyecto experimental y podría contener multitudes de errores metodológicos. El proyecto es open source, todos los códigos, datos extraídos y análisis se encuentran en los respectivos links proporcionados, la idea es que todos los ciudadanos puedan tener la opción de analizar las inconsistencias.
Con los análisis hechos, actualmente así está la diferencia entre CREO y VALOR UNIONISTA:
PARTIDO | TREP | RUDIK |
CREO | 105698 | 106362 |
VALOR UNIONISTA | 106220 | 106697 |