Notas sobre las elecciones 2026 (i)
Las encuestas
Una de las cosas que más me atormenta de estos procesos es la manera superficial, irresponsable y profundamente equivoca como se maneja la información de las encuestas. Así, que este es un tema sobre el que creo vale la pena aclarar algunas cosas. Vamos a hacer esto de un modo muy esquemático:
1. Desde el punto de vista estadístico existen, básicamente, dos tipos de encuestas por muestreo: las que permiten hacer inferencias estadísticas (las que suelen llamarse “representativas” aunque el nombre correcto es otro: probabilísticas) y las que no lo permiten (los resultados sólo informan sobre los casos efectivamente observados y no sobre la población de la que se tomaron esos casos). Por ejemplo, si yo hago una encuesta en mi barrio o entre mis familiares, esa encuesta (si la hago bien) me pude dar información sobre los que contestaron, pero no permite decir nada del país en su conjunto pues no hay forma de asumir que mi barrio o mis familiares son, en algún sentido, “representativos” del Perú.
2. Las encuestas probabilísticas (si están bien hechas) pueden tener varias formas, pero comparten un atributo muy importante que nos permite hacer inferencias: permitan estimar la precisión (que no puede ser absoluta) de las inferencias. Por esta razón, cuando se calcula el tamaño de la muestra que necesito tomar debo considerar cuán homogénea/heterogénea es la población respecto de aquello que quiero medir y un parámetro inicial del error de estimación que me resulta aceptable. Nótese que “error” en este caso, no quiere decir que esté mal, sino que no puedo esperar que el valor que observe en la muestra sea idéntico a lo que pasa en la población y, por lo tanto, hay un margen de imprecisión que debo tener en cuenta.
3. Acá empiezan los problemas. Todas las encuestadoras serias reportan el margen de error que usan para estimar el tamaño de la muestra, pero ese margen no es lo único que se requiere ya que cada valor que se estima tiene un error propio y ese error, que es el que importa, sólo lo reporta de modo gráfico el IEP.
4. Así, la manera rigurosa de reportar tiene esta forma: Candidato A XX% (X.XX) donde el valor entre paréntesis es el error estándar de esa estimación en particular. Alternativamente se puede decir: Candidato A: XX-YY% (al Z% de confianza) donde XX-YY es un rango (entre 9.5 y 10.3 por ejemplo) que tiene un margen de certeza (el Z), a más certeza (es decir a mayor probabilidad de que el rango contenga lo que sucede a nivel poblacional) más grande el rango.
5. ¿Por qué no se publica así? La explicación que yo he escuchado es más o menos ésta (y la considero plausible): las encuestadoras son, principalmente, empresas que hacen estudios de mercado para empresas y cuando reportan de la manera correcta, la respuesta de sus clientes es que eso es demasiado complicado (“no me des esos rangos, dame solo un número, no me digas que los rangos pueden ser más o menos chicos, me confundes”) y me imagino que algo parecido debe suceder con los medios de prensa. A lo largo de los años, los informes de las encuestadoras se han hecho cada vez más “amigables”, es decir, superficiales, ya no se escribe un informe, se entrega un archivo de PowerPoint, ya no hay tablas, sólo gráficos, y se prescinde de todo lo que “sobrecarga” la parte gráfica.
6. Esta práctica podría no ser un problema si las diferencias entre los candidatos fuesen, por ejemplo, de 20 puntos porcentuales, pero si estamos en “final de fotografía” (no me queda claro si la analogía hípica se usa por lo estrecho de los márgenes o por los atributos de los candidatos) esto genera mucho ruido.
7. Así, los sesudos comentarios hechos a partir de que en una encuesta uno gana por 0,3 puntos, o que subió/bajó 1 punto son comentarios hechos a partir de nada o, mejor dicho, de la incompetencia para manejar los datos de encuestas por muestreo. Por ejemplo, si no se publican los errores, no hay ninguna forma de determinar si los “conteos rápidos” de DATUM e IPSOS dieron, realmente, información distinta. La manera como se presentan los resultados sugiere que sí, pero esa manera es equívoca. Por ejemplo, DATUM pone a R Sánchez en quinto lugar, pero, lo más probable, es que había un empate múltiple en éste. Asumamos, por ejemplo, que el 9.4 que reportan para Sánchez podía ser, en realidad, 7.4-11.4 (me estoy inventado un margen pues no hay información para saber cuál es pues el famoso “margen de error” del diseño no es el valor que se necesita acá) y el 12.9 de R López Aliaga (a quien ponen segundo) podía ser, en realidad, 10-9-14-9, es decir hay sobreposición en los intervalos lo que se lee exactamente de esta manera: no hay evidencia estadística que permita afirmar que uno de los candidatos le gana al otro (al Z% de confianza).
El Perú se ahorraría mucho ruido si las encuestadoras hicieran dos cosas: (i) reportar los errores de cada estimación, y (ii) forzarán a los medios de comunicación a presentar la información de manera rigurosa.
No hay comentarios:
Publicar un comentario