Una interesante manera de obtener buenas estimaciones de los resultados de una encuesta

Estoy seguro de que a la mayoría de vosotros os habrán hecho alguna vez una encuesta, y también estoy seguro de que muchos de vosotros no habréis sido totalmente sinceros (por no decir que “habréis mentido”) en alguna de las preguntas de dicha encuesta por lo comprometedor de la misma. Preguntas relacionadas con temas conflictivos (como la eutanasia, la pena de muerte o el aborto) o con temas tabú (como todo lo relacionado con el sexo) pueden llevarnos a no marcar la respuesta que creemos más cercana a la realidad por miedo o pudor.

Entiendo que las personas encargadas de realizar las encuestas cuentan con esto, conviven con ello, y por tanto tendrán mecanismos para disminuir lo máximo posible la influencia de esta circunstancia en los resultados de las encuestas (o deberían).

Lo que puede resultar curioso es que una opción para que esto ocurra con menos frecuencia sea incluir el azar en el propio acto de responder a la encuesta. Sí, el azar puede ayudarnos a obtener un resultado más fiable de nuestra encuesta. Vamos a ver cómo.

Imaginemos que queremos realizar una pregunta a un grupo grande de personas, digamos 15000. Y supongamos que la pregunta es algo “conflictiva”, algo así como

¿Ve habitualmente (digamos que “habitualmente” es “dos o más veces por semana”) los documentales de La2?

Seguro que muchos de los encuestados dirían en primera instancia que “Sí”, pero ante una pregunta como ésta uno puede no tener muy claro si la respuesta ha sido sincera o no. Vamos a introducir el azar de la siguiente manera:

El proceso para responder a la pregunta será el siguiente:

El encuestado tira una moneda al aire y mira el resultado (sin que lo vea nadie más). Si ha salido cara responde con total sinceridad a la pregunta, y si ha salido cruz responde “No”.

De esta forma se entiende que eliminamos la posibilidad de que el encuestado responda algo que no piensa por el hecho de que el encuestador esté delante, o porque luego vayan a asociar con él una respuesta “comprometida” (que no ve los documentales de La2), ya que si ha respondido “No” puede haber sido porque en realidad respondió sinceramente “No” o porque simplemente obtuvo una cruz al tirar la moneda.

Bien, vayámonos al lugar del encuestador. ¿Para qué le sirve esto? Muy sencillo. Imaginemos que al repasar las respuestas ve que hay, por ejemplo, 14144 respuestas negativas. Por el hecho de que tanto la probabilidad de obtener cara como la de obtener cruz al lanzar una moneda es \textstyle{\frac{1}{2}}, aproximadamente la mitad de los encuestados, unos 7500, habrán respondido “No” porque les salió una cruz. Eliminando estas respuestas tenemos 14144-7500=6644 respuestas negativas que se entiende que son sinceras de entre 15000-7500=7500 respuestas posibles. Eso nos da una probabilidad de

P(\mbox{no ver habitualmente los documentales de La2})=\cfrac{6644}{7500} \approx 0,88587

Es decir, que aproximadamente el 88,6% de los encuestados no ve habitualmente (dos o más veces por semana) los documentales de La2.

Interesante método para conseguir buenas estimaciones de las respuestas que nos ofrece una encuesta. ¿Conocéis más “trucos” de este estilo para disminuir ese miedo/pudor a ciertas respuestas?


Método visto en El hombre anumérico, de John Allen Paulos.


Actualizado el post cambiando “Sí” por “No” cuando sale cruz, así queda más coherente todo. Muchas gracias a @quimtestar por el aviso.

Autor: ^DiAmOnD^

Miguel Ángel Morales Medina. Licenciado en Matemáticas y autor de Gaussianos y de El Aleph. Puedes seguirme en Twitter o indicar que te gusta mi página de Facebook.

11 Comentarios

  1. Hay que tener en cuenta una cosa más. Si crees que la gente puede mentir en sus respuestas también puede mentir en lo de la moneda: que salga cara pero que diga “SÍ”. ¿Cómo se tiene en cuenta este hecho? Lo digo porque yo siempre miento en las encuestas o respondo sin leer la pregunta o las posibles respuestas.

    Martxelo

    Publica una respuesta
  2. Martxelo, partimos de la base de que la persona puede que no responda sinceramente simplemente por miedo, pudor o algo parecido.

    Publica una respuesta
  3. Gaussianos, lo sé, creo que me he explicado mal. Me refiero a que las personas también pueden mentir sobre si ha salido cara o cruz. Entonces no es seguro que mitad de las personas hayan respondido sinceramente (cara) y la otra mitad hayan respondido “NO” (cruz).

    Martxelo

    Publica una respuesta
  4. sí, sí, pero como le estás dando la opción de decir no si hubiese salido cruz, se sentirà más seguro de poder contestar sinceramente si le sale cara.

    Osea si le sale cara y su respuesta es NO, pero le da pudor reconocerlo, piensa: “Si digo NO puede pensar que me ha salido cruz, y me libro…”

    en ambos casos salimos ganando tanto el encuestado como el encuestador.
    Buen método!

    Publica una respuesta
  5. El método (me parece) es mas bien como un metodo psicológico para distensionar a la hora de responder. Debo admitir que cuando leí el título, pensé en un método en el area de las probabilidades, algo certero y eficaz.

    Publica una respuesta
  6. Un ejemplo similar me dieron en la universidad cuando estudiaba investigación comercial.

    Era un ejemplo de una encuesta de una empresa de dentríficos, el hecho es que la mayoría de las personas si le preguntas cuantas veces se cepillaban los dientes al día casi todos respondían que al menos 3 veces al días. Hasta que un día utilizaron ese método y plas bingo.

    Hace poco quería demostrarle a un amigo el ejemplo y no sabía como explicarlo porque prácticamente había olvidado en que consistía, gracias por recordármelo.

    Publica una respuesta
  7. Una buena opción es incluir otras preguntas de control. Para ello la encuesta debe ser bastante larga.
    En el ejemplo que propones sobre los documentales la pregunta 1 sería la que sugieres. La pregunta 25 podría ser ¿le gustan los documentales?,… la pregunta 50 ¿con qué frecuencia ve La 2?
    Comparando las tres preguntas se podrían descartar algunas de las encuestas.

    Publica una respuesta
  8. Una expresión sencilla para el cálculo del porcentaje sería:
    P_{si} = 2N_{si}/N
    donde:
    P_{si} seria el porcentaje estimado de “SI”
    N_{si} seria el número de resultados de la encuesta como “SI”
    N seria el número total de encuestados.

    Según el ejemplo del problema: P_{si} = 2 (15000 - 14144) / 15000 = 11,41\%

    El problema es que, tal y como comenta Martxelo, sigue habiendo gente que miente mas que habla, aún dándoles una escapatoria.

    Como dice Antonio, las preguntas de control son una buena herramienta. De hecho, yo me he encontrado test en los que existen preguntas de control que son exactamente iguales a preguntas anteriores. Una buena medida es hacer las preguntas de forma positiva y de forma negativa en preguntas posteriores. Podemos preguntar “¿ve documentales 2 o más veces por semana?” y tras una batería de preguntas, podemos preguntar “¿ve documentales menos de 2 veces por semana?”. Lo malo es que hay gente que es capaz de recordar perfectamente todo lo que ha contestado en preguntas anteriores y mantener la coherencia en “sus mentiras”.

    De todas formas, yo creo que uno de los principales problemas de las encuestas son las propias preguntas y los encuestadores. Estas suelen inducir casi siempre a una respuesta con más fuerza que a la contraria.

    Ejemplo:
    – ¿Cree usted que los grandes esfuerzos realizados por el gobierno ayudarán a salir de la crisis?
    – ¿Cree usted que los recortes practicados a sus derechos, lejos de ayudar, alargarán la crisis?

    Y no voy a terminar sin comentar un anuncio televisivo que recuerdo, el cual decía: “la mayoría las prefiere a la parilla”, referido a dos cadenas de hamburgueserías. Y debajo en chiquitito ponía: \scriptscriptstyle Encuesta \ realizada \ a \ 57 \ personas
    57 personas! ¿Yo creo que iban empatados 28 a 28 cuando el siguiente dijo a la parilla y pensaron: “vamos a dejarlos aquí!!” 😉

    Publica una respuesta
  9. Debemos de dar por sentado que la mayoría de los “resultados” de encuestas que aparecen en anuncios publicitarios, o están sesgadas o ni siquiera se han realizado.
    Nadie publicaría una encuesta con fines publicitarios si le es desfavorable.
    El asunto del epígrafe se refiere a la manera de mejorar la fiabilidad de resultados cuando el promotor de la encuesta SÍ QUIERE OBTENER UNA APROXIMACIÓN A LA LA REALIDAD.

    Publica una respuesta
  10. No me ha quedado del todo claro si esto es un método para tratar los resultados después de la encuesta -como indica el título del post- o un procedimiento a realizar durante la encuesta para rebajar la tensión sobre el encuestado -como insinuais varios en los comentarios.
    En el primer caso se obvia cuál es la probabilidad de mentir, que dependerá de cada pregunta, claro. O se deducirá de otros procedimientos auxiliares como las preguntas de control que comentaba cartesiano. Si no, al final la subjetividad del que analiza la encuesta puede marcar los resultados.

    Publica una respuesta
  11. Francesc, solo sirve para que las personas sean más honestas, para nada más.

    Publica una respuesta

Trackbacks/Pingbacks

  1. Una interesante manera de obtener buenas estimaciones de los resultados de una encuesta - [...] Una interesante manera de obtener buenas estimaciones de los resultados de una encuesta [...]
  2. Bitacoras.com - Información Bitacoras.com... Valora en Bitacoras.com: Estoy seguro de que a la mayoría de vosotros os habrán hecho alguna vez…
  3. (Lo que yo considero) Lo mejor de 2013 en Gaussianos | Matemáticas Secundaria - […] dijo que la cuadratura del círculo era imposible? Una interesante manera de obtener buenas estimaciones de los resultados de…

Puedes utilizar código LaTeX para insertar fórmulas en los comentarios. Sólo tienes que escribir
[latex]código-latex-que-quieras-insertar[/latex]
o
$latex código-latex-que-quieras-insertar$.

Si tienes alguna duda sobre cómo escribir algún símbolo puede ayudarte la Wikipedia.

Y si los símbolos < y > te dan problemas al escribir en LaTeX te recomiendo que uses los códigos html & lt; y & gt; (sin los espacios) respectivamente.

Envía un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *