Creative Research Systems The Survey System - Survey Software Your Complete Survey Software Solution
HogarProductosServiciosDescargarOrderingAyuda para peritos Lista de ClientesNosotros

 

 
Calculadora de Muestras
Diseño de Encuestas
Correlación
 

    

 

Significación Estadística.

El término "nivel de significación" suele generar confusiones y no muchos investigadores lo comprenden bien. Este artículo aclara el concepto de significación estadística y el significado de los valores generados por el Survey System.

Este artículo se presenta en dos secciones. La primera sección simplifica al máximo el concepto de significación estadística, de manera que los lectores sin conocimientos técnicos puedan utilizar el concepto para tomar decisiones en función de sus datos. La segunda sección proporciona a los lectores con mayor conocimiento técnico una explicación más detallada sobre el significado exacto de los valores de significación estadística. Cuando se habla de "significativo" en términos generales, se suele implicar que algo es importante, mientras que en estadística el concepto se refiere a algo probablemente cierto (no por azar). Es posible que el hallazgo de una investigación sea cierto sin que sea importante. Cuando los estadísticos dicen que un resultado es "altamente significativo" quieren decir que es muy probable que sea cierto. No (necesariamente) quieren decir que es altamente importante.

Observe el cuadro que aparece más abajo. Los ji cuadrados que aparecen abajo de todo presentan dos filas de números. Los números de la fila superior (0.07 y 24.4) representan, en sí mismos, estadísticas de ji cuadrado. A los fines de este artículo, se puede no tener en cuenta el significado de dichas estadísticas. La segunda fila contiene los valores .795 y .001. Éstos son los niveles de significación y se explican a continuación de la tabla.

¿Compra el combustible de marca X?
Zona Clase de vehículo
TotalCiudadSuburbioAutoCamión Ómnibus Camioneta
Base 713 361 352 247 150 44 180
428
60%
215
60%
213
61%
131
53%
74
49%
29
66%
131
73%
No 285
40%
146
40%
139
40%
116
47%
76
51%
15
34%
49
27%
Ji
cuadrado
0.07
.795
24.4
.001


Los niveles de significación indican la probabilidad de que un resultado se deba al azar. El nivel más frecuente, que se utiliza para indicar que algo es digno de credibilidad, es .95. Esto significa que el hallazgo tiene un 95% de probabilidades de ser cierto. Sin embargo, este valor también se utiliza de manera confusa. Ningún paquete de estadísticas mostrará "95%" o ".95" para indicar este nivel. En su lugar, aparecerá ".05", para indicar que el hallazgo tiene un cinco por ciento (.05) de probabilidades de no ser cierto, que es lo inverso a un 95% de probabilidades de ser cierto. Para obtener el nivel de significación, se debe restar el número que aparece a uno. Por ejemplo, un valor de ".01" significa que existe un 99% (1-.01= .99) de probabilidades de que sea cierto. En este cuadro, es probable que no exista diferencia alguna en la compra de combustible de marca X efectuada por personas del centro y de los suburbios, porque la probabilidad es .795 (es decir, existe sólo un 20.5% de probabilidades de que la diferencia sea cierta). Por otro lado, el alto nivel de significación para las clases de vehículo (.001 o 99.9%) señala que es muy probable que exista una verdadera diferencia en la compra de combustible de marca X efectuada por personas que poseen distintos vehículos en la población sobre la que se realiza la muestra. El Survey System utiliza los niveles de significación con diversas estadísticas. En todos los casos, el valor p indica la probabilidad de que algo no sea cierto. Si una prueba de ji cuadrado muestra una probabilidad de .04, significa que existe un 96% (1-.04=.96) de probabilidades de que las respuestas proporcionadas por los distintos grupos de un cruce sean diferentes. Si una prueba de la T muestra una probabilidad de .07, significa que existe un 93% de probabilidades de que, si se observara la población entera, los dos promedios comparados serían verdaderamente distintos.

Cuando se analizan niveles de significación, se suele pensar que un nivel del 95% es sagrado. Si una prueba revela una probabilidad de .06, significa que tiene un 94% de probabilidades de ser cierta. No se puede tener la misma seguridad si presenta una probabilidad del 95% de ser cierta, pero lo más posible es que lo sea. El nivel del 95% proviene de publicaciones académicas, en donde, por lo general, una teoría debe tener al menos un 95% de probabilidades de ser cierta para que sea lo suficientemente confiable como para comunicarla. En el mundo de los negocios, si algo tiene un 90% de probabilidades de ser cierto (probabilidad = .1), no se puede considerar comprobado, pero es muy probable que sea mejor actuar como si fuera cierto que como si fuera falso.

Si se realizan muchas pruebas, los resultados falsamente significativos representan un problema. Esto se debe a que un 95% de probabilidades de que algo sea cierto significa que existe un 5% de probabilidades de que sea falso. Es decir: de cada 100 pruebas que presentan resultados significativos al nivel del 95%, las probabilidades son que cinco arrojen resultados falsamente significativos. Si se tomara un conjunto aleatorio de datos sin sentido y se efectuaran 100 pruebas de significación, las probabilidades serían que cinco de ellas arrojaran resultados falsamente negativos. Como se puede observar, cuantas más pruebas se efectúan, mayor problema implican los positivos falsos. No hay manera de saber cuáles son los resultados falsos: simplemente se sabe que están presentes. Una manera de atenuar el problema consiste en restringir la cantidad de pruebas a un grupo pequeño escogido antes de recopilar los datos Si esto no resulta práctico, existen otras maneras de resolver este problema. El mejor método desde un punto de vista estadístico consiste en repetir el estudio y observar si se obtienen los mismos resultados. Si algo resulta estadísticamente significativo en dos estudios distintos, es probable que sea cierto. En la vida real, no suele resultar práctico repetir un estudio, pero se puede recurrir a la técnica de "mitades partidas", que implica dividir la muestra aleatoriamente en dos mitades y efectuar las pruebas en cada una. Si algo resulta significativo en ambas mitades, es probable que sea cierto. El problema esencial de esta técnica es que cuando se parte el tamaño de una muestra, la diferencia tiene que ser más grande para ser estadísticamente significativa.

El último error frecuente también es importante. La mayoría de las pruebas de significación presuponen que se dispone de una muestra completamente aleatoria. Si la muestra no lo es, una prueba de significación puede exagerar la precisión de los resultados, porque sólo tiene en cuenta el error aleatorio. La prueba no puede tener en cuenta márgenes de error que provengan de errores no aleatorios (por ejemplo, una muestra mal seleccionada).

En resumen:
  • En cuestiones de estadística, "significativo" no necesariamente significa importante.
  • Los valores de probabilidad se deben leer de manera inversa (1 - p).
  • Demasiadas pruebas de significación pueden dar lugar a relaciones falsamente significativas.
  • Para que no exista margen de error, se deberá verificar el procedimiento de selección de muestras.

    Sección dos: el significado exacto de los valores de significación estadística

    En la explicación anterior, se recomienda leer los valores de probabilidades de manera inversa (1 - p). Por lo general, esto llevará a tomar una decisión correcta; pero, desde el punto de vista técnico, es una simplificación excesiva. A continuación, se presenta una explicación más compleja y más correcta desde el campo técnico.
    Desafortunadamente, los valores de significación estadística no revelan directamente lo que se desea saber. Indican las probabilidades de obtener diferencias entre los grupos de nuestra muestra, que son tan o más grandes que los que observamos, si no existieran diferencias entre los grupos correspondientes en la población representada por nuestra muestra. En otras palabras, estos valores nos indican las probabilidades de nuestros datos, bajo la presunción de que no existen diferencias en la población. Lo que se desea saber son las probabilidades de que existan diferencias en la población, de acuerdo con nuestros datos.

    Lógicamente, si existen suficientes probabilidades como para no encontrar una diferencia en nuestra muestra, en caso de que no hubiera diferencia en la población, entonces es probable que exista una diferencia en la población. Se utilizó esta lógica en la primera sección de este artículo cuando se señaló que se pueden interpretar los valores de significación al considerar 1-p como la probabilidad de que exista una diferencia en la población (donde p es el número de significación generado por el programa). Por ejemplo, si el nivel de significación es .05, entonces se puede considerar que es posible una diferencia en la población del 95% (1-.05).

    Si bien esta lógica resulta obvia para el sentido común, las matemáticas detrás de esta significación estadística no garantizan que 1-p arroje la probabilidad exacta de que exista una diferencia en la población. De todos modos, muchos investigadores toman 1-p como esa probabilidad por dos motivos. Por un lado, porque no se ha inventado una medida mejor para fines generales. Por otro lado, porque al utilizar este cálculo se obtendrá, por lo general, una interpretación útil de los valores de significación estadística.

    En algunos campos de investigación que no implican encuestas, la posibilidad de que 1-p no sea la probabilidad exacta de que exista una diferencia en la población puede ser más importante. En estos campos, el uso de los valores de significación estadística puede resultar controversial.

      Volver Arriba

    Hogar | Productos | Servicios | Descargar | Pedidos | Ayuda para Peritos | Lista de Clientes | Nosotros

     Copyright © 2006  Creative Research Systems
    (707) 765-1001  info@surveysystem.com