Unidad didáctica 5: Tamaño de muestra

INTRODUCCIÓN

Al hablar de muestra es requisito indispensable señalar primero que es el universo o población, y este se refiere al total de individuos que se desea estudiar o caracterizar, cabe mencionar que se puede pensar en todo tipo de universos, más generales y más concretos, por tanto, la muestra es el conjunto de individuos del universo que se seleccionó para estudiarlos, de acuerdo a ciertas cualidades o requisitos que deben contener.

Diagrama 1. Datos muestra.

COMPETENCIA

  • Efectúas un retorno reflexivo para considerar la importancia del tamaño de la muestra en el proceso de la investigación.
  • Conoces los tipos de muestras
  • Seleccionas la muestra que posibilite el éxito de tu estudio.

DESARROLLO

5.1 Generalidades

Una muestra es una selección que se realiza a partir del universo, ya que representa a la población total. El tamaño de la muestra es una porción significativa de la población que cumple con las características de la investigación que se pretende realizar, considerando los costos y el tiempo.

Es necesario tomar en cuenta que el definir el tamaño de la muestra antes de comenzar una investigación es un principio estadístico que nos ayuda a evitar el sesgo en la interpretación de los resultados obtenidos. Además, es muy importante para poder realizar una investigación de manera correcta, por lo que hay que considerar los objetivos y las circunstancias en que se desarrolle la investigación.

Por otro lado, una muestra demasiado grande dará lugar a la pérdida de valiosos recursos como tiempo y dinero, mientras que una muestra pequeña puede no proporcionar información confiable. Por lo tanto debes preguntarte “¿Entonces de qué tamaño debe ser una muestra?”. Esto sin duda depende de qué tan exactos necesites que sean los datos obtenidos que deseas, que tan cercanos quieres que sean a los de la población total.

5.2 Tamaño de la muestra

El tamaño de la muestra puede ser:

  • Representativa: Hace referencia a que todos los miembros de un grupo de personas tengan las mismas oportunidades de participar en la investigación.
  • Adecuada: Se refiere a que el tamaño de la muestra debe de ser obtenido mediante un análisis que permite resultados como disminuir el margen de error.

Ejemplo:

Si quieres realizar una investigación dentro de una universidad que ofrece 10 carreras diferentes y cada una tiene 700 alumnos, no querrás hacer 7000 mil encuestas, bastará con determinar el tamaño de la muestra. Sin embargo, debes considerar el margen de error.

Imagen 1. Ejemplo de muestra de alumnos encuestados.

Es mucho mejor tener a las personas adecuadas para contestar la encuesta, que tener una gran cantidad de personas equivocadas que no van a aportar la información que necesitamos.

Una muestra representativa está integrada por personas con intereses similares a nuestro objeto de estudio, no tiene que ver, en este caso, con el tamaño. Lo ideal es poder seleccionar a los encuestados de una población representativa de una manera aleatoria, por ejemplo, seleccionar a cada 5 miembros de una lista de correos de usuarios que sean realmente representativos para nuestra investigación. Una vez que tengas a la muestra adecuada, hay que decidir el tamaño de la muestra que desees estudiar. Cuanto más precisa quieres que sea, más grande debe ser el tamaño.

5.2.1 Margen de error y nivel de confianza

Imagen 2. El nivel de confianza que se necesita para un tamaño de muestra más grande es de 90 a 99%.

El margen de error es el porcentaje de variación aceptable que existe en los resultados de la investigación. Es la manera de aceptar que los datos no son absolutamente exactos o precisos. Generalmente las encuestas se basan en información obtenida de una muestra de la población, es lógico que pueda ocurrir un error de muestreo. Si el 90% de los encuestados respondió que “Sí”, mientras que el 10% no contestó la encuesta, es un margen de error, podríamos decir “bueno”, a tener un 50-50 o 45- 55.

Por lo regular el margen de error puede ser controlado eligiendo una muestra aleatoria y aumentando el tamaño de la muestra, lamentablemente el presupuesto puede llegar a ser un limitante.

Menor margen de error requiere un tamaño de muestra más grande. El incrementar el tamaño de la muestra aumenta el nivel de confianza. ¿Qué nivel de confianza se necesita? Las opciones típicas son 90%, 95%, o 99%.

Cuando hacemos una investigación debemos tener cuidado con las decisiones que tomamos en el camino; Hacer un plan de acción ayuda a resolver en gran medida problemas que puedan surgir y a mantener el rumbo hacia tus objetivos.

En la elaboración de un plan de acción debes determinar el tamaño de la muestra que usarás en la investigación. ¿Cómo calcular el tamaño de la muestra para una encuesta? Es una decisión importante, no lo tomes a la ligera y asegúrate de hacerlo bien, ya que de lo contrario puede influir negativamente en tus resultados.

¿Qué es el tamaño de muestra?

El Tamaño de muestra es el número de representantes que se utilizará para el cálculo de las estimaciones de una población dada. Por ejemplo, si entrevistamos a 100 estudiantes de una universidad para conocer las preferencias en telefonía móvil entre los universitarios, “100 estudiantes” sería el tamaño de la muestra.

5.2.2 Propósito

El propósito del tamaño de muestra principalmente es reducir los gastos y el tiempo, permitiendo a los investigadores estimar la información sobre toda una población sin tener que realizar el estudio a cada uno de los miembros de la población.

Es importante recordar que antes que los estudios o las encuestas se realicen, los estadísticos suelen determinar el tamaño de la muestra (cuántas personas) deberán ser suficientes para obtener resultados concluyentes. Para determinar este dato tan importante existen diferentes fórmulas y generalmente es representado con “n”.

Es importante destacar que entre más grande sea la muestra, más exactos serán los resultados. Siguiendo el ejemplo de la universidad: Si encuestamos a 10 alumnos sobre su preferencia en telefonía móvil es muy probable que los resultados que obtengamos sean incorrectos ya que habría que determinar las condiciones en las que estos estudiantes se encuentran, sin embargo, si encuestamos a 500 alumnos, es más probable que nuestros resultados se encuentren más apegados a la realidad.

Dentro del tamaño de muestra existe lo que se conoce como “error estándar”, dicho error, es la medida de cuan inexacta podría ser una estimación. El error estándar depende, en parte, del tamaño de la muestra debido a que mientras mayor sea el tamaño de muestra, menor será la probabilidad de error. Si se mide al 90 por ciento de los estudiantes de una universidad, nos acercaremos más a conocer la verdad que si se mide al 15 por ciento y se generaliza a partir de allí. Es decir, disminuye la probabilidad de error a la vez que el tamaño de la muestra crece.

Determinar el tamaño de muestra que se va a seleccionar es un paso importante en cualquier estudio de investigación. La pregunta importante que debe ser contestada en todas las encuestas de muestra es: «¿Cuántos participantes deben ser elegidos para una encuesta?» Sin embargo, la respuesta no puede ser dada sin tener en cuenta los objetivos y circunstancias de las investigaciones.

5.2.3 Elección

La elección del tamaño de muestra depende de consideraciones no estadísticas y estadísticas:

  • Las consideraciones no estadísticas pueden incluir la disponibilidad de los recursos, la mano de obra, el presupuesto, la ética y el marco de muestreo.
  • Las consideraciones estadísticas incluirán la precisión deseada de la estimación de la prevalencia.

Al utilizar Question Pro puedes hacer crecer tu tamaño de muestra gracias a que las encuestas en línea son fáciles de manejar, además de económicas ya que te ahorras gastos de distribución y puedes enviarla a miles de personas al mismo tiempo.

Una muestra estadística (o una muestra)  es  un  subconjunto  de elementos de la población estadística.

Diagrama 2. Muestra estadística.

El mejor resultado para un proceso estadístico sería estudiar a toda la población. Pero esto generalmente resulta imposible, ya sea porque supone un coste económico alto o porque requiere demasiado tiempo.

Con los resultados obtenidos mediante la muestra estadística, se puede inferir las propiedades de todos los elementos, mediante la estadística inferencial.
La muestra elegida debe ser representativa de la población. Las muestras tienen un nivel de confianza de la bondad con la que representan a todos los sujetos, generalmente del 95% o superior.

5.3 Tipo de muestreo

Imagen 3. Tipos de muestras.

Las muestras pueden ser elegidas mediante diversas técnicas o procedimientos. Estas técnicas se clasifican según como sean elegidos los individuos. Se dividen en dos grandes grupos:

5.3.1 Muestreo probabilístico o muestreo aleatorio

Proceso de selección de individuos de manera que cada sujeto tiene probabilidad positiva e independiente de ser seleccionado.

Muestreo aleatorio simple:

Todos los individuos tienen la misma probabilidad de ser elegidos,
Las observaciones se realizan con re-emplazamiento, de forma que la población es
igual en todas las extracciones.

Supongamos que queremos elegir una muestra de n individuos de una población de N sujetos. Cada elemento tiene probabilidad n/N de ser elegido en la muestra.

Cuando utilizarlo

El método de muestreo aleatorio simple debe utilizarse cuando los individuos de la población son homogéneos respecto a las características a estudiar (es decir, a priori no sabemos si los resultados van a ser muy diferentes por causa de otras variables).

Es poco recomendado cuando la población es muy grande y heterogénea (los individuos presentan características dispares).

Los individuos pueden ser seleccionados por cualquier proceso probabilístico que otorgue a todos los elementos la misma probabilidad de ser elegidos. Veamos algunos ejemplos:

Imagen 4. Bolas de rifa.

Los individuos de la población se numeran del 1 al N. Extraemos n bolas del bombo y la muestra serán los individuos seleccionados.

La muestra obtenida es una tal que todos los elementos tienen la misma probabilidad de ser seleccionados.

Números aleatorios

Uno de los métodos más comunes de seleccionar una muestra aleatoria es mediante números aleatorios.

Como en el método anterior, numeramos todos los individuos del 1 al N.
Generar un número aleatorio entre 0 y 1, multiplicarlo por N y redondearlo siempre al alza.

El número aleatorio generado indica el elemento que se seleccionará.
Repetimos este proceso hasta que tengamos la muestra aleatoria de n individuos. Durante este proceso, cuando algún elemento se repite, se desestima y se vuelve a
generar otro número aleatorio.

Muestreo aleatorio estratificado

Los individuos se dividen en grupos o estratos. La muestra se elige escogiendo en cada estrato un número representativo de individuos.

El muestreo estratificado es un procedimiento de muestreo en el que el objetivo de la población se separa en segmentos exclusivos, homogéneos (estratos), y luego una muestra aleatoria simple se selecciona de cada segmento (estrato). Las muestras seleccionadas de los diversos estratos se combinan en una una sola muestra. Este procedimiento de muestreo se refiere a veces como ” muestreo de cuota aleatorio”.

Pasos de selección para un muestreo estratificado

Hay ocho pasos principales en la selección de una muestra aleatoria estratificada:

  1. Define la población objetivo.
  2. Identifica la variable o variables de estratificación y determinar el número de estratos a usarse. Las variables de estratificación deben estar relacionados con el propósito de estudio. Si el propósito del estudio es hacer estimaciones de los subgrupos, las variables de estratificación deben estar relacionados con esos subgrupos. La disponibilidad de información auxiliar a menudo determina las variables de estratificación que se utilizan. Puede ser utilizada más de una variable de estratificación. Considera que a medida que el número de variables de estratificación aumenta, incrementa la probabilidad de que algunas de las variables cancelen los efectos de otras variables, no más de cuatro a seis variables de estratificación y no se deben utilizar más de seis estratos de una variable en particular.
  3. Identifica un marco de muestreo existente o desarrolla uno que incluya información sobre la o las variables de estratificación para cada elemento de la población objetivo. Si el marco de la muestra no incluye la información en las variables de estratificación, la estratificación no sería posible.
  4. Evalúa el marco de muestreo para la falta de cobertura, cobertura excesiva, múltiple y la agrupación, y haz los ajustes cuando sea necesario.
  5. Divide el marco de muestreo en estratos, categorías de la estratificación de la o las variables, creando un marco de muestreo para cada estrato. Dentro del estrato las diferencias deben reducirse al mínimo, y las diferencias entre los estratos deben maximizarse. Los estratos no deben estar superpuestos, en conjunto, debe constituir toda la población. Los estratos deben ser independientes y mutuamente exclusivos del subconjunto de la población. Cada elemento de la la población debe estar en un sólo estrato.
  6. Asigna un número único a cada elemento.
  7. Determina el tamaño de la muestra para cada estrato. La distribución numérica de los elementos incluidos en la muestra a través de los diversos estratos determina el tipo de muestreo a implementar. Puede ser un muestreo proporcional estratificado o uno de los diversos tipos de muestreo estratificado desproporcionado.
  8. Selecciona al azar el número específico de elementos de cada estrato. Al menos un elemento se debe seleccionar de cada estrato para la representación de la muestra; y por lo menos dos elementos deben ser elegidos de cada estrato para el cálculo del margen de error de las estimaciones calculadas a partir de los datos recogidos.

Hay dos subtipos principales de muestreo estratificado: el proporcional y el muestreo desproporcionado.

En el estratificado proporcional, el número de elementos asignados a diversos estratos es proporcional a la representación de los estratos de la población objetivo. Es decir, el tamaño de la muestra extraída de cada estrato es proporcional con el tamaño relativo de ese estrato de la población objetivo. La fracción de muestreo es aplicada a cada estrato, dando a cada elemento de la población la misma oportunidad para ser seleccionados. La muestra resultante es una muestra autoponderada. Este procedimiento de muestreo se utiliza cuando el propósito de la investigación es estimar los parámetros poblacionales.

Un ejemplo hipotético de asignación proporcional se presenta en la siguiente tabla:

Tabla 1.  Tabla de asignación proporcional.

En este ejemplo, los elementos incluidos en la muestra se asignaron a través de las cuatro zonas de una región de marketing de manera que la proporción de elementos que se tomaron para la muestra de cada zona es idéntica a la proporción de elementos de cada zona de la población total. La fracción de muestreo en cada zona es el mismo 1 de 22 elementos. Cada zona está igualmente representada en la muestra.

Muchas veces el investigador no sólo desea estimar parámetros poblacionales sino también hacer análisis detallado dentro de un estrato relativamente pequeño y/o comparar los estratos entre sí. El muestreo estratificado proporcional puede no dar resultados en algunos de los estratos de este tipo de análisis. Tomando el ejemplo descrito en nuestra tabla, no sería posible realizar un análisis detallado de los elementos de la zona 2 ya que sólo 12 de los elementos se encuentran en la muestra. Además, la comparación de los elementos de la zona 2 con las otras zonas sería dudoso. El muestreo estratificado proporcional no es una buena elección de muestreo para llevar a cabo este tipo de análisis. El desproporcional puede ser una mejor elección.

Muestreo aleatorio desproporcionado

El muestreo desproporcionado es un procedimiento en que el número de elementos incluidos en la muestra de cada estrato no es proporcional a su representación en la población total. Los elementos de la población no tienen la misma oportunidad de ser incluidos en la muestra. La misma fracción de muestreo no se aplica a cada estrato. Por otra parte, los estratos tienen diferentes fracciones de muestreo, y como tal, este procedimiento de muestreo no es una selección equiprobable. Con el fin de estimar los parámetros de población, la composición poblacional debe utilizarse para compensar la desproporción en la muestra. Sin embargo, para algunos proyectos de investigación el muestreo estratificado desproporcionado puede ser más apropiado que el proporcional.

El muestreo desproporcionado puede ser dividido en tres subtipos con base a los propósitos de nuestra asignación, que por ejemplo podrían ser el facilitar el análisis dentro de los estratos o centrarse en la optimización de los costos, de la precisión o la optimización de ambos: precisión y costos.

El objetivo de un estudio puede requerir de un investigador que lleve a cabo el análisis detallado de los estratos de la muestra. Si se utiliza la estratificación proporcional, el tamaño de la muestra de un estrato es muy pequeña; por lo que puede ser difícil de cumplir los objetivos del estudio. La asignación proporcional puede no producir un número suficiente de casos para este tipo de análisis detallado. Una opción es el sobremuestreo de los estratos pequeños o poco frecuentes. Tal sobremuestreo crearía una distribución desproporcionada de los estratos de la muestra cuando se compara a la población. Sin embargo, puede haber un número suficiente de casos para llevar a cabo el análisis de los estratos requerido por los objetivos del estudio.

Utilizando el ejemplo hipotético descrito en la tabla superior, si se desea llevar a cabo un análisis detallado de la zona 2, uno podría sobremuestrear elementos de esa zona; por ejemplo, en lugar de un muestreo de sólo 12 elementos, muestra 130 elementos. Con el fin de llevar a cabo un análisis más significativo, analiza de manera detallada la zona 2, el tamaño de la muestra para ese distrito debe ser mayor a 12 elementos. Los resultados de la distribución de los elementos en la muestra por zona pueden parecerse a la distribución presentada en la tabla siguiente:

Tabla 2.  Tabla de asignación desproporcional.

Debilidades y fortalezas del muestreo estratificado

El muestreo estratificado tiene muchas de las fortalezas y debilidades asociadas con la mayoría de los procedimientos de muestreo de probabilidad cuando se comparan con los procedimientos de muestreo no probabilísticos. En comparación con el muestreo aleatorio simple, las fortalezas del muestreo estratificado incluyen:

Capacidad para estimar no sólo los parámetros de población, sino también para hacer inferencia dentro de cada estrato y las comparaciones entre los estratos. Datos suficientes sobre subgrupos de interés quizá no puedan ser capturados en el muestreo aleatorio simple. Las muestras estratificadas producen pequeños errores de muestreo al azar que los que son obtenidos con una muestra aleatoria simple del mismo tamaño de la muestra. Un muestreo estratificado dará lugar a una muestra que es al menos tan precisa como una muestra aleatoria simple del mismo tamaño de la muestra.

Las muestras estratificadas tienden a ser más representativas de una población debido a que se asegura de que los elementos de cada estrato en la población están representados en la muestra. El muestreo puede ser estratificado para asegurar que la muestra se extiende sobre sub-áreas geográficas y subgrupos de población.

Al usar el muestreo estratificado, se aprovecha el conocimiento que el investigador tiene sobre la población.

La utilización de un muestreo estratificado permite al investigador utilizar diferentes procedimientos de muestreo dentro de los diferentes estratos.

Muestreo aleatorio sistemático

Se utiliza en muestras ordenadas. Consiste en seleccionar al azar un elemento y a partir de él, incrementando un intervalo fijo, seleccionar toda la muestra.

Es aplicable cuando los elementos de la población sobre la que se realiza el muestreo están ordenados. Este procedimiento de muestreo se basa en tomar muestras de una manera directa y ordenada a partir de una regla determinantica, también llamada sistemática. Concretamente, a partir de una sola unidad que se selecciona en primer lugar, el resto de unidades de la muestra vienen determinadas automáticamente al aplicarle a dicha unidad una regla selección sistemática.

La obtención de una muestra sistemática de tamaño n de una población de N elementos se consigue siguiendo el siguiente procedimiento. 1. Conseguir un listado ordenado de los N elementos de la población. 2. Determinar el tamaño muestral n.3. Definir el tamaño del salto sistemático k dado por k = N/n. 4. Elegir un número aleatorio δ entre 1 y k (δ=arrranque aleatorio). Este número permite obtener la primera unidad muestral. 5. A partir de la posición δ, dando un salto de k unidades, obtendremos la segunda unidad de la muestra uδ+k y de esta forma, saltando de k en k unidades, el resto de la muestra estará formada por las unidades uδ+2k, uδ+3k, . .., uδ+(n−1)k. Ejemplo 1 Consideramos una población de 5000 agricultores pertenecientes a una determinada zona y de la que se pretende extraer una muestra sistemática de 10 agricultores. El procedimiento a seguir es el siguiente: Definir el tamaño del salto sistemático k = 5000/10 = 500. 1 2 Selecciona un numero aleatorio r entre 1 y 500, (por ejemplo 96). Seleccionar los restantes elementos de la muestra, 96, 96+500=596, 596+500=1096, 1596, 2096, 2596, 3096, 3596, 4096, 4596.

Muestreo aleatorio por conglomerado

La población está dividida en conglomerados naturales (provincias, ciudades, etc.). Se seleccionan  algunos  conglomerados  y  se  toman  en  representación  de  toda la población.

El muestreo por conglomerados en general aumenta el error, ya que los conglomerados suelen ser más homogéneos que la población. El error aumenta menos si se toma un mayor número de conglomerados, disminuyendo por tanto el número de unidades muestreadas en cada conglomerado. Probabilidad de elección de la unidad última y número de unidades en el muestreo por conglomerados es conveniente, salvo una razón poderosa en contra, que la probabilidad de elección de la unidad última sea la misma siempre, ya que simplifica la forma de los estimadores. Hay dos formas de conseguir esto: a) Elegir a los conglomerados con probabilidad proporcional al tamaño, y muestrear después el mismo nº de unidades en todos. b) Elegir a los conglomerados con igual probabilidad, y muestrear un número en cada conglomerado un número de unidades proporcional al tamaño.

5.3.2 Muestreo probabilístico o muestreo aleatorio

La selección de los individuos se basa en el criterio del investigador. No se conoce la probabilidad de que cada individuo sea elegido en la muestra.

  • Muestreo por cuotas: se basa en seleccionar la muestra después de dividirla población en grupos o estratos. Los sujetos dentro de cada grupo se eligen por métodos no probabilísticos.

Diagrama 3. Muestreo por cuotas.

  • Muestreo por conveniencia: consiste en seleccionar a los individuos que convienen al investigador para la muestra. Esta conveniencia se produce porque al investigador le resulta más fácil examinar a estos sujetos, ya sea por proximidad geográfica, etc.

Diagrama 4. Muestreo por conveniencia.

  • Muestreo por bola de nieve (o muestreo por referidos): se realiza sobre poblaciones en las que no se conoce a sus individuos o es muy difícil acceder a ellos. Se llama muestreo de bola de nieve porque cada sujeto estudiado propone a otros, produciendo un efecto acumulativo parecido a una bola de nieve.

Diagrama 5. Muestreo por bola de nieve.

  • Muestreo causal o accidental: los individuos son elegidos de manera casual, sin ningún juicio previo. Las personas que realizan el estudio eligen un lugar o un medio, y desde ahí realizan el estudio a los individuos de la población que accidentalmente se encuentren a su disposición.

Diagrama 6. Muestreo causal.

  • Muestreo discrecional (o muestreo por juicio): los sujetos se seleccionan a base del conocimiento y juicio del investigador.

CONCLUSIONES

El tamaño de la muestra es de suma importancia se requiere involucrarse verdaderamente en el proceso, realizar una argumentación lógica, autocuestionarse sobre la pertinencia y estar en la posibilidad de valorar si la construcción es acorde a la investigación a realizar, esto es, si el resultado podrá ser generalizado.(solo hacen una medición) o longitudinales (hacen varias mediciones).

BIBLIOGRAFÍA CONSULTADA

  1. COCHRAN, William G. (1980). Técnicas de muestreo. México: CECSA.
  2. MARTÍNEZ BENCARDINO, Ciro (2012). Estadística y Muestreo. Bogotá: Ecoe.