Clase digital 4. Muestreo

Person Pointing Paper Line Graph

Muestreo

Introducción

¡Hola!

Qué gusto poder encontrarte en esta nueva sesión, espero que sigas descubriendo este curso de Bioestadística y lo encuentres fascinante.

En esta ocasión hablaremos de uno de los aspectos más importantes en la metodología de la investigación, es el cálculo de la cantidad de participantes que deben incluirse en un estudio. El tamaño de muestra permite a los investigadores saber cuántos individuos son necesarios estudiar, para poder estimar un parámetro determinado con el grado de confianza deseado, o el número necesario para poder detectar una determinada diferencia entre los grupos de estudio, suponiendo que existiese realmente. El cálculo del tamaño de la muestra es una función matemática que expresa la relación entre las variables, cantidad de participantes y poder estadístico.

La muestra de un estudio debe ser representativa de la población de interés. El objetivo principal de seleccionarla es hacer inferencias estadísticas acerca de la población de la que proviene. La selección debe ser probabilística.

Los factores estadísticos que determinan el tamaño de la muestra son: hipótesis, error alfa, error beta, poder estadístico, variabilidad, pérdidas en el estudio y el tamaño del efecto. Se revisan las fórmulas utilizadas para el cálculo del tamaño de la muestra en las situaciones más frecuentes en investigación, así como la revisión de fórmulas para un cálculo más rápido. Se incluyen ejemplos de investigación en educación médica. También se revisan aspectos importantes como: tamaño de la muestra para estudios piloto, estrategias para disminuir el número necesario de sujetos, y software para el cálculo del tamaño de muestra.

Este tema es de mucha importancia para el desarrollo de estudios cuantitativos, así que prepárate porque comenzaremos con el cálculo del tamaño de muestra.

¡Sin más que agregar, comencemos!

Desarrollo del tema

Una vez que se ha definido cuál será nuestra unidad de análisis, se procede a delimitar la población que va a ser estudiada y sobre la cual se pretende generalizar los resultados. 

Una población es el conjunto de todos los casos que concuerdan con una serie de especificaciones (Selltiz, 1974).

Un aspecto relevante en la metodología de la investigación es la estimación o cálculo de la cantidad de participantes que deben incluirse en un estudio. La primera reflexión que surge es ¿para qué sirve el cálculo del tamaño de la muestra? Permite a los investigadores saber cuántos individuos son necesarios estudiar, para estimar un parámetro determinado con el grado de confianza deseado o el número necesario para detectar una determinada diferencia entre los grupos de estudio, suponiendo que existiese realmente.

La inclusión de un número excesivo de sujetos encarece el estudio en varios aspectos. Un estudio con un tamaño insuficiente de la muestra estimará un parámetro con poca precisión o será incapaz de detectar diferencias entre los grupos, conduciendo a conclusiones erróneas (García-García et al., 2013)

La muestra suele ser definida como un subgrupo de la población (Sudman, 1976). Para seleccionar la muestra deben delimitarse las características de la población, Las poblaciones deben situarse claramente en torno a sus características de contenido, lugar y en el tiempo.

Población (cantidad representada en las fórmulas como N), es el conjunto total de elementos del que se puede seleccionar la muestra y está conformado por elementos denominados unidades de muestreo o unidades muestrales, con cierta ubicación en espacio y tiempo. Las unidades de muestreo pueden ser individuos, familias, universidades, grupos de alumnos, profesores, etc. Una muestra (cantidad representada en las fórmulas como n), no es más que un subconjunto de la población que se obtiene por un proceso o estrategia de muestreo.

El objetivo fundamental para seleccionar una muestra es hacer inferencias estadísticas (estimaciones de uno o más parámetros acerca de una población de interés). Esta población es la que se desea investigar y se le denomina población de interés, blanco, objeto o diana. Para que la extrapolación (inferencia estadística) tenga validez, la muestra debe ser representativa, y alude a que el estimador muestral de las variables de interés debe tener una distribución similar a las de la población de dónde proviene. Para cumplir este supuesto de representatividad es deseable que la muestra sea probabilística.

Figura 1. Interrelación entre población y muestra. Modificado de López-Alvarenga J.C., et al.

Abraham Flexner, en su trascendental documento, incluyó al 100% de la población diana que fueron todas las escuelas de medicina de Estados Unidos de Norteamérica y Canadá. La muestra fue igual en número a la población, un hecho muy difícil de emular.

Un aspecto diferente de muestreo es el caso de los estudios para determinar la eficacia y seguridad de algún medicamento, comparado con los tratamientos estándares o contra placebo. En ellos, el interés reside en contrastar hipótesis sobre una intervención (tratamiento o maniobra) que interesa al investigador. En este caso, el muestreo suele ser a conveniencia.

Este artículo se enfoca en el diseño y la determinación del tamaño de la muestra para obtener representatividad o validez externa en las conclusiones.

Muestras y proceso de aleatorización en los estudios

Una vez que los sujetos de estudio son seleccionados, se hace una aleatorización para asignar la intervención que recibirá cada uno. En este caso es adecuado que la aleatorización se haga por bloques. Si el investigador conoce de antemano la existencia de factores que modifican la variable dependiente, es recomendable hacer estratos para controlar a la variable confusora, que es una variable predictora del cambio en la variable dependiente, externa a la relación principal que se analiza, pero simultáneamente relacionada con la variable independiente. Cada estrato se aleatoriza en forma independiente para lograr grupos balanceados en la intervención o tratamiento.

Recientemente se publicó un ensayo controlado y aleatorizado en investigación en educación médica, en donde la intervención o tratamiento fue un curso sobre medicina basada en evidencia de seis meses de duración, la muestra incluyó a los alumnos del quinto año de la licenciatura en medicina, los cuales fueron aleatorizados en dos grupos balanceados; es decir, con el mismo número de participantes. Como variables dependientes se midieron las actitudes, conocimientos y habilidades autoreportadas, en ambos grupos.

Factores para la determinación del tamaño de la muestra

a) El acceso a los recursos económicos y de infraestructura o la disponibilidad de participantes.
b) Los siguientes son los factores de orden estadístico tales como:

  1. Hipótesis. H0 (Hipótesis nula), H1(Hipótesis alterna 1)
  2. Error tipo I o error α.
  3. Error tipo II o error β.
  4. Poder estadístico.
  5. Variabilidad.
  6. Pérdidas en el seguimiento del estudio.
  7. Relevancia del tamaño del efecto y significancia estadística.
Imagen 1. Una variable confusora es un factor distinto al de la exposición, que se asocia de forma independiente tanto con la variable exposición como con la variable desenlace, un ejemplo es el tabaquismo, que se encuentra asociada tanto al consumo de café como al cáncer pulmonar.
1. Hipótesis

De acuerdo con el tipo de estudio de investigación, puede ser necesario formular una o más hipótesis. Si se trata de un estudio tipo descriptivo, ésta no es necesaria.

En los estudios de tipo comparativo es necesario establecer la hipótesis en relación con qué grupo es mejor (de una vía) o asumir que alguno será mejor sin otorgar direccionalidad por alguno de los grupos (a dos vías). El investigador desea probar la hipótesis alternativa, que significa rechazar la hipótesis nula.

  • El valor α (error tipo I) es la probabilidad de que se rechace H0 (se acepte H1) cuando H0 es cierta. 
  • El valor β es la probabilidad de que se acepte H0 cuando es falsa (H1 es cierta)

El tipo de contraste de hipótesis puede ser unilateral (una cola) o bilateral (dos colas). Una hipótesis unilateral especifica la dirección de la asociación (mayor o menor) de las variables; en la bilateral se puede afirmar la asociación entre las variables, pero no especifica la dirección. En el contraste bilateral el tamaño de muestra es más grande, estos contrastes también poseen mayor robustez y se prefieren a los de una cola. 

2. Error tipo I o error α

En un contraste de hipótesis, al valor α (error tipo I) se le conoce como la probabilidad de que se rechace H0 (se acepte H1) cuando H0 es cierta. Es decir, P(aceptar H1 | H0 es cierta) = α. Al valor (1 – α)*100 se le conoce como el nivel de confianza de la prueba. El valor de α varía dependiendo del nivel de confianza que se quiera de la prueba; el criterio más usado en la literatura biomédica es aceptar un riesgo de α < 0.05.

3. Error tipo II o error β

A la probabilidad de que se acepte H0 cuando ésta es falsa (H1 es cierta), se le conoce como error tipo II o error β, es decir: P(aceptar H0 | H1 es cierta) = β. El valor de β tolerable de mayor aceptación en la comunidad científica va de 0.1 a 0.2.4

4. Poder estadístico

Es la probabilidad de que un estudio de un determinado tamaño detecte como estadísticamente significativa una diferencia que realmente existe.

Se define como 1 – β. Es decir, P(aceptar H1 | H1 es cierta) = 1 -β

Su valor depende del error tipo II que se acepte. Si β = 0.2, se tendrá una potencia de 1 – β = 0.8. En términos porcentuales se dice que la prueba tiene una potencia del 80%, que es el mínimo aceptado en la literatura biomédica.

Cuántos menores sean los riesgos calculados para los errores alfa y beta, mayor será el tamaño muestral requerido. Cuánto menor sea la variabilidad, menor será la muestra estimada. A menor diferencia que se desea detectar, mayor será el número de participantes.

5. Variabilidad

Es la dispersión esperada de los datos. Se evalúa dependiendo de la variable de interés. Si éstas son numéricas continuas (grupo de valores infinitos que incluyen decimales), el tamaño de muestra estará determinado por la variable con el mayor coeficiente de variación (CV) [CV (Ȳ) = (SY/Ȳ)], donde SY es la desviación estándar y Ȳ es la media. Por otra parte, cuando las variables de interés son categóricas, por convención se recomienda utilizar la estimación de la proporción que más se acerque a 0.5, ya que proporciona el mayor número muestral. Para determinar la variabilidad se debe recurrir a la literatura publicada de la variable de interés, cuando el dato no está disponible se usarán datos de pruebas piloto y en última instancia a estimaciones hechas por expertos.

6. Pérdidas en el seguimiento del estudio

Durante la realización del estudio, puede haber pérdidas de participantes por diversas razones. El tamaño mínimo de muestra necesario para obtener resultados estadísticamente significativos está pensado, de acuerdo con el número de sujetos al final del estudio y no con el inicial. Es recomendable adicionar al cálculo inicial, un 10% a 20% de participantes. Una forma sencilla de estimar el cálculo es: n(1/1-R), donde n representa el número de participantes sin pérdidas, y R es la proporción de pérdidas esperadas.

7. Relevancia del tamaño del efecto y significancia estadística

La magnitud de la diferencia del efecto que se desea detectar entre los grupos evaluados es la condicionante más importante para el cálculo del tamaño de la muestra. Con frecuencia, la obtención de una diferencia estadísticamente significativa (diferencia en los resultados al contrastar dos o más valores o grupos con una prueba estadística, generalmente se fija un punto de corte para decir que si hay diferencias entre los valores. Por convención, lo más frecuente es aceptar la propuesta de Karl Pearson, que hay diferencias significativas cuando el valor de p es ≤0.05) no resulta relevante para el área en que se está investigación, práctica clínica, educación médica, etc. El investigador debe determinar si la magnitud de esa diferencia es relevante para el área de interés, independientemente de que haya sido estadísticamente significativa. Se espera que cualquier diferencia de relevancia también sea estadísticamente significativa.

Si en un estudio se han considerado los factores arriba descritos, pero no se ha anticipado que el resultado sea relevante en educación médica, pierde utilidad. Para ejemplificar: se realizó un estudio cuyo objetivo fue medir el conocimiento en medicina familiar de dos muestras de estudiantes que tomaron clases con profesores distintos, y el instrumento de medición del nivel de conocimiento fue un examen de opción múltiple de 100 ítems. Al momento de analizar estadísticamente los datos, se encontraron diferencias entre ambos grupos (p<0.05), pero en el análisis se identificó que las diferencias fueron solamente del valor de dos respuestas, por lo anterior, se puede afirmar que hay diferencias estadísticamente significativas, pero carece de relevancia para la toma de decisiones educativas.

Al calcular el tamaño de la muestra se utilizan fórmulas matemáticas que consideran en forma simultánea varios de los siete factores estadísticos antes descritos, para la mayoría de ellos ya existen valores aceptados por convención o incluso asignados de manera arbitraria; al momento de sustituir valores en tales fórmulas nos encontramos que los rubros de variabilidad y tamaño del efecto requieren revisión bibliográfica, estudios piloto o la opinión de expertos para asignar un valor apropiado.

Imagen 2. La probabilidad es cuando un estudio de un determinado tamaño detecta como estadísticamente significativa una diferencia que realmente existe.

Tamaños de muestra de acuerdo con distintos diseños de muestreo

Para la determinación del tamaño de muestra, también hay que considerar el tipo de diseño empleado en la investigación. Existen diseños de tamaño fijo (los más usados en estudios clínicos, epidemiológicos y en investigación educativa) y de tamaño variable. En los de tamaño fijo, el tamaño de muestra se fija desde el inicio de la investigación; en los estudios de tamaño variable, el número de sujetos se irá incrementando hasta obtener un tamaño predeterminado (diseño secuencial) o el diseño experimental que involucra un solo caso. En el resto del documento sólo se hace referencia a los diseños de tamaño fijo.

La mayoría de las fórmulas utilizadas para el cálculo del tamaño de muestra, parten del supuesto de una distribución normal de los valores de las variables en cuestión; sin embargo, existen herramientas estadísticas para analizar los datos cuando ese supuesto no se cumple.

1. Cálculo del tamaño de muestra de una media

2. Cálculo para determinar el tamaño de muestra de una proporción

3. Cálculo para el tamaño de muestra de la diferencia de dos medias independientes

4. Cálculo para el tamaño de muestra de la comparación de dos medias repetidas (pareadas) en un solo grupo

5. Cálculo para el tamaño de muestra de la comparación de dos medias repetidas en dos grupos distintos de participantes

6. Cálculo para estimar el tamaño de muestra de la diferencia de dos proporciones

7. Cálculo para el tamaño de muestra de la comparación de dos proporciones independientes

Cuando se tiene una tabla de contingencia de 2 x 2 y las condiciones se cumplen para aplicar una prueba ji cuadrada, se puede utilizar esta aproximación para el cálculo del tamaño de la muestra de la comparación de proporciones independientes. La fórmula que Marragat y colaboradores proponen es:

Puedes realizar algunos ejercicios en la siguiente página interactiva: Ejercicios de cálculo de tamaño de muestra.

Conclusión

Para concluir, un aspecto importante del desarrollo metodológico en los estudios de investigación cuantitativa es la determinación del número de sujetos que deben ser reclutados para acceder debidamente a resultados significativos y confiables desde el punto de vista estadístico.

El cálculo del tamaño de muestra no es un tema que se deba tomar a la ligera, un mal cálculo de tamaño de muestra puede generar errores de tipo I o de tipo II estadísticos y en cualquier caso nos lleva a deducciones erróneas, a inferencias falsas y por tanto a ciencia barata.

Uno de los aspectos importantes a considerar al momento de determinar el tamaño muestral es el diseño metodológico y las consideraciones de análisis estadístico; de la misma manera, la operacionalización de las variables, ya que con base a ellas será la formula a aplicar. No es indispensable aprenderse las fórmulas de memoria, es mucho más importante saber las condiciones adecuadas para su uso práctico, considerando todo lo que se ha mencionado previamente.

Estaremos haciendo ejercicios constantes y en diferentes condiciones para que puedas conocer la utilidad de cada una de las fórmulas para el cálculo del tamaño de muestra.

Te felicito por llegar hasta aquí con ese ímpetu tan incontrolable por saber cada día un poco más, continúa así y no dejes que ese ánimo decaiga. Realiza las actividades correspondientes. Te encuentro próximamente.

Fuentes de información