Clase digital 7. Selección de la muestra

Portada » Clase digital 7. Selección de la muestra

Selección de la muestra 

Introducción

Estimado estudiante, te saludo de forma afectuosa y te doy la más cordial bienvenida a esta sesión que lleva por nombre Selección de la muestra. A lo largo de seis sesiones hemos emprendido el estudio y análisis de un proyecto de investigación cuantitativo donde has descubierto sesión tras sesión los elementos que deben contener un proceso de investigación. Ahora nos centramos en el tema de la selección de la muestra, y quizá lo primero que debes entender es que la muestra es un elemento fundamental del estudio que te permitirá lograr el alcance esperado por la investigación a través del planteamiento del problema que ya realizaste y, en consecuencia, responder de forma adecuada a las preguntas de investigación que has elaborado. 

Conforme te adentres a esta sesión podrás descubrir y comprender conceptos como el universo, la población y la muestra, y cómo es que se relacionan entre sí.  Al final de la sesión podrás ser capaz de delimitar la población de tu proyecto de investigación y, además de esto seleccionar adecuadamente tu muestra y, si así lo requieres, realizar la segmentación correcta. Te deseo el mejor de los éxitos en este capítulo.

Desarrollo del tema

Para realizar la recolección de datos que se habrán de analizar y posteriormente servir como insumo principal para demostrar que se han alcanzado los objetivos de nuestro proceso de investigación es importante identificar la muestra o, dicho de otra forma, los participantes, objetos, sucesos o colectividades que se formarán parte del estudio. Pensemos en la siguiente situación, imagina que pretendes estudiar las causas de reprobación en la materia de Matemáticas, tu muestra debería ser el conjunto de estudiantes que conforman al grupo de estudio que puede bien puede ser tu grupo actual y mediante un cuestionario o entrevista abordar las causas de la reprobación de manera objetiva, clara y puntual. Siguiendo con el caso de estudio anterior, si en el diseño de tu investigación has considerado tener un grupo control, entonces cuentas con dos opciones, la primera es dividir a tu muestra (en este caso tú grupo de clases) de forma equitativa y bien estructurada para que una parte sea el grupo de control y la otra el grupo de experimento si es que has abordado implementar alguna estrategia para resolver tus preguntas de investigación sobre las causas de reprobación. La segunda opción que cuentas es la de utilizar como grupo control otro grupo que tenga clases con el mismo profesor en horarios similares. Recuerda aquí tener muy claro las variables que conforman tu estudio. 

Imagen 1: La recolección de datos que se habrán de analizar y posteriormente servir como insumo principal para demostrar que se han alcanzado los objetivos de nuestro proceso de investigación.

Menciona Sampieri (Hernández Sampieri, R. (2014), Metodología de la Investigación 6a edición. Mc Graw Hill) “Para seleccionar una muestra, lo primero que se debe hacer es definir la unidad de muestreo/análisis (individuos, organizaciones, comunidades, situaciones, piezas producidas, eventos, entre otros), y a partir de ahí delimitar la población”. Podríamos entonces definir a la muestra de nuestro proceso de investigación como una pequeña parte de una población sobre la cual será posible recolectar datos. Siguiendo con el ejemplo descrito en esta sesión, la población serían los estudiantes de la Escuela del Nivel Medio Superior (ENMS) de la Universidad de Guanajuato que cursan el cuarto semestre del turno matutino y que llevan o han llevado la Unidad de Aprendizaje de Matemáticas con un profesor en particular. Como puedes observar hemos reducido y delimitado la población hacia aquella que consideramos tendrá mayor impacto para resolver las preguntas de investigación. Pongámoslo en términos de un diagrama de Venn como se muestra en la figura 1.

Figura 1. Universo Población y muestra del problema de investigación “Análisis de las causas de reprobación en la materia de matemáticas en la Escuela de Nivel Medio Superior de “…”. Elaboración propia.

Define Sampieri (Hernández Sampieri, R. (2014), Metodología de la Investigación 6a edición. Mc Graw Hill) “Una población es el conjunto de todos los casos que concuerdan con una serie de especificaciones”. Bajo esta definición la muestra entonces representa un subgrupo de la población y es importante que conozcas que existen dos tipos de muestras que son: 

Muestras probabilísticas

Muestras no probabilísticas

Una muestra probabilística considera que sin importar cual sea la característica de los elementos que la conforman, cualquiera de ellos puede ser escogido de forma aleatoria. Retomando el ejemplo de la sesión, imagina que la muestra son los estudiantes del grupo cuarto A (4-A) de la ENMS “…” podrías seleccionar cualquier elemento (estudiante) de la muestra sin importar si aprobó o no aprobó la materia de matemáticas. En este sentido, será importante entonces agregar a tu investigación el porcentaje de estudiantes de tu muestra que no acreditó la materia, o en su defecto delimitar más la muestra bajo estudio. 

Como se menciona en el libro Metodología de la Investigación del autor Sampieri (Sampiere, 2014), “para hacer una muestra probabilística se necesita: 

  1. Calcular un tamaño de la muestra que sea representativo de la población
  2. Seleccionar los elementos muestrales (casos) de manera que al inicio todos tengan la misma posibilidad de ser elegidos.”

Para el cálculo de la muestra el primer paso consiste en tener un conocimiento de la población y, si es posible, del universo. Como segundo paso debemos definir el error en nuestras mediciones que estará vinculado al grado de confianza del estudio. En este sentido, si consideramos un error de nuestras hipótesis en un total de 100 elementos de la muestra, se tiene el 1% de error y por tanto el 99 % de certeza o confianza. Si ahora consideramos la posibilidad de tener 5 datos erróneos nuestro nivel de confianza bajará al 95%. El grado de confianza se da a elección del investigador y está vinculado en todo momento con sus hipótesis y con el planteamiento del problema de investigación. Por otro lado, si consideramos una muestra aleatoria y queremos potenciar una característica o propiedad en particular, generalmente se recurre a la selección de una muestra probabilística estratificada que no es otra cosa más sino el hecho de dividir la muestra en segmentos que nos permita homogeneizar y por ende efectuar comparativas entre los diferentes segmentos. Pensemos en el ejemplo de la sesión en donde la muestra es un grupo de estudiantes que tiene ciertas características como estar en un semestre determinado (cuarto semestre) y haber llevado la materia de matemáticas con un cierto profesor, si consideramos una muestra estratificada podríamos subdividir nuestra muestra en estudiantes mujeres y hombres, o en estudiantes por edad, o por número de unidades de aprendizaje no acreditadas además de la de matemáticas, entre muchos otros elementos.

Para poder seleccionar adecuadamente el extracto de muestra es necesario considerar un factor de ajuste. Por ejemplo, analicemos una población de 1,176 directores de recursos humanos con un tamaño de muestra de 298 personas. Si tomamos la razón entre estos obtenemos el factor de ajuste en 0.2534 (valor que resulta de dividir 298 personas entre 1176 directores de recursos humanos). Con este factor es posible multiplicar al grupo de elementos de la población que pertenecen al segmento que se desea analizar y, de esta manera obtener el tamaño de muestra adecuado. Retomemos el ejemplo de la sesión para este punto, supóngase que se tiene una población de 100 estudiantes matriculados en los grupos de cuarto semestre de una ENMS en particular y que de estos 100 estudiantes solamente 40 tomaron la unidad de aprendizaje con un profesor en específico. En este caso nuestro factor de ajuste para la muestra es de 0.4 (valor que resulta de dividir 40 entre 100) y por tanto, si existen 54 de esos estudiantes que acreditaron la materia de matemáticas y 46 que no, los segmentos de muestras serian 21 y 18 (estos valores se obtienen de multiplicar el factor de ajuste por el total de elementos de la población), respectivamente. Existen diferentes formas de seleccionar una muestra pudiendo ser por tómbola, números aleatorios, elementos y marcos muestrales siendo este último el que nos permiten una selección de tipo referenciada al agrupar los datos en intervalos definidos. Para definir el tamaño adecuado de la muestra no siempre es sencillo y existen diferentes formas de hacerlo. Para poder analizar este problema dependemos del universo y de la significancia que tenga la muestra que escogemos. Por ejemplo si pensamos en los modismos del lenguaje que existen en México (con una población promedio de 120 millones de habitantes) cuál debería ser un tamaño adecuado, obviamente si tomamos un elemento (una persona) no podremos establecer ningún tipo de resultado que tenga un valor para nuestra investigación, por el contrario considerar 120 millones de elementos es un poco viable para elegir. Digamos entonces que, si segmentamos la población en regiones sería adecuado un 20 por ciento de acuerdo con el teorema central de límite para una distribución de datos.  

Finalmente, en el caso de una muestra no probabilística, los elementos que se seleccionan deben estar relacionados con las características o los propósitos de la investigación que estás realizando. De acuerdo con el ejemplo de la sesión, los elementos (estudiantes) seleccionados deberían ser solamente aquellos que no acreditaron la materia de matemáticas y sobre los cuales sería pertinente realizar el estudio. 

Sampieri (Hernández Sampieri, R. (2014), Metodología de la Investigación 6a edición. Mc Graw Hill) resume este capítulo como se muestra en la figura 2.

Figura 2. Mapa conceptual del tema selección de la muestra de acuerdo con el libro metodologías de la investigación. Imagen tomada de (Hernández Sampieri, R. (2014), Metodología de la Investigación 6a edición (P. 171). Mc Graw Hill).

Te invito a revisar los siguientes videos:

Conclusión

En esta sesión hemos abordado la importancia de seleccionar los datos que habremos de analizar para darle ese sentido de impacto a nuestra investigación. Durante el desarrollo de esta sesión pudiste reconocer que es una muestra y que es la población, así como los elementos que se deben considerar para su selección. Así mismo, pudiste darte cuenta de los diferentes tipos de muestra de los que te puedes apoyar y sus características, al igual que la forma en la que se agrupan siendo probabilísticas o no probabilísticas. 

Al delimitar la población has aprendido que todavía es posible segmentarla para obtener una muestra realmente significativa que le permitirá a tu proyecto de investigación tener diferentes tipos de confianzas y errores. En este sentido, el hecho de segmentar una muestra te permite comparar y analizar otros factores que le dan un realce a tu estudio. Dentro de la selección de muestra durante el desarrollo de esta sesión se abordó la posibilidad de considerar algunos factores que te permiten delimitar el tamaño de la muestra adecuado en función de las distintas situaciones, efectos, fenómenos que se pueden presentar durante el desarrollo del proyecto de investigación. Finalmente, se esboza un valor del 20 por ciento del total de la población de acuerdo con el teorema central de límite para los datos, sin embargo, se ahondó en que no existe una regla en específico para seleccionar la cantidad de elementos que una muestra debe tener por lo que se deja siempre a criterio del investigador.

Fuentes de información