Introducción
Las medidas de tendencia central son esenciales para poder comprender el comportamiento de las variables numéricas y su distribución. Durante esta unidad se trabajará con las medidas de tendencia central (media, mediana y moda) y las medidas de dispersión, las cuales nos indicaran qué comportamiento siguen los valores de una variable, el valor máximo y mínimo y qué tan alejados o cercanos se encuentran estos valores del punto central, así como el rango, la desviación estándar y la variancia. Así mismo, se analizarán las medidas de distribución y su utilidad para conocer si los valores se distribuyen uniformemente.
También en esta unidad se realizarán tablas de frecuencia categóricas de escala, y gráficas que permitirán analizar los comportamientos que siguen las variables para posteriormente obtener conclusiones descriptivas de las mismas.
Desarrollo de contenido
2.1 Medidas Descriptivas
Uno de los principales objetivos de la estadística, es la descripción de los datos que analizamos y que pueden expresarse mediante tablas o gráficas; esto permite al investigador darse una idea del comportamiento de las variables en cada uno de los casos. Existen diversos tipos de medidas que simplifican el análisis de los datos y su comportamiento, de lo cual trataremos en los puntos siguientes.
2.1.1 Medidas de tendencia central
Las medidas que nos permiten describir grupos de diversas observaciones y que con frecuencia resumimos en una variable que nos indica el comportamiento general de los diversos datos, la denominamos medida de tendencia central. Esta nos permite conocer el punto medio en torno al cual todos los datos muestrales se distribuyen.
Clases de medidas de tendencia central
Las más comunes son:
- La media: es una medida de localización central. Suma los valores tomando en cuenta todas las observaciones y las divide entre el número de observaciones realizadas. Tiene como desventaja la cesibilidad al ser modificado por datos extremos o muy retirados del punto central.
- La moda: medida correspondiente al punto central de los datos, es el valor que tiene la mayor frecuencia dentro de un punto que se calcula contabilizando el número de frecuencias mayor aparecido en un conjunto. Su principal uso es el de representar la tendencia, pueden aparecer datos que se repiten igual número de veces estos se les nombra bimodales, trimodales, según los datos repetidos.
- La Mediana es el elemento central de los datos ordenados de mayor a menor, este punto marca un parámetro de los extremos de los datos obtenidos; con ello se puede indicar si el dato se encuentra en la primera mitad de datos del conjunto o en la segunda.
A continuación, se muestran algunos ejemplos del uso de las medidas de tendencia central:
- La siguiente tabla representa el puntaje de Coeficiente intelectual (C.I) de un grupo de 7 personas dando estos resultados:
Para calcular la media es necesario sumar todos los datos y dividirlo entre el número de éstos:
Para obtener la mediana es necesario ordenar todos los datos de mayor a menor y seleccionar el central, es decir el dato que corte por la mitad al conjunto:
125 72 92 99 100 120 126 130
Como podemos observar tenemos dos datos que cortan por la mitad al conjunto por lo que tendremos que sumarlos, luego dividirlos entre dos y tendremos el valor de la mediana.
Al igual como podemos observar ningún dato tiene más una frecuencia por lo cual la moda no se puede determinar.
2.1.2 Medidas de dispersión
Las medidas de dispersión nos permiten conocer la dispersión de los datos y como se distribuyen, así como, identificar cuanto se alejan del punto central. Entre las más comunes se encuentran la desviación estándar, rango y varianza:
- Rango: es la diferencia entre el mayor y el menor de los datos, sirve para diferenciar el valor máximo y el mínimo del conjunto de datos.
- Desviación estándar: medida de dispersión más usada, representa el promedio de la dispersión o distancia que hay entre los datos.
- Varianza: es el cuadrado del promedio de la distancia entre los datos y el punto central. No proporciona la misma información que la desviación estándar.
Como ejemplo podemos hablar sobre un estudio de inteligencia que se llevó a cabo, eligiendo para ello, una muestra representada por hombres y otra por mujeres. Los resultados obtenidos, manifestaron que la diferencia que se dio entre las medias no fue representativa para poder llegar a una conclusión. Prácticamente la media del coeficiente intelectual de las dos muestras, fue la misma; al analizar la desviación estándar se observó que los resultados de los hombres se encontraban más dispersos en relación a los de las mujeres. Los datos más extremos de los hombres abarcaban un rango de 55 a 160, los de las mujeres se ubicaron más cerca del punto central, por lo que se infirió que estas son más inteligentes.
2.1.2 Medidas de Distribución
Las medidas de distribución sirven para describir la forma en que se distribuyen las frecuencias alrededor del punto central. Estas medidas indican si el comportamiento de los datos se distribuye de manera uniforme y si tienen una tendencia hacia la cual crecen. Entre las más importantes se encuentran:
- Asimetría: esta medida describe hacia qué lado se distribuyen la mayoría de los datos, y con base en esto, existen tres tipos. Se reconocen por la inclinación que muestran en la Gráfica de Gauss, con relación al eje de simetría del punto central. Cuando la asimetría es negativa, nos indica que la mayoría de los datos se encuentran por debajo de la media; en cambio cuando es Positiva, se dispersan hacia la izquierda del eje de simetría y una curva simétrica cuando se distribuyes de manera uniforme al eje de simetría.
2.2 Frecuencias
Para poder hacer un análisis descriptivo se requiere tener en cuenta el tipo de variables con las que estamos trabajando, estas pueden ser: categóricas y de escala. Las primeras son aquellas que se utilizan para clasificar el caso; los rangos e intervalos pueden incluirse como variables categóricas, pues representan grupos a los que pertenecen los casos. Las propiedades de las variables son clasificadas por el software en tres grupos: nominales y ordinales, las de escala y las categóricas.
Las nominales y ordinales
- Las variables nominales incluyen modalidades que no tienen punto de comparación, por ejemplo: tipo de enfermedad, profesión, etc. En cambio, en las ordinales existe jerarquía u orden en las modalidades, ejemplo, obtuvo el primer lugar, esto quiere decir que llegó antes del segundo, este tipo de variables representan a un grupo y describen las características cuantitativas y cualitativas del mismo. Esto lo hacen por medio de las tablas de frecuencia, ejemplo, género, nivel educativo, tipo de sangre, antecedentes heredo-familiares.
- Las de escala son variables que tienen un amplio número de datos diferentes y proporcionan información cuantitativa de los casos; con estos se puede hacer un análisis profundo, a diferencia de las variables categóricas, cuyas frecuencias no nos proporcionan información útil, debido a que el gran espectro de los datos, impide que nos aporten una tabla de frecuencias amplia para analizarla e interpretarla.
2.2.1 Frecuencias para variables categóricas
Las tablas de frecuencia son un análisis estadístico que nos permite conocer los datos que se repitieron más veces, lo cual facilita hacer análisis descriptivos utilizando diferentes mediadas, tales como: media, moda, mediana, desviación estándar y asimetría.
Para poder realizar una tabla de frecuencias utilizando el SPSS, nos situamos en la barra de menú análisis>descriptivos>frecuencias, se abrirá un cuadro de dialogo, aquí seleccionamos las variables que deseamos analizar.
Al visualizar la imagen, en la primera parte del menú encontramos la primera sección, aquí se muestra la lista de variables que tenemos capturadas y a un lado se ve la ventana de variables que hemos seleccionado, damos clic en la para pasarla al cuadro derecho y realizar el análisis estadístico de esas variables. Si queremos eliminarlas, las volvemos a seleccionar, damos clic en la de esta manera el sistema soló procesará las variables, que se muestran en el segundo recuadro.
En el lado derecho hay cuatro botones que permiten al usuario, realizar diferentes análisis con las frecuencias obtenidas. Enseguida explicaremos la función de cada uno, así como, las funciones especiales del cuadro de frecuencias.
- Estadísticos. Este botón permite pedir estadísticos específicos, tales como: frecuencias, porcentajes, media, mediana, moda, suma, varianza, porcentajes acumulados, amplitud, etc. Para utilizarlo, se da clic en dicho botón, se abrirá un cuadro de dialogo donde podemos indicar al sistema las pruebas estadísticas que queremos realizar, en relación a las variables seleccionadas.
Encontraremos cuatro opciones:
a) Variables percentiles, en las cuales indicamos medidas de posición no central como cuartele en otras palabras puntos al 25%, 50%, 75% y 100% de los datos; puntos de corte para los que indique el usuario, dividiendo en este número el total de los datos y devolviéndolos en los resultados; percentiles, donde se indican los puntos de medida no centrales que el usuario dese y de esta manera nos devuelve los balos en el valor porcentual indicado.
b) Tendencia central, nos sirve para especificar qué operaciones estadísticas del punto central realiza el sistema, encontramos estas: Media, Mediana, Moda, Suma.
c) Medidas de dispersión, estas nos permiten hacer operaciones como desviación típica, varianza, rango y error típico de la media (E.T. Media), así como, el valor mínimo y el máximo de la variable.
d) La distribución, utiliza pruebas que nos indican el comportamiento de la variable, entre otras, como la asimetría que nos indica si la tendencia es positiva o negativa; curtotosis la cual nos indica el grado de distribución de los casos acumulados en las colas de distribución, en comparación a las colas de una distribución normal con la misma varianza.
Gráficos es el botón que nos permite solicitar tres tipos de gráficos:
a) Gráficos de barras: en estos, se grafican las frecuencias de los datos en barras, que crecen de acuerdo al número de veces que se repite el dato.
b) Gráficos de sectores o de pastel: se utiliza en la representación de variables cualitativas o discretas. … Consiste en dividir el círculo en porciones proporcionales a la frecuencia relativa. Se entiende como porción, la parte del círculo que representa a cada valor que toma la variable.
c) El histograma, es muy parecido a la gráfica de barras, excepto que en este caso las barras se encuentran juntas dándole continuidad a las frecuencias y los datos se representan por intervalos.
Al seleccionar el histograma se activa la opción que se localiza justo debajo de este; nos permite añadir a la gráfica la curva normal, que nos indica el comportamiento de las variables por una simple campana de Gauss. En la segunda parte de esta ventana encontramos la sección de valores del gráfico, se activa si se seleccionó la opción del grafico de barras o sectores, en esta opción podemos definir si la gráfica se basa en las frecuencias, número de veces repetido o en el porcentaje, la fracción de datos del total de frecuencias.
- Formato: al dar clic en este botón, se abre un cuadro de texto, ahí podemos seleccionar diferentes atributos para nuestras tablas de resultado de frecuencias; en la primera parte que se refiere a ordenado por, podemos elegir si queremos que se ordene por los valores numéricos, por número de repeticiones ya sea de mayor a menor o de menor a mayor. A un lado, encontramos la opción de variables múltiples, tiene la función de comprobar variables, para ello proporcionará una tabla para todas las variables que son analizadas.
Organizar resultados según variables, esta opción nos presenta una tabla por cada variable analizada; por ultimo encontramos una casilla con la leyenda “Suprimir tablas con varias categorías” la seleccionamos y se activa un cuadro, cuya función es limitar el número de categorías, cuando estas rebasan el número indicado en el recuadro. Esto es, cuando una variable tiene un gran número de categorías, las tablas de frecuencias no proporcionarán información relevante sobre estas.
Para realizar una tabla de frecuencias que sea representativa, no se puede seguir el mismo método que se utiliza con una de tipo categórica, o de escala; debido a que las dos tienen datos muy diferentes por lo que los resultados serán distintos. No todas las operaciones descriptivas se pueden analizar con estos dos tipos de variables. Se mostrará una tabla que relaciona las operaciones descriptivas con el tipo de variables, notaremos que los datos obtenidos no son significativos, ni confiables para nuestra investigación:
Para realizar una tabla de frecuencias para variables categóricas y de escalas, se utilizan distintos procedimientos, vamos a realizar un ejercicio de cada tipo, para ver las diferencias en el procedimiento. Para hacerlo, debemos abrir el archivo adjunto en la sección de anexos, titulado contacts.sav. y llevamos a cabo estos pasos:
- Vamos a la barra de menús, seleccionamos la dirección: Analizar>Estadísticos Descriptivos> Frecuencias, nos desplegará el cuadro de texto de Frecuencias, seleccionamos la variable Departamento, marcamos el recuadro para que en la hoja de resultados nos arroje la tabla con las frecuencias, tal como se muestra en la imagen.
2. Hecho lo anterior, nos ubicamos en la opción Estadísticos, damos clic en el botón, se abrirá la ventana Frecuencia: Estadísticos, elegimos aquellas pruebas descriptivas que deseamos realizar; como en este caso, la variable seleccionada es categórica, solamente podemos obtener la moda, elegimos esta opción de la sección Tendencia central y damos clic en el botón continuar, tal como lo muestra la imagen.
3. Regresamos a la ventana de Frecuencias y damos clic en el botón de Gráficos, se abre el cuadro de texto Frecuencias: Gráficos, seleccionamos el grafico de barras, dando clic en el icono , se activará la sección Valores del gráfico, dejaremos la opción por default Frecuencia, damos clic en continuar y después en aceptar, tal como se muestra en la siguiente imagen:
Realizado lo anterior, se abrirá la ventana de resultado con dos tablas y una gráfica, la primera nos indica los casos que fueron tomados en cuenta como correctos para este análisis, si observamos, nos damos cuenta que sólo se analizaron 62 de 70; los otros 8 fueron contados como perdidos, seguramente porque se desconocía su valor, o simplemente porque la casilla estaba vacía. En la parte inferior de la primera tabla observamos el resultado de la moda, en este caso es 2, este número por sí solo no nos dice nada; tenemos que regresar al editor de datos en las propiedades de variables y revisar las Etiquetas de valores, ahí nos indica que el número 2 se refiere a las personas que están en el departamento de servicios informáticos, por lo que podemos deducir que el departamento con más personas es el de Servicios Informáticos.
Lo descrito, se muestra en la imagen siguiente:
En la segunda tabla podemos observar las frecuencias que obtuvo cada categoría de la variable, en nuestro ejemplo el de servicios informáticos fue el dato que más número de veces se repitió, resultando ser la moda. Tenemos tres columnas más, la segunda denominada Porcentaje valido, nos indica el valor porcentual de la frecuencia, pero sin tomar en cuenta los valores perdidos. La referente a Porcentaje, nos muestra el valor porcentual que tiene cada una de las categorías por la frecuencia en la variable, cuenta los valores perdidos como parte del conjunto. Por último, tenemos la de Porcentaje Acumulado, hace referencia al valor de la suma de los porcentajes válidos y su posición dentro de esta. Lo descrito, podemos observarlo en la imagen que sigue:
En la gráfica de barras observamos cada una de las categorías, representada por una barra, cuya longitud varia por el número de frecuencias que se obtuvieron; en la parte inferior se encuentra la leyenda departamento y cada una de las categorías; del lado izquierdo se muestra la frecuencia replanteada por intervalos de 10.
2.2.2 Frecuencias para variables de escalas
Ahora vamos a realizar una tabla de frecuencias con una variable de escala, para ello, necesitamos abrir el archivo adjunto en la carpeta anexos, cuyo nombre es contacts.sav,.
Para hacerlo, seguimos este procedimiento:
- Nos dirigimos al menú Analizar>Análisis Estadísticos>Frecuencias, accedemos al asistente de Frecuencias, seleccionamos la variable volumen. Desactivamos el recuadro Mostrar tabla de frecuencias, con la intención de que, en los resultados, no nos arroje el sistema una tabla de frecuencias, que no nos proporcionará información de utilidad sobre el comportamiento de la variable o simplemente la describirá. Lo podemos observar en esta imagen:
2. Para continuar, nos ubicamos en el botón estadísticos, nos abrirá el submenú Frecuencias: estadísticos, seleccionamos de la sección de Valores Percentiles la opción cuartiles, para que nos muestre los valores en 25%, 50%, 75% y 100%; hecho lo anterior, nos dirigimos a la opción de tendencia central, en distribución, seleccionamos Desviación típica, Mínimo y máximo y por último, en la sección de Distribución seleccionamos asimetría.
3. Para seguir, damos clic en la ventana de gráficos, seleccionamos la opción histograma, se activará un cuadro que nos muestra la curva normal, una vez seleccionado damos clic en continuar y regresamos a la ventana de Frecuencias, como lo observamos en la imagen:
4. Por ultimo damos clic en el botón formato, nos abre el cuadro de texto que nos permite dar presentación a nuestra tabla; seleccionamos la opción Ordenar por y al darle clic, aparece, “recuentos ascendentes”, opción que nos permite organizar las variables de la categoría con mayor frecuencia a la de menor, las demás secciones las dejamos por default. Solo estamos analizando una variable y ya lo hemos indicado en el cuadro de diálogo de Frecuencias. Solo nos resta dar clic en continuar para cerrar el cuadro de diálogo, lo aceptamos y listo. Lo podemos visualizar en la imagen que sigue:
Realizado el procedimiento anterior, nos abre la ventana de resultados y nos muestra en una tabla los datos analizados y los perdidos, aparecen también los resultados de las pruebas de tendencia central. Al observar lo anterior, comparamos los resultados y vemos que difieren mucho, con ello, se manifiesta que la distribución no es simétrica; vemos que el resultado de la moda tiene un superíndice (a), ello nos hace referencia a una nota colocada al pie de la tabla, lo cual especifica que la variable es multimodal y que se muestra la moda con menor valor numeral. En la parte de en medio tenemos los resultados de las medidas de dispersión y distribución. En la medida de asimetría podemos ver un valor positivo de 5.365 indicándonos, como ya lo habíamos dicho, que la distribución de la variable no es simétrica y, por último, tenemos los valores de cuartiles. Todo ello, se indica en la tabla que vemos en este apartado.
En la gráfica que nos arrojó la tabla de frecuencias, observamos que la mayoría de los datos se encuentran entre 0 y 200, con ello inferimos que la curva normal tiene su cresta dentro de esta posición. Se puede apreciar que la distribución de variable es asimétrica, presenta valores muy extremos hacia el lado derecho, respaldando la información que nos obtuvimos de la simetría en la de la tabla anterior. Al lado derecho se muestra, un pequeño cuadro con la información del comportamiento de las variables, estas son: la media, la desviación típica, y el número total de casos analizados, útiles para poder dar una mejor interpretación de los datos. Lo evidenciamos en la siguiente tabla:
2.3 Análisis descriptivo según el nivel de desviación
Este tipo de proceso que ofrece el software SPSS es muy parecido a las tablas de frecuencia, con la diferencia que esto solo se puede realizar a variables de escala, en otras palabras, a datos cualitativos con muy amplias categorías. Este procedimiento nos arroja las mismas medidas descriptivas que la tabla de frecuencia, medidas de tendencia central, de dispersión y distribución, la diferencia de este proceso es que nos permite guardar como una nueva variable las puntuaciones z o valores tipificados de cada uno de los casos.
Para poder realizar la prueba mencionada, vamos al menú Analizar>Estadísticos descriptivos>Descriptivos, nos aparecerá una ventana llamada Descriptivos (se muestra en la imagen), ahí seleccionamos las variables de escala que queremos procesar; justo debajo de estas, de lado derecho aparece un solo botón para darle propiedades a las tablas, si damos clic en el botón Opciones, nos abrirá una nueva ventana donde podemos especificar las medidas a obtener con el proceso, cuenta con 4 sesiones:
1. La primera, son las pruebas de tendencia central, tales como: la media y la suma, la Moda y mediana no se contabilizan en este procedimiento; enseguida las medidas de dispersión, son las mismas que el proceso de frecuencias y las medidas de distribución que encontramos en la tabla de frecuencias, del subtítulo anterior. En la parte inferior de este recuadro encontramos las opciones de formato de la tabla que nos arroja el procedimiento.
Veamos un ejemplo de análisis descriptivo con las puntaciones z. Abrimos el archivo contacs.sav, recordemos que se encuentra en la carpeta de anexos de esta materia. Una vez abierto, nos situamos en la barra de menús, seleccionamos: Analizar>Estadísticos Descriptivos>Descriptivos, nos abrirá la ventana de dialogo de análisis descriptivo, para fines de este ejercicio seleccionaremos la variable “tiempo”, después pulsamos sobre la flecha para trasladarla a el recuadro de las variables que vamos a trabajar en este análisis. Proseguiremos a dar clic sobre el recuadro con la leyenda Guardar valores tipificados como variables, ya echo esto es necesario dirigimos al botón de opciones y lo pulsamos, se muestra en la imagen:
Al abrir la ventana de opciones nos dirigimos a las medidas de tendencia central y elegimos Media y Suma, en las de dispersión seleccionamos la Desviación típica, Mínimo, máximo y error típico de la media; en la sección de medidas de distribución escogemos las de disponibles Carosis y Asimetría; por ultimo en la parte de opciones de presentación de la tabla, no modificamos nada y dejamos el valor por defecto. Enseguida damos clic en continuar y nos cerrará la ventana, nos dirigimos de nuevo a la ventana de Descriptivos y damos clic en el botón aceptar.
Enseguida se no abre una ventana de resultados, esta se generó con las indicaciones que le dimos al software, su apariencia es complicada, por lo que se sugiere darle formato.
2.4 Representaciones gráficas
El procedimiento Frecuencias, ofrece la posibilidad de obtener algunos gráficos básicos, como: de barras, de sectores e histogramas. (El menú de gráficos de la barra, también permite obtener estos mismos gráficos, además de otros muchos). Para obtener un gráfico de barras, de sectores o un histograma, abrimos el archivo contactos.sav que se encuentra en la carpeta anexos de la clase. Nos situamos en la barra de tareas y damos clic en gráficos, se presentan dos opciones: la Primera “Generador de Gráficos…”, al dar clic en esta, se despliega un cuadro de dialogo con las variables que contiene nuestra base de datos y una galería con las diferentes graficas que puede realizar el software; la segunda opción “Selector de Plantillas de tablero…”, permite visualizar gráficos, diagramas y otras representaciones visuales de datos creados a partir de una plantilla de visualización de SPSS que vienen pre-determinadas por el Software, esta opción nos permite hacer gráficos en mapas, recuentos de sectores, diagramas de puntos. La última opción de este menú “cuadros de diálogos antiguos”, nos mostrará las funciones de graficas más usadas en orden de la última que se utilizó.
Para fines de este ejercicio, damos clic en Gráficos> Generador de Gráficos… y el programa abrirá el cuadro de dialogo “Generador de Gráficos”, la primera en la de Variables donde se encuentran todas las que tenemos en nuestra base de datos. El icono es diferente según sean variables categóricas o de escala, el generador de gráficos distingue los distintos niveles de medida y trata las variables de forma diferente según el nivel de medida, un icono situado junto a cada variable de la lista Variables identifica el tipo de variable, como lo muestra la imagen:
Abajo del Recuadro Variables, aparece otro recuadro, que al seleccionar una categórica ya sea nominal u ordinaria nos mostrará la lista de categorías de la variable correspondiente.
En la Parte Inferior encontramos la Galería donde se encuentran enlistados todos los tipos de gráficos, agrupados por categorías. Para generar uno, es necesario seleccionarlo en la galería y arrastrarlo al lienzo que es la zona del cuadro de diálogo, Generador de gráficos, aquí es donde se genera, automáticamente se crea la gráfica. En este lugar, también encontramos la zona de arrastre del eje, función que permite, seleccionar una variable, se arrastra y automáticamente las integra el cuadro de dialogo. En la parte superior del lienzo se encuentran algunas gráficas, tales como: la de barras, la zona de agrupación que nos indica qué variable está agrupando y alguno de los ejes de la gráfica.
2.4.1 Gráfico de barras
Los gráficos de barras nos permiten generar una descripción visual del comportamiento de los datos de una o varias variables. A pesar que la mayoría de sus aplicaciones están orientadas a las variables categóricas, también pueden ser utilizados para la descripción de variables de escala. La longitud de las barras representa habitualmente la frecuencia de los casos de cada categoría, un porcentaje del número total de casos o una función de otra variable (por ejemplo, el valor medio para cada categoría).
Ahora vamos a realizar un gráfico de barras con dos variables, nos dirigirnos a nuestro archivo contactos.sav, ya abierto hacemos clic en Gráficos> cuadros de diálogos antiguos>barras, nos desplegará un cuadro que nos pregunta, el tipo de grafica de barras que queremos realizar. Seleccionamos Simple si queremos solo una gráfica de una variable, sin comparar varias en la misma agrupación, Agrupada crea un gráfico que resume las categorías de una variable dentro de las categorías de otra variable; por último, Apiladas donde se genera un gráfico en el que los segmentos de barras aparecen apilados unos sobre otros, para efectos de este ejerció seleccionaremos el Simple.
En la parte Inferior de este cuadro, nos pregunta como son los datos de la gráfica, para efectos de este ejercicio, escogernos la segunda opción “resúmenes para Distintas Variables “Resúmenes grupos de casos”.
Se desplegará el cuadro de diálogo Definir de barras simples, se selecciona la variable de escala MEAN (volumen de la última venta). Arrastrándola hasta la barra blanca de la sección. Las barras representan la variable y dando a continuación al lado del recuadro blanco de la misma sección. Se muestra en la siguiente imagen:
Con el recuadro seleccionado y la variable insertada, se da clic en Cambiar estadístico, se abrirá un cuadro de diálogo donde se selecciona la opción Media de valores y se oprime el botón continuar. Regresando a cuadro de dialogo anterior, en la sección de Eje de categorías: seleccionar la variable departamento, enseguida presionamos aceptar y se nos abrirá la hoja de resultados con la gráfica de barras diferenciando, los departamentos y la media de ventas.
2.4.2 Gráfico de sectores
Los gráficos de áreas nos permiten describir una o más variables, generando una representación visual del comportamiento de los datos.
Su principal característica radica en el uso de líneas rectas para la interconexión de los puntos representativos de los datos (Recuento, porcentaje o funciones de resumen), rellenado el espacio que se sitúa entre las líneas de datos y la línea base, para poder realizar un gráfico de sectores es necesario ir Gráficos> cuadros de diálogos antiguos> sectores… abrimos el cuadro de dialogo de Definir sectores, el spss tiene la función de preguntar cuáles son los datos del gráfico, seleccionamos la primera opción resúmenes para grupos de casos. Lo muestra la imagen.
Pulsamos finalmente definir, se abrirá el cuadro de dialogo definir de sectores, en este encontraremos 4 secciones, una donde visualizamos la lista de variables de nuestra base de datos, así como, opciones relacionadas con el gráfico. Las secciones de los sectores, tiene tres variables: la primera cuenta el número de casos y lo divide por las categorías de las variables, está expuesta como N° de casos; la opción % de casos, muestra una gráfica con los valores percentiles y Suma de variables, muestra el resultado de sumar las dos variables. Para fines de este ejercicio, elegimos la opción de % de casos, arrastramos la variable Departamento al recuadro blanco de la sección Definir sectores por y damos clic en el botón Definir, se abrirá la ventana de resultados, encontraremos la gráfica dividida de acuerdo al porcentaje de las frecuencias de la variable.
Para poder ver el porcentaje es necesario dar doble clic sobre la gráfica, se abre una ventana Editor de gráficos, ahí se pueden hacer diferentes ediciones a la gráfica; sobre el Lienzo se encontrará el botón damos un clic y aparecerán los % correspondientes a cada sector, junto con un cuadro de diálogo que nos permite editar el formato de los porcentajes, desde color, hasta la información que muestra lo podemos observar en la imagen:
2.4.3 Histogramas
Uno de los procedimientos gráficos más utilizados en el análisis de variables de escala es el histograma, a través de él se pueden reunir los valores de una variable en grupos, con un mismo rango o distancia denominados intervalos o clases. Incorporan el recuento o frecuencia del número de casos dentro de cada grupo, este se puede expresar en forma de porcentaje, es muy útil para comparar conjuntos de datos de diferentes tamaños o unidades de medida.
A través del histograma se pueden detectar parámetros, tales como, los valores atípicos y las desviaciones de la asimetría, indicándonos si la variable es o no adecuada para ser analizada, mediante un procedimiento que asuma una distribución normal.
Para realizar un ejercicio de histograma, utilizamos el asistente de Generador de Gráficos, para ello, vamos al menú Gráficos>Generado de gráficos, damos clic para abrir el asistente. Colocados aquí vamos a la sección inferior Galería y buscamos el tipo de grafico Histograma, seleccionamos la tercera opción, es decir, Polígono de Frecuencia y la arrastramos sobre el Lienzo. Enseguida tomamos la variable tiempo de la última ventana y la arrastramos al recuadro ¿Eje X, damos clic en el botón Propiedades del Elemento… Definimos en la sección Editar Propiedades de: y seleccionamos la opción X eje 1 (áreas 1), desactivamos la casilla de verificación Mínimo y dejamos el Valor 0 y en la Casilla de Verificación Máximo al igual la desactivamos y tecleamos la cantidad de 22; ya que el mayor valor en la variable tiempo desde la última venta es 21, por último en la opción máximo desactivamos la casilla de verificación de Incremento mayor y agregamos en el recuadro 21, damos clic sobre el botón Aplicar y enseguida aceptar del cuadro de dialogo de Generador de gráficos. Se muestra en la imagen:
Finalmente se abrirá de nuevo la ventana de resultados, mostrándonos el histograma de la frecuencia del tiempo que ha pasado desde la última venta. Así lo muestra la siguiente imagen:
Conclusiones
- El uso de este software, mejora el aprendizaje de los estudiantes, por participar de manera activa en su formación y en la profundización de los contenidos.
- Es una herramienta informática en la que el principal recurso didáctico a utilizar es un programa interactivo que hace posible el autoaprendizaje del estudiante.
- Es una ayuda complementaria para el aprendizaje de la Estadística por ordenador, desarrollando un software interactivo para el autoaprendizaje del SPSS.
- Motiva a los estudiantes el uso de esta herramienta de aprendizaje y la motivación es uno de los motores del aprendizaje, ya que incita a la actividad y a la creación del saber.
Con el uso de este software, se promueve el aprendizaje autónomo por parte del estudiante, pues a medida que se familiarice con la metodología implementada, más rápidamente aprenderá y se identificará con esta nueva forma de aprender Estadística.
Bibliografía consultada
- LANDERO H. René (2009). Estadística con SPSS, y metodología de la investigación. 1ra ed. Editorial Trillas
- spssfree.com
- PALLAT, Juliet (2002). SPSS Suvirval Manual. 2end ed. Allen&Unwin,
- CARRASCO, J.L. (1989) “El método estadístico en la investigación médica». Editorial
- ESPERANZA Bausela Herreras (2005). SPSS: Un instrumento de análisis de dato cuantitativos. Revista de Informática Educativa y Medios Audiovisuales. Vol. 2 (4), ISSN 1667-8338
- Gardner, C. R. (2003). Estadística para psicología usando SPSS.