Clase digital 2. Transformación y limpieza de datos

Portada » Clase digital 2. Transformación y limpieza de datos


Transformación y limpieza de datos

Introducción

Estimado estudiante, te doy la más cordial bienvenida a la segunda clase de este micro curso «Power Query en Acción: Herramienta Esencial para la Limpieza, Transformación y Análisis de Datos en Excel». En esta ocasión nos adentraremos más de lleno en la transformación de los datos ya en Power Query.

En esta clase, exploraremos diversas formas de cargar datos en Power Query utilizando archivos distintos a los que normalmente empleamos en MS-Excel. Conoceremos cómo importar datos desde archivos CSV, que son comunes en diversas fuentes de datos públicas en línea.

Recordemos que una de las grandes virtudes del Power Query es el trabajo de tipo ETL, extracción, transformación y carga de datos con mucha mayor facilidad, en esta clase veremos la parte de la transformación más en detalle.

Abordaremos la limpieza de datos, incluyendo aquellos que están incompletos o contienen errores. Esta limpieza es esencial para garantizar que los datos sean adecuados para su posterior análisis y reporte en MS-Excel.

Realizaremos una comparativa entre cómo se separan los datos en columnas utilizando MS-Excel y cómo lo hacemos en Power Query. Esto nos permitirá apreciar la facilidad de uso de Power Query, que no requiere el uso de fórmulas complicadas de MS-Excel.

Es esencial tener en cuenta que al trabajar con Power Query, la mayoría de las modificaciones se aplican a nivel de columna en lugar de a nivel de celda, como es común en MS-Excel.

Al igual que en la sesión anterior, te proporcionaremos los archivos necesarios para que puedas practicar y desarrollar los conceptos que veremos en esta clase. Continuemos nuestra travesía hacia el dominio de Power Query. ¡Adelante!

Desarrollo del tema

Ahora que hemos identificado el próximo punto de interés, procedamos a repasar el método de importación de datos desde un archivo .CSV. Para ello, te recomendamos visualizar el siguiente video:

Tomémonos un momento para reflexionar sobre la facilidad de cargar datos mediante Power Query. El método que se presenta en el video es la forma fundamental de importar datos desde archivos de bases de datos sin realizar modificaciones o transformaciones significativas en ellos.

Además, en esta sesión hemos preparado un archivo de texto en formato .CSV para realizar prácticas adicionales que abordarán otros aspectos importantes de la clase. Puedes descargar el documento en el siguiente enlace:

Para llevar a cabo las prácticas con éxito, te recomendamos descargar el archivo de datos en formato .CSV, que se menciona en el documento. A continuación, te proporcionamos el enlace de descarga:

Una de las prácticas incluye la realización de transformaciones utilizando exclusivamente MS-Excel. Esto implica cargar los datos en MS-Excel y seguir las instrucciones proporcionadas paso a paso para limpiar y preparar la base de datos para su posterior análisis y generación de informes. Este enfoque nos permitirá comparar el proceso con el uso de Power Query y apreciar las ventajas que esta última herramienta ofrece, especialmente en la estandarización de datos.

Dentro de esta práctica y con el archivo mencionado, abordaremos varios temas clave:

  1. Apertura y modificación de archivo usando solo MS-Excel
  2. Carga de datos desde un archivo .CSV sin adecuaciones
  3. Carga y transformación de datos utilizando la herramienta de Power Query
  4. Herramientas de limpieza datos
    • Eliminación de filas no deseadas
    • Promoción de filas de tipo encabezado
    • Eliminar filas vacías
  5. Trabajo con columnas
    • Eliminación de columnas vacías o duplicadas
    • División de datos en columnas
    • Combinación de columnas
    • Creación de columnas calculadas (Operaciones Matemáticas)
  6. Trabajo con valores
    • Reemplazo de valores
    • Establecimiento de formatos
  7. Cargar datos a MS-Excel

Por supuesto, estas transformaciones no son las únicas posibilidades que se pueden desarrollar con el Power Query, te invito a revisar el siguiente enlace del blog “XFB – Excel Free Blog” posteado por Fabián torres con el tema “Entretejer o Relacionar Tablas Con Power Query” (Torres, Excel Free Blog – Entretejer o Relacionar Tablas Con Power Query, 2016).

Otro artículo que te puede servir como complemento a esta segunda clase de los procedimientos que se hicieron ahora y de otras opciones que ofrece el Power Query en la limpieza y adecuación de los datos la podrás encontrar en este otro enlace del blog “XFB – Excel Free Blog” posteado por Fabián torres con el tema “Transformación con Power Query” (Torres, Excel Free Blog – Transformación con Power Query, 2017).

Conclusión

En esta segunda clase, abordamos una variedad de temas fundamentales en el uso de Power Query para la limpieza, transformación y análisis de datos en Excel. Exploramos la importación de datos desde archivos .CSV y reflexionamos sobre la eficacia de esta herramienta en comparación con los métodos tradicionales de MS-Excel.

Durante esta sesión, realizamos una práctica valiosa que nos permitió aplicar lo aprendido. Trabajamos en la limpieza de datos, incluyendo la eliminación de filas no deseadas y filas vacías, así como la promoción de filas como encabezados. Además, exploramos el trabajo con columnas, eliminando duplicados y dividiendo datos cuando sea necesario. También tuvimos la oportunidad de combinar columnas y crear columnas calculadas mediante operaciones matemáticas.

Un aspecto clave en la limpieza de datos fue el establecimiento de formatos en las columnas para garantizar la coherencia y la precisión de los datos.

Finalmente, aprendimos a cargar los datos limpios en MS-Excel, completando así el proceso de transformación de datos.

Te invito a continuar con la siguiente clase digital, donde abordaremos temas relacionados con el modelado y la estructura de datos. Exploraremos cómo combinar consultas, técnicas de relacionado de tablas y la construcción de resúmenes en tablas dinámicas y gráficas dinámicas.

Agradezco tu dedicación y participación en esta clase, y te aliento a realizar las actividades de la consigna utilizando el archivo que empleamos en esta sesión. Además, no olvides responder al examen correspondiente a este tema para consolidar tu comprensión de Power Query. ¡Hasta la próxima clase!