Clase digital 3. Modelado y estructura de datos

Portada » Clase digital 3. Modelado y estructura de datos


Modelado y estructura de datos

Introducción

Estimado estudiante, te doy la más cordial bienvenida a la tercera clase de este micro curso «Power Query en Acción: Herramienta Esencial para la Limpieza, Transformación y Análisis de Datos en Excel». En esta ocasión nos centraremos en la consolidación de datos y otras transformaciones de los datos con el Power Query, por supuesto.

Durante esta clase, nos enfocaremos en aprender cómo cargar múltiples archivos que contienen estructuras de datos similares, específicamente columnas con el mismo tipo de información. Esta habilidad es esencial para llevar a cabo la consolidación de datos de manera eficiente.

La capacidad de trabajar de esta manera mejorará significativamente tus habilidades en ETL (Extracción, Transformación y Carga de Datos), agilizando el proceso de consolidación de datos, especialmente cuando se trata de la generación de informes.

Continuaremos viendo el trabajo con columnas cuando contienen datos que requerimos tratar de una a varias columnas

Además, profundizaremos en la manipulación de columnas que contienen datos que necesitamos procesar, utilizando lo que se conoce como «Unpivot Tables» o «anulación de dinamización de columnas». Esta técnica optimizará la estructura de tus tablas de datos.

En un ejercicio práctico, tomaremos una tabla de datos extensa y, en unos simples pasos, la convertiremos en una tabla resumida de fácil interpretación. También aprenderás a preparar una tabla de datos para crear una tabla dinámica o un gráfico dinámico.

Es importante recordar que, al igual que en clases anteriores, la mayoría de las modificaciones que realizaremos se centrarán en las columnas, no en las celdas individuales como se hace tradicionalmente en MS-Excel.

Desarrollo del tema

En primer lugar, es fundamental comprender qué implica la consolidación de datos. En términos simples, este proceso consiste en combinar información de dos o más tablas de datos con una estructura de columnas idéntica, aunque pueden variar en cuanto al número de filas. Un requisito esencial es que todas las tablas que se consoliden tengan las mismas columnas.

Estas tablas de datos pueden residir en un mismo archivo o en archivos separados, lo que abre la posibilidad de realizar operaciones matemáticas con los datos para generar informes que integren toda la información relevante.

Para profundizar en este concepto, te recomendamos revisar el siguiente video sobre cómo realizar la consolidación de datos.

Tomemos un momento para reflexionar: ¿Tenías conocimiento de este método de trabajo previamente? ¿Lo consideras fácil de llevar a cabo? Imagina si las tablas de datos no estuvieran en un solo archivo, ¿crees que la consolidación sería más sencilla o complicada?

Si bien el método presentado en el video es efectivo, Power Query lleva la consolidación de datos a un nivel superior, especialmente cuando se trata de datos en archivos independientes. El proceso se realiza una sola vez, y luego solo es necesario agregar archivos a la carpeta base o desde donde se tomaron los archivos originales para consolidar. Actualizar el informe es tan simple como eso, y lo veremos en la primera parte de la práctica de esta clase.

En la segunda parte de la clase, exploraremos nuevas opciones de transformación de datos y cómo crear columnas adicionales en las consultas de Power Query para generar tablas de datos específicas para informes.

También abordaremos el concepto de «anulación de dinamización de columnas», que, aunque suene complejo, te permitirá transformar datos de manera sencilla, una tarea que sería tediosa o complicada de realizar directamente en MS-Excel.

Exploraremos nuevas opciones de extracción de datos, incluyendo cómo crear una nueva columna basada en una columna existente.

Antes de concluir la clase, aprenderás cómo crear nuevas consultas a partir de una consulta existente, sin tener que repetir todo el proceso. Estas consultas estarán listas para crear informes con tablas dinámicas o gráficos dinámicos.

El material completo de la clase está disponible en el archivo que puedes descargar en el siguiente enlace:

Al igual que en las clases anteriores deberás de descargar los archivos de trabajo que ocuparás para realizar las prácticas correspondientes a la clase. En esta ocasión se incluyen dos archivos, el primero es un archivo en formato comprimido .ZIP, el cual deberás descargar y descomprimir, este contiene dos carpetas con varios archivos en cada carpeta, en la clase se te explica a detalle. Lo puedes descargar desde la siguiente liga:

El segundo archivo corresponde a la segunda parte de la clase donde se revisarán los temas de desagregación de datos, anulación de dinamización de columnas y construcción de consultas de resumen y consultas para tablas dinámicas y gráficos dinámicos. La liga de descarga del archivo es la siguiente:

Conclusión

En esta tercera clase, hemos abordado varios conceptos y técnicas fundamentales relacionadas con Power Query y la consolidación de datos en Excel. Es importante destacar las principales conclusiones de lo que hemos aprendido:

Aprendimos qué es la consolidación de datos y cómo llevar a cabo este proceso utilizando los comandos estándar de MS-Excel. Esto nos brinda una base sólida para comprender el proceso tradicional de consolidación.

Exploramos cómo realizar la consolidación de datos de varios archivos utilizando Power Query. Este enfoque se destaca por su simplicidad y eficiencia, lo que facilita enormemente la actualización de la consolidación de datos a medida que se agregan nuevos archivos.

Practicamos la «anulación de dinamización de columnas», una técnica que nos permite transformar los datos de columnas específicas para crear nuevas columnas con información agregada. Esto simplifica la generación de informes a partir de nuestras consultas.

Analizamos diversas estrategias para extraer datos de columnas, lo que contribuye a mejorar la calidad de la información en nuestras consultas.

Aprendimos a crear consultas referenciadas a partir de una consulta base. Esta capacidad nos permite generar múltiples consultas que se pueden utilizar en diversos contextos, como consultas resumen, tablas dinámicas o gráficos dinámicos.

Como parte de un repaso adicional, a continuación te invito a consultar los videos del canal Officefacil relacionados con la unión de hojas y archivos en Excel, lo que complementará tu comprensión de los conceptos aprendidos.

Unir varias hojas en una tabla de Excel | fácil sin programación de Officefacil (Officefacil, 2022)

Unir varios archivos en una sola tabla de Excel | Fácil Sin programación de Officefacil (Ofiicefacil, 2022).

En la próxima clase digital, «Optimización y Prácticas Avanzadas», profundizaremos aún más en Power Query. Exploraremos cómo configurar la carga y actualización automática de consultas de datos en MS-Excel, así como la construcción de consultas internas y prácticas avanzadas. También compartiremos consejos y mejores prácticas en Power Query.

Agradezco tu dedicación y participación en esta clase, y te exhorto a completar las actividades correspondientes y el examen relacionado con este tema. ¡Espero verte en la próxima clase mientras continuamos explorando las capacidades de Power Query en Excel!