Ejercicio 42: Análisis y Visualización de Datos con Gráficos en Pandas y Seaborn
Este ejercicio tiene como objetivo que los estudiantes trabajen con visualización de datos en Python, utilizando Pandas y Seaborn para explorar, analizar y comunicar información de manera efectiva. Se proporcionarán dos conjuntos de datos con información sobre precios del biodiésel en Argentina y posesión de teléfonos móviles.
Objetivos
- Cargar los datasets y explorar su estructura.
- Generar visualizaciones adecuadas para cada conjunto de datos.
- Analizar y justificar la elección del tipo de gráfico.
- Reflexionar sobre el propósito de la visualización.
- Responder preguntas basadas en los datos, justificando con evidencia gráfica.
Parte A: Carga y Exploración de los Datos
Se proporcionan los siguientes datasets:
Precios del Biodiésel en Argentina
- Contiene información sobre los precios del biodiésel en distintos períodos en Argentina.
- Incluye columnas con fechas y valores de precios en distintos momentos del tiempo.
Poseedores de Teléfonos Móviles
- Contiene información sobre la posesión de teléfonos móviles en distintos grupos etarios.
- Incluye variables categóricas y numéricas relacionadas con la edad y tipo de dispositivo.
Tareas
- Cargar ambos datasets en Pandas y explorar su contenido.
- Verificar valores nulos y realizar un resumen estadístico de cada dataset.
- Identificar el tipo de variables presentes en cada conjunto de datos.
Pregunta de reflexión
¿Qué diferencias existen entre las variables de cada dataset y cómo afectan la visualización?
Parte B: Generación de Visualizaciones y Análisis
Se deberán generar gráficos para representar los datos de manera efectiva.
Tareas
Dataset: Precios del Biodiésel en Argentina
- Crear una serie temporal con los precios del biodiésel a lo largo del tiempo.
- Evaluar tendencias y patrones en la evolución del precio.
- Mejorar la visualización agregando etiquetas, colores y estilos apropiados.
Dataset: Poseedores de Teléfonos Móviles
- Generar un gráfico adecuado para comparar la cantidad de personas que poseen distintos tipos de teléfonos según edad.
- Evaluar la relación entre edad y posesión de teléfonos inteligentes.
- Responder la afirmación: “Es más probable que las personas mayores posean un teléfono inteligente que las personas más jóvenes.”
- Justificar visualmente con gráficos apropiados.
Reflexión sobre la Visualización
- ¿Cuál fue el objetivo de cada visualización? (Exploración, Explicación, Otro)
- ¿Qué tipo de variables estaban en juego? (Numéricas, Categóricas, Temporales)
- ¿Por qué se eligió cierto tipo de gráfico y qué conclusiones se obtuvieron?
- ¿Se mejoró alguna característica del gráfico para hacer más claro el mensaje?
Pregunta de reflexión
¿Cómo se puede mejorar la comunicación visual de los datos?
Parte C: Presentación de Resultados y Debate en Clase
Los estudiantes deberán presentar y discutir sus hallazgos.
Tareas
- Presentar los gráficos generados y los insights clave obtenidos.
- Comparar enfoques con otros compañeros y analizar diferencias en las elecciones gráficas.
- Reflexionar sobre cómo las visualizaciones afectan la interpretación de los datos.
Pregunta de reflexión
¿Qué elementos influyen en la claridad y efectividad de un gráfico?
Entrega esperada
- Código en Python bien estructurado con generación de visualizaciones.
- Gráficos bien diseñados, con etiquetas y estilos adecuados.
- Justificación de las elecciones gráficas y discusión sobre los resultados.
- Respuesta visualmente argumentada a la afirmación sobre posesión de teléfonos.
# Código base para cargar y explorar los datasets
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Cargar los datasets
biodiesel_df = pd.read_csv('biodiesel_precios.csv')
telefonos_df = pd.read_csv('telefonos_moviles.csv')
# Explorar los datasets
print(biodiesel_df.head())
print(telefonos_df.head())
# TODO: Implementar
# Pruebas y ejemplos de visualización
# Ejemplo de serie temporal para precios del biodiésel
sns.lineplot(data=biodiesel_df, x='fecha', y='precio')
plt.title('Evolución del Precio del Biodiésel en Argentina')
plt.xlabel('Fecha')
plt.ylabel('Precio')
plt.show()
# TODO: Implementar visualización para posesión de teléfonos móviles
Este ejercicio busca que los estudiantes utilicen gráficos para convertir datos en información comprensible y accionable.