Ejercicio 42: Análisis y Visualización de Datos con Gráficos en Pandas y Seaborn

Este ejercicio tiene como objetivo que los estudiantes trabajen con visualización de datos en Python, utilizando Pandas y Seaborn para explorar, analizar y comunicar información de manera efectiva. Se proporcionarán dos conjuntos de datos con información sobre precios del biodiésel en Argentina y posesión de teléfonos móviles.

Objetivos

  1. Cargar los datasets y explorar su estructura.
  2. Generar visualizaciones adecuadas para cada conjunto de datos.
  3. Analizar y justificar la elección del tipo de gráfico.
  4. Reflexionar sobre el propósito de la visualización.
  5. Responder preguntas basadas en los datos, justificando con evidencia gráfica.

Parte A: Carga y Exploración de los Datos

Se proporcionan los siguientes datasets:

  1. Precios del Biodiésel en Argentina

    • Contiene información sobre los precios del biodiésel en distintos períodos en Argentina.
    • Incluye columnas con fechas y valores de precios en distintos momentos del tiempo.
  2. Poseedores de Teléfonos Móviles

    • Contiene información sobre la posesión de teléfonos móviles en distintos grupos etarios.
    • Incluye variables categóricas y numéricas relacionadas con la edad y tipo de dispositivo.

Tareas

  1. Cargar ambos datasets en Pandas y explorar su contenido.
  2. Verificar valores nulos y realizar un resumen estadístico de cada dataset.
  3. Identificar el tipo de variables presentes en cada conjunto de datos.

Pregunta de reflexión

¿Qué diferencias existen entre las variables de cada dataset y cómo afectan la visualización?

Parte B: Generación de Visualizaciones y Análisis

Se deberán generar gráficos para representar los datos de manera efectiva.

Tareas

  1. Dataset: Precios del Biodiésel en Argentina

    • Crear una serie temporal con los precios del biodiésel a lo largo del tiempo.
    • Evaluar tendencias y patrones en la evolución del precio.
    • Mejorar la visualización agregando etiquetas, colores y estilos apropiados.
  2. Dataset: Poseedores de Teléfonos Móviles

    • Generar un gráfico adecuado para comparar la cantidad de personas que poseen distintos tipos de teléfonos según edad.
    • Evaluar la relación entre edad y posesión de teléfonos inteligentes.
    • Responder la afirmación: “Es más probable que las personas mayores posean un teléfono inteligente que las personas más jóvenes.”
      • Justificar visualmente con gráficos apropiados.
  3. Reflexión sobre la Visualización

    • ¿Cuál fue el objetivo de cada visualización? (Exploración, Explicación, Otro)
    • ¿Qué tipo de variables estaban en juego? (Numéricas, Categóricas, Temporales)
    • ¿Por qué se eligió cierto tipo de gráfico y qué conclusiones se obtuvieron?
    • ¿Se mejoró alguna característica del gráfico para hacer más claro el mensaje?

Pregunta de reflexión

¿Cómo se puede mejorar la comunicación visual de los datos?

Parte C: Presentación de Resultados y Debate en Clase

Los estudiantes deberán presentar y discutir sus hallazgos.

Tareas

  1. Presentar los gráficos generados y los insights clave obtenidos.
  2. Comparar enfoques con otros compañeros y analizar diferencias en las elecciones gráficas.
  3. Reflexionar sobre cómo las visualizaciones afectan la interpretación de los datos.

Pregunta de reflexión

¿Qué elementos influyen en la claridad y efectividad de un gráfico?

Entrega esperada

  • Código en Python bien estructurado con generación de visualizaciones.
  • Gráficos bien diseñados, con etiquetas y estilos adecuados.
  • Justificación de las elecciones gráficas y discusión sobre los resultados.
  • Respuesta visualmente argumentada a la afirmación sobre posesión de teléfonos.
# Código base para cargar y explorar los datasets

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar los datasets
biodiesel_df = pd.read_csv('biodiesel_precios.csv')
telefonos_df = pd.read_csv('telefonos_moviles.csv')

# Explorar los datasets
print(biodiesel_df.head())
print(telefonos_df.head())

# TODO: Implementar
# Pruebas y ejemplos de visualización

# Ejemplo de serie temporal para precios del biodiésel
sns.lineplot(data=biodiesel_df, x='fecha', y='precio')
plt.title('Evolución del Precio del Biodiésel en Argentina')
plt.xlabel('Fecha')
plt.ylabel('Precio')
plt.show()

# TODO: Implementar visualización para posesión de teléfonos móviles

Este ejercicio busca que los estudiantes utilicen gráficos para convertir datos en información comprensible y accionable.