Ejercicio 7: De Listas Anidadas a Arrays y DataFrames

En este ejercicio, los estudiantes explorarán las dificultades de trabajar con listas de listas, cómo NumPy puede facilitar las operaciones y, finalmente, comprenderán por qué Pandas es la herramienta ideal para manipular datos estructurados.

Objetivos

  • Experimentar con listas de listas en Python.
  • Convertir listas de listas a arrays utilizando NumPy.
  • Manipular datos estructurados utilizando Pandas.

Entrada de Datos

  • Una lista de listas que contiene información de empleados:
    • DNI
    • Edad
    • Cantidad de Hijos
    • Salario
empleados = [
    [20222333, 45, 2, 20000],
    [33456234, 40, 0, 25000],
    [45432345, 41, 1, 10000],
    [43967304, 37, 0, 12000],
    [42236276, 36, 0, 18000]
]

Ejercicio

1. Manipulación de Listas de Listas

Tareas

  • Filtrar manualmente los empleados que ganan más de $15,000.
  • Calcular el salario promedio de la lista.
  • Obtener el DNI del empleado más joven.

Código Base

# TODO: Implementar

2. Convertir a un NumPy Array

Tareas

  • Convertir la lista a un NumPy array.
  • Usar NumPy para filtrar los empleados con salario mayor a $15,000.
  • Calcular la media del salario.
  • Obtener el DNI del empleado más joven.

Código Base

import numpy as np

empleados_array = np.array(empleados)

# TODO: Implementar

3. Convertir a un pandas.DataFrame

Tareas

  • Convertir el array a un pandas.DataFrame.
  • Filtrar empleados con salario mayor a $15,000.
  • Obtener el salario promedio.
  • Encontrar el empleado más joven.

Código Base

import pandas as pd

df = pd.DataFrame(empleados_array, columns=["DNI", "Edad", "Cantidad de Hijos", "Salario"])

# TODO: Implementar

Pruebas

Ejemplo de Prueba

  1. Listas de Listas

    • Filtrar empleados: [20222333, 33456234, 42236276]
    • Salario promedio: 17000
    • DNI del empleado más joven: 43967304
  2. NumPy Array

    • Filtrar empleados: [20222333, 33456234, 42236276]
    • Salario promedio: 17000
    • DNI del empleado más joven: 43967304
  3. pandas.DataFrame

    • Filtrar empleados: [20222333, 33456234, 42236276]
    • Salario promedio: 17000
    • DNI del empleado más joven: 43967304

Este ejercicio está diseñado para que los estudiantes comprendan la evolución de la manipulación de datos desde listas de listas hasta el uso de herramientas avanzadas como NumPy y Pandas, y cómo estas herramientas facilitan el trabajo en ciencia de datos.