Ejercicio 7: De Listas Anidadas a Arrays y DataFrames
En este ejercicio, los estudiantes explorarán las dificultades de trabajar con listas de listas, cómo NumPy puede facilitar las operaciones y, finalmente, comprenderán por qué Pandas es la herramienta ideal para manipular datos estructurados.
Objetivos
- Experimentar con listas de listas en Python.
- Convertir listas de listas a arrays utilizando NumPy.
- Manipular datos estructurados utilizando Pandas.
Entrada de Datos
- Una lista de listas que contiene información de empleados:
- DNI
- Edad
- Cantidad de Hijos
- Salario
empleados = [
[20222333, 45, 2, 20000],
[33456234, 40, 0, 25000],
[45432345, 41, 1, 10000],
[43967304, 37, 0, 12000],
[42236276, 36, 0, 18000]
]
Ejercicio
1. Manipulación de Listas de Listas
Tareas
- Filtrar manualmente los empleados que ganan más de $15,000.
- Calcular el salario promedio de la lista.
- Obtener el DNI del empleado más joven.
Código Base
# TODO: Implementar
2. Convertir a un NumPy Array
Tareas
- Convertir la lista a un
NumPy array
. - Usar NumPy para filtrar los empleados con salario mayor a $15,000.
- Calcular la media del salario.
- Obtener el DNI del empleado más joven.
Código Base
import numpy as np
empleados_array = np.array(empleados)
# TODO: Implementar
3. Convertir a un pandas.DataFrame
Tareas
- Convertir el array a un
pandas.DataFrame
. - Filtrar empleados con salario mayor a $15,000.
- Obtener el salario promedio.
- Encontrar el empleado más joven.
Código Base
import pandas as pd
df = pd.DataFrame(empleados_array, columns=["DNI", "Edad", "Cantidad de Hijos", "Salario"])
# TODO: Implementar
Pruebas
Ejemplo de Prueba
Listas de Listas
- Filtrar empleados:
[20222333, 33456234, 42236276]
- Salario promedio:
17000
- DNI del empleado más joven:
43967304
- Filtrar empleados:
NumPy Array
- Filtrar empleados:
[20222333, 33456234, 42236276]
- Salario promedio:
17000
- DNI del empleado más joven:
43967304
- Filtrar empleados:
pandas.DataFrame
- Filtrar empleados:
[20222333, 33456234, 42236276]
- Salario promedio:
17000
- DNI del empleado más joven:
43967304
- Filtrar empleados:
Este ejercicio está diseñado para que los estudiantes comprendan la evolución de la manipulación de datos desde listas de listas hasta el uso de herramientas avanzadas como NumPy y Pandas, y cómo estas herramientas facilitan el trabajo en ciencia de datos.