Poblacion sintetica por año
Dataset de poblacion sintetica anual generado a partir de insumos censales y de EPH. Se utiliza para pruebas, muestreos de alta velocidad y validaciones de consistencia espacial.
Contrato de exportacion
- Patron de nombre:
table_f[FRAC]_[YEAR]_[COUNTRY].csv
[FRAC]
: fraccionamiento usado en la generacion, ejemplo0.005
[YEAR]
: año de referencia, ejemplo2015
[COUNTRY]
: ISO3 pais, ejemploARG
- Ejemplo:
table_f0.005_2015_ARG.csv
exports:
- path: /exports/table_f0.005_2015_ARG.csv
sha256: "<sha256>"
rows: "<n>"
year: 2015
country: "ARG"
frac: 0.005
Columnas minimas
TODO completar segun tu pipeline actual. Sugerencia de base:
ID
string. Identificador de persona sinteticaHOGAR_REF_ID
string. Identificador de hogarANO4
int. AñoPROV
,DPTO
,AGLOMERADO
,RADIO_REF_ID
claves geo- Atributos demograficos y laborales segun version de generacion
Dependencias
- Censo 2010 variables normalizadas
- Armonizacion Censo EPH
- Deflactores e insumos para escalas de equivalencia si aplica
QA minimo
- Unicidad por
ID
y cobertura deHOGAR_REF_ID
- Dominio de claves geo y consistencia con capas anuales
frac
consistente con tamaño observado- Documentar cualquier reponderacion posterior a la generacion
Edge cases
- Formato de
FRAC
: usar punto decimal. Si se ofrece aliasf005
, documentar equivalencia y no mezclar estilos - Versionado: si cambia la logica de generacion, emitir nuevo archivo y registrar
sha256
distinto
Referencias cruzadas
- DBML fuente de verdad
- Geometrias geoespaciales
- Playbook de orquestacion de muestreos