Artefactos intermedios de modelos RFC
Estandar para artefactos intermedios de entrenamiento y evaluacion de modelos. Aplica a playbooks de entrenamiento en EPH y al nowcast mensual.
Patron de nombres
- Formato:
RFC[STAGE]_[FRAC]_[DATE]_[COUNTRY].csv
[STAGE]
: etapa del pipeline, ejemplo1
,2
,3
[FRAC]
: fraccionamiento, ejemplo0.01
[DATE]
: fecha ISOYYYY-MM-DD
[COUNTRY]
: ISO3, ejemploARG
- Ejemplo:
RFC1_0.01_2018-05-15_ARG.csv
exports:
- path: /model/results/RFC1_0.01_2018-05-15_ARG.csv
sha256: "<sha256>"
stage: 1
date: "2018-05-15"
country: "ARG"
frac: 0.01
source_repo: "<org/repo>@<commit>"
seed: 123
model_version: "<tag>"
Reglas de reproducibilidad
- Fijar semillas y versionar dependencias del entorno
- Registrar
source_repo@commit
,seed
,model_version
- Inmutabilidad: si cambia el contenido, emitir un nuevo archivo con nuevo
sha256
QA minimo
- Forma esperada de columnas y tipos por etapa
- Coherencia de metricas frente a baseline de la etapa anterior
- Ausencia de NaN en columnas clave
- Compatibilidad de join con datasets canonicos si aplica
Politicas de almacenamiento
- Directorio
model/results
por defecto - No publicar
RFC*
en la carpeta de exports canonicos - Retencion acorde al ciclo de evaluacion del modelo
Referencias cruzadas
- Playbook 9 Entrenamiento y evaluacion en EPH
- Playbook 10 Nowcast mensual
- Politicas de versionado y fijacion de entorno