Diseñar, implementar y validar un pipeline de generación sintética parametrizable que integre recreación física de condiciones adversas (noche, reflejos, oclusiones, IR), inserción controlada de objetos y aumentos fotométricos, orientado a la creación de conjuntos de datos para el entrenamiento de modelos de visión artificial. El pipeline garantizará la reproducibilidad, trazabilidad y el control del dominio, facilitando la generación eficiente y controlada de datos sintéticos para su posterior uso en evaluación y comparación externa del rendimiento de modelos basados en datos reales, sintéticos o mixtos.
Objetivos técnicos:
· Construcción de un generador de complejidad en escenas: crear escenas parametrizables que reproduzcan condiciones adversas reales (noche, reflejos, oclusiones, respuesta IR)
· Construcción de un generador de objetos en escenas: ubicar objetos realistas en zonas específicas del entorno respetando perspectiva, iluminación y oclusiones para aumentar casos raros o aumentar los elementos de una clase minoritaria.
· Domain Randomization: variación sistemática de texturas, iluminación, posición y efectos (ruido, motion blur) para ampliar cobertura del espacio operativo.
· Aplicación de aumentos fotométricos: integración de aumentaciones para simulación climática, blur y cambios de color intentando alcanzar una solución con alta reproducibilidad
· Definición y creación de un pipeline integrador: diseño de un flujo modular que genere conjuntos de datos sintéticos con trazabilidad, facilitando exportación y gestión de versiones.
· Validación y Pruebas Rigurosas: preparar datos para entrenamiento y validación de modelos fuera del pipeline, garantizando soporte para comparaciones a nivel de métricas entre datos reales, sintéticos y mixtos.
· Acceso a hardware y software para el desarrollo y prueba de modelos de IA.
· Asesoramiento técnico y apoyo de expertos en visión por computadora y aprendizaje profundo.
El entregable incluirá:
· Generador sintético con documentación de parámetros y guías de edición.
· Datasets sintéticos exportados (imágenes + etiquetas) y scripts de conversión/validación.
· Resultados de entrenamiento: pipelines, pesos, configuraciones y métricas.
· Informe comparativo real vs. sintético y mixto, con comentarios de análisis y recomendaciones de despliegue.
· Receta reproducible (preferiblemente dockerizada) y README de ejecución y detalles de despliegue.
· Código resultante.