Ingeniero de IA — Sistemas de Voz en Producción

🌍 Remote, USA 🎯 Full-time 🕐 Posted Recently

Job Description

Serás responsable de la capa de IA de un agente de voz en tiempo real en producción — incluyendo el motor de conversación, el pipeline basado en eventos y los workflows del agente. Nivel: Mid–Senior Etapa: Producto en fase temprana (con clientes reales) Modalidad: Mayormente remoto Stack: OpenAI Realtime API · Python · AWS Arquitectura: Basada en eventos Idiomas: Inglés (obligatorio) · Español (comunicación interna) SOBRE EL ROL No buscamos un perfil tradicional de IA. Este rol está enfocado en construir sistemas en producción , NO en entrenar modelos, hacer experimentos o analizar datos. Trabajarás: De forma autónoma en modalidad asíncrona, con sincronización semanal Siendo responsable de tu servicio de IA de extremo a extremo: código, pruebas, CI/CD y despliegue Participando en decisiones de arquitectura (alineadas con el equipo antes de implementar) Construyendo para usuarios reales con estándares altos desde el inicio Aunque es un producto en etapa temprana, los estándares no lo son: se espera código limpio, documentación sólida y pruebas como práctica habitual. El inglés es obligatorio para código, documentación y comunicación . NO ES UN PERFIL ADECUADO SI Tu experiencia principal está en: Ciencia de datos (modelos, estadística, experimentos) Ingeniería de ML (pipelines de entrenamiento, despliegue de modelos) Prompt engineering únicamente (herramientas no-code) Investigación en IA (papers, teoría, benchmarks) REQUISITO OBLIGATORIO (NO NEGOCIABLE) Debes haber llevado a producción un producto real de IA de voz o audio en tiempo real. Debes tener experiencia directa con la OpenAI Realtime API , incluyendo: Ciclo de vida de sesiones Flujo de eventos Manejo de fallos Si esto es nuevo para ti, no apliques. EL SISTEMA QUE LIDERARÁS Un agente de voz con IA en producción construido sobre OpenAI Realtime API: Arquitectura basada en eventos (trigger pipeline respuesta) Conversación en tiempo real + clasificación de intención + captura de datos estructurados Orquestación de workflows con Relevance AI Serás responsable de ambas capas: Integración de IA Arquitectura de workflows y prompting Tú construyes, tú eres dueño, tú despliegas. No hay hand-offs. RESPONSABILIDADES 1. Integración con OpenAI Realtime API Gestionar el ciclo completo de sesiones (creación, tokens, eventos, cierre) Manejar fallos (sesiones caídas, errores de secuencia, timeouts, reconexión) Optimizar continuamente: Calidad de voz Latencia Naturalidad de la conversación 2. Arquitectura e Infraestructura (Event-driven) Diseñar y mantener el pipeline basado en eventos Garantizar confiabilidad, observabilidad y manejo robusto de errores Ser responsable del stack completo: CI/CD Infraestructura Despliegues en múltiples entornos 3. Workflows de Agentes y Prompting Diseñar workflows multi-paso en Relevance AI: Clasificación Enrutamiento Uso de herramientas Captura de datos Construir prompts, function calling y lógica condicional Crear nuevos workflows desde cero Documentar y proponer arquitecturas antes de implementar 4. Calidad, Testing y Documentación Escribir y mantener pruebas con pytest (obligatorio) Aplicar estándares de calidad: Linting con ruff Controles en CI antes de cada merge Monitorear: Calidad de conversaciones Confiabilidad de eventos Costos de API Documentar todo en inglés Proponer cambios relevantes y alinearlos antes de ejecutar REQUISITOS Obligatorios (no negociables) Experiencia en producción con OpenAI Realtime API Python sólido (async/await, arquitectura limpia, pytest) Diseño de sistemas basados en eventos Function calling de LLM en producción Diseño de workflows de agentes (multi-paso, con estado) AWS: Lambda API Gateway DynamoDB SAM SSM Gestión completa de CI/CD (GitHub Actions, pipelines, despliegues) Inglés fluido (oral y escrito) Español (comunicación interna) Deseable Experiencia con Relevance AI o similares Fundamentos de WebRTC (SDP, ICE, signaling) FastAPI, Pydantic v2, httpx, Mangum Docker, ruff, freezegun Experiencia en startups STACK TECNOLÓGICO Core: OpenAI Realtime API · Python 3.11 · FastAPI · httpx · Pydantic v2 · Mangum Infraestructura: AWS Lambda · API Gateway · DynamoDB · SSM · SAM · S3 Herramientas: GitHub Actions · Docker · pytest · ruff · Relevance AI FORMA DE TRABAJO Trabajo asíncrono con sincronización semanal Alta autonomía y responsabilidad Alineación antes de implementar Ejecución rápida después de acordar Por favor envía tu CV con el link de tus repositorios y tu expectativa salarial al correo [email protected] Correos sin estos datos no se tendrán en cuenta...