Contribuer à l’évaluation, au test et à l’amélioration d’agents d’intelligence artificielle autonomes en analysant leurs comportements, leurs architectures logicielles et leurs performances dans des environnements multi-modèles.
Missions principales
Concevoir des grilles d’évaluation avec des critères objectifs de validation des agents IA
Analyser et debugger les traces d’exécution pour identifier les erreurs et dysfonctionnements
Tester la robustesse des systèmes face à des cas complexes, limites et attaques (prompt injection, mauvaise utilisation d’outils)
Évaluer des architectures logicielles modulaires et des systèmes backend
Analyser les interactions multi-tours entre systèmes et utilisateurs
Fournir des retours techniques détaillés pour l’entraînement de modèles IA
Participer à des tâches techniques flexibles après onboarding
Compétences attendues
Expérience en développement backend, automation IA ou systèmes complexes
Maîtrise d’au moins deux langages de programmation (Python, JavaScript, Go ou Java)
Bonne connaissance des bases de données SQL
Expérience en développement de systèmes en production avec architecture modulaire
Capacité à analyser des interactions systèmes complexes et multi-composants
Profil recherché
Profil technique orienté développement logiciel ou ingénierie backend
Expérience sur systèmes en production et environnements réels
Bonne capacité d’analyse et rigueur technique
Autonomie dans un environnement remote et flexible
Intérêt pour l’intelligence artificielle et les systèmes agentiques