Participer à l’évaluation et à l’amélioration d’agents IA autonomes et contribuer à l’entraînement de modèles LLM sur des workflows techniques complexes avec un impact direct sur la performance et la fiabilité des systèmes IA.
Missions principales
Évaluation d’agents IA et analyse des comportements multi-étapes
Rédaction de critères d’évaluation avec validation objective des résultats
Debug et analyse des traces d’exécution afin d’identifier les défaillances
Tests de robustesse sur les cas limites, injections de prompts et usages détournés des outils
Évaluation d’architectures logicielles modulaires en environnement de production
Analyse des interactions systèmes et fourniture de feedbacks techniques pour l’entraînement des LLM
Participation au processus de mission via onboarding, évaluation technique et réalisation de tâches flexibles
Compétences attendues
Expérience en backend engineering, automatisation IA ou intégration de systèmes complexes
Maîtrise d’au moins deux langages parmi Python, JavaScript, Go ou Java
Bonne connaissance des bases de données SQL
Capacité à concevoir et maintenir des architectures logicielles modulaires
Compréhension des environnements de production et des interactions systèmes multi-turn
Connaissances en intégration d’API et outils connectés appréciées
Sensibilité aux problématiques de sécurité, confidentialité et prompt injection appréciée
Profil recherché
Expérience sur des projets techniques complexes ou systèmes IA
Capacité d’analyse, autonomie et rigueur technique
Aisance dans les environnements distants et les missions flexibles
Capacité à fournir des retours techniques détaillés et structurés