Intervenir sur des sujets opérationnels avec un impact direct sur la performance et l’amélioration de systèmes d’intelligence artificielle et d’agents autonomes.
Missions principales
Évaluation et test d’agents IA sur différents cas d’usage
Rédaction de grilles d’évaluation avec critères objectifs
Analyse et debug des comportements des agents (traces, erreurs, limites)
Réalisation de stress tests (edge cases, prompt injection, mauvaise utilisation des outils)
Analyse d’architectures logicielles modulaires en environnement réel
Évaluation des interactions systèmes multi-étapes
Production de feedback technique structuré pour l’entraînement de modèles IA
Participation au workflow projet (onboarding, réalisation de tâches, livraisons)
Compétences attendues
Expérience en backend, automatisation IA ou systèmes complexes
Maîtrise d’au moins deux langages (Python, JavaScript, Go ou Java)
Expérience avec les bases de données SQL
Compréhension des architectures logicielles modulaires
Capacité à analyser des systèmes complexes et multi-interactions
Autonomie et capacité à travailler sur des missions flexibles
Profil recherché
Expérience sur des projets en environnement réel (production)
Capacité à identifier des failles (sécurité, prompt injection, gestion des accès)
À l’aise avec les systèmes d’IA et les workflows complexes