STAGIAIRE - Pilote de projet informatique IA - LLM(6 Mois rémunérés) H/F
Commissariat à l'Énergie Atomique
- Gard
- Stage
- Temps-plein
- La conscience des responsabilités
- La coopération
- La curiosité
Au sein de cette direction, le Département Technique et appui aux Projets et Installations (DTPI) assure un soutien technique transverse aux installations de cette direction, sur les sites de Marcoule, Saclay, Fontenay aux Roses et Cadarache.
Au sein du DTPI, le Service de Technologie et Recherche pour le Démantèlement (STRD) a pour missions :
- D'apporter aux différentes unités projets de la direction en charge du démantèlement des installations du CEA un soutien pour l'expression de leurs besoins de technologies et procédés d'assainissement démantèlement ;
- D'identifier les partenaires capables de produire la R&D correspondant aux besoins identifiés ;
- De coordonner le développement des produits, leur qualification et conseiller les UDS et départements transverses sur l'utilisation de ces produits ou technologies ;
- De coordonner l'expertise technique spécifique à l'assainissement démantèlement et animer le pôle de compétences « démantèlement » ;
Dans un premier temps le stagiaire devra constituer une base de données à partir de la masse documentaire disponible. Il cherchera ensuite à déterminer quel modèle (GPT3, LLAMA2, Mistral…) sera le plus adapté à l'analyse de ces données, et produira une preuve de concept permettant de valoriser les informations contenues dans ces bases.
Le stage sera encadré par le responsable du calcul scientifique au STIC de Marcoule, dont la mission est d'accompagner les ingénieurs-chercheurs du CEA dans leurs travaux, en leur mettant à disposition des outils numériques (cluster de calcul, plateformes logicielles).Durée du contrat (en mois)6Description de l'offreStage IA (LLM, RAG) pour extraire des informations d'une base documentaire sur le démantèlement nucléaire. H/FVous souhaitez enrichir vos compétences dans le domaine du nucléaire et réussir votre stage de fin d'études ?N'hésitez plus, et rejoignez le CEA !Dans le cadre de sa mission sur la gestion du retour d'expérience (REX) le service STRD/GQTE dispose d'un large base documentaire constituée de milliers de documents.Cette documentation se compose de rapports techniques de retours d'expérience (REX), sous forme de PDF (ocerisés) et de base de connaissance type « WIKIMEDIA ».Les Large Language Models (LLMs) ont récemment montré leur capacité à assister les ingénieurs dans la rédaction de documentation technique, avec des outils comme ChatGPT. Les algorithmes de type RAG (Retrieval Augmented Generation) combinent les techniques de récupération de connaissances propres au domaine métier avec les techniques de génération qu'apportent les LLM. Les techniques RAG permettent de compléter les lacunes des LLMs : réduction des hallucinations, citation des sources des données, et meilleur lien effectué entre les faits extraits de différents documents.Moyens / Méthodes / Logiciels"Environnent de travail Linux, GPU (CUDA) Python (langchain)Profil du candidatDe nôtre côté, nous cherchons un profil :- De formation d'ingénieur et/ou M2 en informatique avec un fort intérêt pour l'intelligence artificielle et les modèles de langage.
Compétences requises :
- Notions de base sur l'apprentissage automatique et les réseaux de neurones.
- Des connaissances ou une première expérience avec les LLMs serait appréciée
- Environnent de travail Linux, GPU (CUDA)
- Python (langchain)
Qui donne une possibilité d'être en télétravail
Qui prône la mixité et la diversité
Qui est acteur majeur de la recherche dans le nucléaireLe CEA est un acteur engagé dans l'accueil, l'insertion et le maintien dans l'emploi des salariés en situation de handicap. Ainsi, si vous le souhaitez, vous pouvez également joindre tous documents justifiants de votre situation de handicap (RQTH, carte mobilité inclusion, pension d'invalidité, etc).Localisation du posteSiteMarcouleLocalisation du posteFrance, Occitanie, Gard (30)VilleChusclanCritères candidatLanguesAnglais (Intermédiaire)Diplôme préparéBac+5 - Master 2DemandeurDisponibilité du poste02/04/2024