Ingénieur des données - expert en terminologies - h/f

INSERM

Paris
2 985-4 380 €/mois
CDD
Temps-plein

Il y a 21 jours

Description entreprise :L’Institut pour la Recherche en Santé Publique (IReSP, ) est un groupement d’intérêt scientifique (GIS) créé en 2007 dont l'Inserm est l'organisme gestionnaire. Son objectif est de développer, structurer et promouvoir la recherche en Santé Publique. L’IReSP soutient la recherche en Santé Publique par différents moyens, et en particulier au travers d’appels à projets, et d’action de valorisation et d’animation. Il travaille également en étroite coordination avec l’Institut Thématique (IT) Santé Publique de l’Inserm dont l’objectif est de coordonner et organiser la recherche dans le domaine de la santé publique.Contexte du Projet :L'IReSP, en collaboration avec l'IT Santé Publique, développe un Portail national France Recherche en Santé Humaine (FReSH), qui a pour ambition de recenser l’ensemble des recueils de données individuelles en santé réalisés en France. Il s’agit de mettre en place le catalogue des métadonnées descriptives permettant aux utilisateurs la découverte des données sous-jacentes. L’enjeu technique du catalogue FReSH est d’agréger les métadonnées hétérogènes, avec différents protocoles d’acquisition, modèles de données, langues et référentiels.Cette initiative s’inscrit dans le prolongement, l’extension et la modernisation du site « Portail Epidémiologie France » ( ), porté par l’Inserm et ses partenaires qui existe depuis une dizaine d’années.Suivant les principes de la Science Ouverte, le projet FReSH vise à améliorer la visibilité au plan national et international des différentes recherches conduites en France, à promouvoir les collaborations entre équipes de recherche, et à faciliter la réutilisation secondaire des données.Le projet bénéficie du soutien de l’Etat dans le cadre du plan « France 2030 ».Description du poste :Mission principaleAu sein de l’équipe projet FReSH et en lien avec le prestataire informatique en charge de développement, la personne recrutée sera responsable de la gestion des flux d’harmonisation et de FAIRisation des métadonnées du catalogue. Elle apportera une expertise approfondie sur les ressources terminologiques et les standards de métadonnées et accompagnera la mise en œuvre des solutions de gestion des métadonnées développées par un prestataire informatique.Activités principales

Analyser les besoins du projet et définir les ressources terminologiques nécessaires pour assurer la cohérence et l'uniformité des métadonnées
Spécifier, tester et valider les terminologies servant à harmoniser les métadonnées et construire les vocabulaires contrôlés
Collaborer avec le prestataire chargé du développement informatique pour intégrer les ressources terminologiques et les standards de métadonnées dans le catalogue
Fournir une expertise technique lors de la conception et de l'implémentation des pipelines pour s'assurer que les données sont collectées, transformées et agrégées conformément aux standards établis et aux principes FAIR
Identifier et proposer les pistes d’amélioration des processus et des flux des données mis en place
Concevoir un framework d'alignement des terminologies dans le catalogue ; capitaliser sur les alignements réalisés pour les réutilisations futures
Travailler avec des interlocuteurs scientifiques pour générer et enrichir des correspondances grâce au cadre développé
Créer des correspondances pour divers formats et sources de métadonnées
Piloter l’alignement des métadonnées du catalogue avec les référentiels
Documenter les décisions techniques prises et les choix de conception relatifs aux ressources terminologiques et aux standards de métadonnées
Analyser et évaluer de la qualité des métadonnées du catalogue
Assurer une veille technologique autour des standards des métadonnées, l’interopérabilité
Agir en tant que porte-parole technique dans son domaine d'expertise

Activités associéesLa personne recrutée pourra être amenée à animer des groupes de travail et de coordonner les aspects relatifs à son champ d’expertise des actions mises en œuvre. Elle pourra également participer aux réunions avec les partenaires nationaux et internationaux.Profil recherché :Connaissances

Expertise approfondie des ressources terminologiques pertinents dans le domaine de la santé humaine (CIM, MeSH)
Expertise en data science et en data management (mise en œuvre de flux de traitement des données)
Connaissance approfondie des standards de métadonnées pertinents pour le domaine des données en santé (DDI, DCAT, DataCite)
Connaissances en technologies du web sémantique (RDF, OWL, SPARQL) et de Linked Data
Connaissance des principes et processus relatifs aux données, aux métadonnées, aux référentiels
Connaissance des principes de la science ouverte, du cycle de vie des données et des principes FAIR
Connaissance du domaine scientifique et médical, de la recherche en santé académique et clinique

Savoir-faire

Maîtrise de différents logiciels professionnels couramment utilisés dans le secteur d'activité
Expérience de modélisation des données, création de flux des données, intégration de données hétérogènes
Maîtrise des bases de données structurées et non structurées
Pratique avancée d’au moins un langage de programmation (de préférence, Python, R, SQL, etc.)
Expérience en intégration de données et de web services
Expérience dans le fonctionnement des interfaces de programmation d’application (API REST)
Expérience de la méthodologie et des outils de développement agile (ex. Jira)
Capacité à comprendre les besoins métier et à traduire ces besoins en exigences techniques
Savoir transmettre des compétences et animer des ateliers et formations
Très bon niveau d’anglais oral et écrit

Aptitudes

Excellentes capacités d'analyse et de résolution de problèmes
Capacité à prendre des décisions et à faire preuve de discernement
Faire preuve d’organisation, de réactivité, de rigueur et de méthode
Capacité à se saisir de nouveaux sujets et de monter en compétences rapidement
Communication orale et écrite efficace
Travailler en autonomie et également en équipe

Expérience(s) souhaité(s)

Une expérience confirmée (minimum 3 ans) dans l’ingénierie de données, de préférence des données de recherche dans le domaine de la santé

Niveau de diplôme et formation(s)

Niveau Master 2+ ou ingénieur, en informatique médicale, ingénierie linguistique, ingénierie des données, science des données ou autre domaine pertinent

INSERM

Postuler