Ingénieur des données - expert en terminologies - h/f
INSERM
- Paris
- 2 985-4 380 €/mois
- CDD
- Temps-plein
- Analyser les besoins du projet et définir les ressources terminologiques nécessaires pour assurer la cohérence et l'uniformité des métadonnées
- Spécifier, tester et valider les terminologies servant à harmoniser les métadonnées et construire les vocabulaires contrôlés
- Collaborer avec le prestataire chargé du développement informatique pour intégrer les ressources terminologiques et les standards de métadonnées dans le catalogue
- Fournir une expertise technique lors de la conception et de l'implémentation des pipelines pour s'assurer que les données sont collectées, transformées et agrégées conformément aux standards établis et aux principes FAIR
- Identifier et proposer les pistes d’amélioration des processus et des flux des données mis en place
- Concevoir un framework d'alignement des terminologies dans le catalogue ; capitaliser sur les alignements réalisés pour les réutilisations futures
- Travailler avec des interlocuteurs scientifiques pour générer et enrichir des correspondances grâce au cadre développé
- Créer des correspondances pour divers formats et sources de métadonnées
- Piloter l’alignement des métadonnées du catalogue avec les référentiels
- Documenter les décisions techniques prises et les choix de conception relatifs aux ressources terminologiques et aux standards de métadonnées
- Analyser et évaluer de la qualité des métadonnées du catalogue
- Assurer une veille technologique autour des standards des métadonnées, l’interopérabilité
- Agir en tant que porte-parole technique dans son domaine d'expertise
- Expertise approfondie des ressources terminologiques pertinents dans le domaine de la santé humaine (CIM, MeSH)
- Expertise en data science et en data management (mise en œuvre de flux de traitement des données)
- Connaissance approfondie des standards de métadonnées pertinents pour le domaine des données en santé (DDI, DCAT, DataCite)
- Connaissances en technologies du web sémantique (RDF, OWL, SPARQL) et de Linked Data
- Connaissance des principes et processus relatifs aux données, aux métadonnées, aux référentiels
- Connaissance des principes de la science ouverte, du cycle de vie des données et des principes FAIR
- Connaissance du domaine scientifique et médical, de la recherche en santé académique et clinique
- Maîtrise de différents logiciels professionnels couramment utilisés dans le secteur d'activité
- Expérience de modélisation des données, création de flux des données, intégration de données hétérogènes
- Maîtrise des bases de données structurées et non structurées
- Pratique avancée d’au moins un langage de programmation (de préférence, Python, R, SQL, etc.)
- Expérience en intégration de données et de web services
- Expérience dans le fonctionnement des interfaces de programmation d’application (API REST)
- Expérience de la méthodologie et des outils de développement agile (ex. Jira)
- Capacité à comprendre les besoins métier et à traduire ces besoins en exigences techniques
- Savoir transmettre des compétences et animer des ateliers et formations
- Très bon niveau d’anglais oral et écrit
- Excellentes capacités d'analyse et de résolution de problèmes
- Capacité à prendre des décisions et à faire preuve de discernement
- Faire preuve d’organisation, de réactivité, de rigueur et de méthode
- Capacité à se saisir de nouveaux sujets et de monter en compétences rapidement
- Communication orale et écrite efficace
- Travailler en autonomie et également en équipe
- Une expérience confirmée (minimum 3 ans) dans l’ingénierie de données, de préférence des données de recherche dans le domaine de la santé
- Niveau Master 2+ ou ingénieur, en informatique médicale, ingénierie linguistique, ingénierie des données, science des données ou autre domaine pertinent