H/F Ingénieur-e développement full stack pour la bibliométrie

CNRS

  • Paris
  • 2 866-3 491 €/mois
  • CDD
  • Temps-plein
  • Il y a 20 jours
L'ingénieur-e de recherche sera le développeur principal d'un nouvel environnement pour le logiciel CNRS GarganText permettant d'étendre ce dernier à l'exploration de données de citation et d'informations géographiques. Il s'agira d'un micro-service GarganText permettant de situer un corpus d'une revue scientifique dans son contexte d'environnement de citation et de localisation géographique des auteurs et des sujets d'articles, en complément de son environnement sémantique.ActivitésTravailler à rendre compatible avec une intégration GarganText des bases de données partagées de l'historique et du suivi des soumissions et des publications du journal Cybergeo (à partir de la base Access actuelle et à partir de la base de la revue en ligne),
Travailler sur les spécifications requises pour intégrer ces données dans l'environnement GarganText,
Développer des éléments de back-end permettant (en Haskell) la prise en compte de ces nouvelles meta-données (citation et géographie) dans GarganText et la construction et l'analyse de réseaux de citation,
Développer des éléments de front-end interactif (en purescript) permettant l'analyse et l'exploration interactive des réseaux de citation, ainsi que la visualisation de cartes géographiques,
Travailler à l'intégration dans les cartes sémantiques actuelles de GarganText des éléments de citation et des données géographiques,
Intégrer ces composantes dans des interfaces logiciels en tant que web service (en particulier au sein de GarganText : https://gargantext.org),
Analyser, critiquer et représenter les données et discuter les résultats issus de leur analyse,
Faire de la veille technologique sur les nouvelles approches dans le domaine de la gestion de bases de données, de l'analyse de données et de la visualisation d'information,
Participer à la diffusion des résultats auprès de la communauté scientifique nationale et internationale dans sa spécialité (publications, colloques),
Participer à l'élaboration d'un cahier des charges,
Établir une documentation des outils déployés.CompétencesProgrammation d'applications web (front-end et back-end), des compétences dans des langages fonctionnels est un plus ou devront être acquises (Haskell, Purescript : langages utilisés par GarganText), ainsi que des langages R et Java (langages du prototype d'application sur laquelle le travail se basera)
Architecture logicielle,
Connaissance et pratique des bases de données : SQL (PostgreSQL, MySQL), MongoDB, Access.
Connaissance des technologies web (react JS, purescript, javascript, html5, CSS),
Connaissance des technologies de visualisation d'information, de manipulation de graphes complexes et des librairies associées (ex. : Sigma.js, D3.js, Echarts, Polymaps, networkX, etc.),
Connaissance des technologies de cartographie interactive (Leaflet) est un plus,
Connaissance des méthodes de traitement automatique de la langue et de fouille de texte est un plus,
Maîtrise des méthodes d'analyse et de représentation de données numériques, graphiques et des méthodes d'analyse et de cartographie de réseaux,
Maîtrise les méthodes de visualisation d'information et d'analyse exploratoire de données,
Maîtrise des techniques de présentation orale ou écrite.Anglais : lu, écrit parlé : bonnes connaissancesContexte de travailLe projet CybergeoNetworks2, soutenu par l'INSHS et porté par la revue Cybergeo (https://journals.openedition.org/cybergeo/) et l'Institut des Systèmes Complexes de Paris Île-de-France (http://iscpif.fr), vise à produire une application d'analyse bibliométrique permettant de situer les publications dans leur contexte scientifique, qui deviendra un outil d'aide à l'écriture pour les auteurs d'articles (en particulier pour rédiger un état de la question) et de mise en contexte des articles reçus pour les évaluateurs (positionnement dans les rubriques ; choix des lecteurs à solliciter ; enrichissement des suggestions d'amélioration par les lecteurs). Dans un premier temps adapté à cette revue, le projet aura pour vocation d'être générique et transposable à d'autres revues en SHS.
Cette application se basera sur le prototype développé par le laboratoire Géographie-cités lors du premier projet CybergeoNetworks à l'occasion des 20 ans de la revue en 2016 (accès à l'application en ligne : https://analytics.huma-num.fr/geographie-cites/cybergeonetworks/ et code source : https://github.com/Geographie-cites/cybergeo20 ) : il s'agira dans un premier temps de redévelopper ses fonctionnalités, et éventuellement de les étendre. Ce développement se placera dans le cadre de l'écosystème GarganText, logiciel libre de fouille de texte et d'exploration de corpus développé par l'ISC-PIF (https://gargantext.org), dans le but d'intégrer l'application comme plugin, afin de bénéficier des fonctionnalités déjà implémentées et de verser au code de GarganText de nouvelles fonctionnalités comme l'exploration interactive de cartes géographiques.
Le poste nécessitera de travailler au sein de l'écosystème GarganText et sera hébergé à l'ISC-PIF (113 rue Nationale, 75013 Paris) sous la responsabilité d'Alexandre Delanoë, chef de projet de GarganText, au sein de l'équipe Humanités Numériques et Science sociales computationnelles. Il sera co-encadré par Juste Raimbault (directeur de rubrique du journal Cybergeo et développeur du prototype, chercheur au laboratoire LaSTIG - IGN/ENSG), piloté par l'équipe de direction du journal, et suivi par la responsable éditoriale du journal Christine Kosmopoulos et l'ancienne directrice Denise Pumain.

CNRS