Data Scientist, spécialiste de la fouille de données H/FIRD
France
Description du poste
Sous la responsabilité de Caroline Doucouré, responsable de l’équipe « EcosFAIR » et en étroite relation avec la D-DUNI et la Groupe de travail Intelligence Artificielle de l’IRD, l’ingénieur ou l’ingénieure mettra en œuvre des méthodes et des outils de fouille de texte dans le but de valoriser le patrimoine documentaire de l’IRD. En coordination avec les ingénieurs de la science de l’information, il ou elle élaborera des prototypes de service pour répondre aux besoins des scientifiques, des partenaires et de la gouvernance.
Les activités principales de l’ingénieur seront les suivantes :
· Organiser les corpus de documents dédiés pour les scientifiques, à partir du système d’information documentaire Horizon pleins textes
· Mettre en place des protocoles et des méthodologies de créations automatisées des corpus pour répondre aux besoins des unités de recherche, des partenaires sud et de la gouvernance
· Fouiller les informations dans les corpus de documents de la base Horizon
· Mettre en œuvre l’apprentissage ou le fine-tuning (RAG) de modèles larges de langages (LLM) à partir de corpus de documents et de la base Horizon
· Prototyper et tester les services auprès des scientifiques et de la gouvernance
En lien avec l’équipe de gestion du patrimoine documentaire :
· Participation au maintien et enrichissement du fonds documentaire de l’IRD
· Participer à des communautés nationales et internationales de pratiques sur la fouille de texte dans les bibliothèques numériques
· Participer aux développements des statistiques d’usage des documents numériques à l’IRD.
· Participer à des réseaux métiers
Profil recherché
Vous avez développé les compétences suivantes :
· Compétences en programmation et bonne compréhension des structures de données,
· Maîtrise des méthodes et outils de fouille de textes, et de traitement du langage naturel (NLP/TAL),
· Maîtrise des méthodes d'apprentissage automatique et de l'analyse statistique,
· Maîtrise de Linux
· Connaissances des bases de données documentaires scientifiques
Vous faites preuve des qualités humaines suivantes :
· Vous êtes rigoureux et savez organiser votre travail en autonomie.
· Vous faites preuve de curiosité et vous avez de bonnes capacités d’adaptation.
· Vous possédez un esprit d’analyse et de synthèse ainsi que des compétences rédactionnelles.
· Vous disposez d’un bon relationnel.
· Vous avez un goût prononcé pour le travail en équipe dans un environnement multiculturel.
Localisation
France
Localisation
France