Stage - Ingénieur(e) NLP/ début mars 2025 H/F

Détail de l'offre

Informations générales

Entité de rattachement

L'Autorité des marchés financiers, autorité publique indépendante, est le régulateur de la place financière française. Nos 500 collaborateurs veillent à la protection de l'épargne, à l'information des investisseurs et au bon fonctionnement des marchés financiers au service de l'intérêt général.
Rejoindre l'AMF, c'est également s'ouvrir à un monde d'opportunités humaines et professionnelles. Nous avons à cœur d'accueillir, accompagner et développer les talents d'aujourd'hui et de demain.  

Référence

2024-780  

Votre contexte

Description du contexte

La Direction des données et de la surveillance (DDS) a pour missions de :

  • Détecter de potentiels manquements et analyser les tendances en matière de comportement des acteurs de marché, telles qu'elles se dégagent de l'ensemble des données rassemblées,
  • Structurer et mettre en œuvre la stratégie d'exploitation des données au bénéfice de l'ensemble des métiers de l'AMF, les accompagner vers un usage plus intensif des données à travers un recours aux nouvelles technologies.
  • La mission de surveillance des marchés, très consommatrice de données (de marchés et plus largement d'informations), a conduit l'AMF à construire une plateforme de surveillance reposant sur les technologies Big Data. Cette plateforme, en service depuis 2017, offre d'avantage d'autonomie aux métiers en leur facilitant l'exploitation des nouvelles sources de données et permet la mise en oeuvre d'approches innovantes (machine learning, Natural language processing..).

Créée le 1er décembre 2020, la DDS est chargée d'accompagner l'ensemble de l'AMF vers un usage plus intensif des données. Elle un rôle de service auprès des directions pour le prototypage puis l'industrialisation des outils d'exploitation des données, d'animation sur l'usages des données et leur gouvernance, mais également de promotion des initiatives métier pour les faire profiter au plus grand nombre.

Votre mission

Métier

IT, data et sécurité

Intitulé du poste

Stage - Ingénieur(e) NLP/ début mars 2025 H/F

Contrat

Stagiaires écoles

Durée du contrat

6 mois

Description de la mission

Dans le cadre des activités de la Direction des données et de la surveillance (DDS) de l’AMF, vous intégrerez le pôle Data Intelligence et vous aurez pour missions principales :

  • Contribuer au développement d'outils innovants : vous participerez activement à la conception et au développement d'outils exploitant les données textuelles réglementaires ainsi que les communications des fonds et émetteurs de titres financiers. Vous utiliserez pour cela les récentes avancées en traitement du langage naturel (NLP), en particulier les modèles de langage large (LLM). Ces outils s'appuieront sur une large palette de tâches et de techniques en NLP, telles que la recherche d'information, l'extraction d'information, le prompting, et le parsing sémantique. Vous contribuerez également à l'application des LLM pour répondre à des besoins plus transverses, permettant ainsi leur utilisation dans des contextes variés et pour des applications générales au sein de l'organisation.
  • Participer à des études avancées : vous serez impliqué dans des études explorant l’application des techniques NLP traditionnelles et des LLM pour une meilleure compréhension des informations publiées par les acteurs des marchés financiers et l'évolution de leurs pratiques. De plus, vous contribuerez à identifier des opportunités d'application des LLM dans d'autres domaines d'activité de l'AMF, en aidant à déployer ces technologies dans des secteurs variés, tels que l'automatisation des processus internes ou l'analyse de données non structurées. Vous partagerez les résultats de ces études à travers la rédaction de notes d’information, qui seront diffusées et présentées au sein de l'organisation, et dans certains cas, publiées pour un public plus large.
  • Contribuer à l’animation de la communauté IA de l’AMF: vous pourrez être amené à présenter vos travaux réalisés pendant le stage, et contribuerez à maintenir une veille sur les récentes avancées en IA.

Profil

Vous êtes actuellement étudiant(e) en dernière année de master ou diplôme d'ingénieur avec une spécialisation en data science, ou en informatique spécialisé en Traitement Automatique du Langage.

Vous possédez une solide expérience en développement Python, avec une maîtrise des concepts et des pratiques de programmation avancée. Votre intérêt pour l’intelligence artificielle et plus particulièrement pour les modèles de langage (LLM) vous a conduit à développer des compétences pointues dans ce domaine.

Vous êtes familier(ère) avec les technologies et frameworks essentiels au développement d’applications NLP. Vous maîtrisez les librairies Python de base comme Pandas, Numpy, et Scipy, et vous avez une bonne expérience des frameworks de deep learning tels que TensorFlow et PyTorch. De plus, vous avez travaillé avec des librairies spécialisées en NLP telles que SpaCy, Hugging Face, AllenNLP, et Flair, et avez une bonne compréhension des concepts sous-jacents aux grands modèles de langage (LLM).

Stage de 6 mois dès mars 2025.

Localisation du poste

Localisation du poste

Ile-de-France, Paris (75)