DATA AND MACHINE LEARNING ENGINEER

Mettre en place des chaînes bout en bout de traitement de la data, de l’ingestion à l’exposition d’APIs et à la visualisation des données

Rôle :

Vous faites partie du Pôle Data, vous mettez en place des chaînes de traitement data de bout en bout dans des environnements on premise et cloud et dans une culture devops. Vous travaillerez sur de tout nouveaux produits, pour une grande variété de domaines fonctionnels (Ingénierie, Véhicule connecté, Manufacturing, IoT, Commerce, Qualité, Finance), avec une équipe solide pour vous épauler, en contribuant à la valeur métier des produits orientés Data.

Activités générales :

Pendant la définition du projet

  • Conception de chaînes d’ingestion de données, de chaînes de préparation de données, d’algorithmes de ML de base, de produits de données, de modèles de données NoSQL et de visualisations de données
  • Participation à la sélection des services / solutions à utiliser en fonction des usages et à l'élaboration d'une boîte à outils data

Pendant la phase de réalisation itérative

  • Mise en œuvre de chaînes d’ingestion de données,  de chaînes de préparation de données, de produits de données, d’algorithmes de ML de base, de visualisations de données et mode distribué des traitements
  • Utilisation de framework de ML
  • Exposition de produits de données
  • Paramétrage de bases NoSQL
  • Utilisation de langages fonctionnels
  • Débogage des traitements distribués et algorithmes
  • Identification et catalogage des éléments réutilisables
  • Contribution à l’évolution des standards de travail 
  • Contribution et avis sur les problèmes de traitements data

Pendant l'intégration et le déploiement - participation à la résolution de problèmes

Compétences :

  • Expertise dans la mise en place des chaînes de traitement data de bout en bout
  • Maîtrise du développement distribué, de Scala et/ou Python, de l’utilisation de notebooks data
  • Aisance dans le débogage Spark et de systèmes distribués
  • Vulgarisation de systèmes complexes
  • Fortes compétences en résolution de problèmes, intelligence, initiative et capacité à résister à la pression
  • Excellentes compétences relationnelles et grand sens de la communication (capacité à entrer dans le détail)

Profil :

  • Connaissance de base et intérêt dans le développement d’algorithmes de ML, des framework d’ingestion, de Spark et ses différents modules
  • Expertise dans les stratégies de tests data
  • Connaissance de l’écosystème AWS ou GCP, des bases NoSQL, 
  • Connaissance dans la construction d’APIs de produits de données et d’outils et bibliothèques de Dataviz

Détails

Boulogne-Billancourt, France
CDI
7 postes

Expérience

Entre 3 et 5 ans

Compétences

  • Python/R
  • Tensorflow/PyTorch
  • Spark(Scala)/PySpark
  • AWS/GCP
Je postule
Je partage