Data Scientist

19/01/2023

Descriptif du poste

Boulogne-Billancourt - télétravail possible

Rôle général

Développe des cas d’usage de la Data Science pour répondre aux problématiques métiers variées de l’industrie automobile et déployer de façon durable l’IA au sein du groupe.

Responsabilité générale

Sstatistiques descriptives et inférentielles, algorithmes de machine learning, data visualisation, programmation, traitement de données distribuées, gestion de projets d’analyse de données,  industrialisation et déploiement des modèles.

Le groupe RENAULT entre dans une nouvelle ère, l’ambitieuse stratégie RENAULuTion place L’IA au cœur de notre business. Renault Digital, créé en 2017, est un acteur incontournable de ce nouveau cycle et participe activement à relever les challenges des nouvelles mobilités et de l’industrie 4.0

Vous travaillez au sein du Pôle Data, dans une équipe de 30 data Scientists et data Analysts. Via des interviews proactives avec les grands métiers de Renault ou en phase amont de projet, vous analysez les problématiques et les besoins métier pour concevoir des solutions d’analytics potentielles. En phase projet, vous concevez, expérimentez, construisez et implémentez ces solutions en production, en mettant à contribution votre solide savoir-faire technique, votre relationnel et votre compréhension du contexte. Vous
serez garant de la valeur ajoutée de la donnée et de l’intelligence artificielle appliquée dans les processus métiers.

Responsabilités principales

En phase amont d’un projet

  • Collaborer avec les différents acteurs de Renault, tant métier que techniques pour imaginer des solutions innovantes et identifier des synergies entre projets
  • Analyser la qualité et disponibilité des sources de données d’un projet
  • Analyser les données et tester des algorithmes pour estimer la faisabilité d’un projet et la valeur potentielle.

Pendant la phase projet

  • Participer à la vie du projet, avec ses différents membres (product leader, métiers, développeurs, devops, architectes Big Data, UX, agile, data engineers et scientists, …)
  • Analyser et comprendre de manière détaillée la problématique métier
  • Définir la stratégie analytics (priorisation des idées, métriques d’évaluation, environnement logiciel, estimation de valeur)
  • Implémenter des traitements complexes de data engineering et de feature engineering
  • Créer des modèles de machine learning précis et performants
  • Analyser et développer des solutions de rupture grâce au deep learning
  • Définir et développer les composants nécessaires pour orchestrer un système de machine learning en production suivant les best practice MLOPS (validation de données, preprocessing, apprentissage, analyse de modèle, déploiement, monitoring, etc.)
  • Animer des workshops data avec les métiers et les équipes techniques
  • Apporter de l’aide et de l’organisation aux data scientists moins expérimentés

En phase hors projet

  • Peer review et soutien aux approches et modèles des data scientists d’autres projets
    Veille technologique et apprentissage continue
  • Participer à l’acculturation Data de Renault (contenu de présentation et formations)
  • Contribuer au processus de recrutement de nouveaux data scientists

Qualités requises

  • Au moins 5 ans d’expérience comme Data Scientist
  • Capacité d’écoute et de compréhension de problématiques business variées (industrie 4.0, marketing, engineering, qualité, après-vente, …)
  • Capacité à vulgariser et présenter de nouvelles approches et simplifier les résultats
  • Excellente maitrise des librairies de traitement et visualisation de données 
  • Connaissances approfondies des algorithmes de machine learning (clustering, classification, régression, détection d’anomalie, optimisation de modèles, traitement d’images et de langage naturel avec du deep learning).
  • Expérience avec au moins l'un des langages de programmation suivants : Python (obligatoire), SQL (obligatoire), R, Scala ou Java. 
  • Expérience sur des frameworks de Machine Learning bien connus : Scikit-learn, TensorFlow/Keras, TFx, PyTorch (un plus) …
  • Une expérience avec Spark est un plus
  • Expérience en industrialisation de systèmes de machine learning
  • Une expérience avec Docker, et un orchestrateur (kubeflow, airflow …), kubernetes, Git, Gitlab CI/CD (un plus)
  • Compréhension des plates-formes de développement cloud (deploiement du pipeline ML avec des services cloud).
    • Google Cloud Platform (Storage, BigQuery, Dataproc, Dataflow, AI Platform, …)
  • Connaissance de DevOps pour AI et ML (MLOps) 
  • Développement de code structuré dans les langages de production
  • Capacité à distribuer des traitements de données à grande échelle