Titre professionnel concepteur développeur en science des données

Certification : Concepteur développeur en science des données

Proposée par M2I SCRIBTEL — 92400 Courbevoie

Formation Professionnelle Apprentissage
RNCP 35288
Présentiel
Apprentissage envisageable

Type

Catégorie de la certification

Autre certification inscrite au RNCP

Niveau de sortie

Niveau reconnu si applicable

Bac +3 (Niveau 6 - équivalence européenne)

Prix

Indiqué par l'établissement

5 000 €

Présentation

La certification de "Concepteur Développeur en Science des Données " est de devenir un spécialiste en science des données ayant la capacité d'avoir une vision globale des projets de Science de Données.

Formation dispensée en Présentiel à l'adresse suivante :

Localisation & Rattachements

Adresse
19 PLACE DES REFLETS 92400 Courbevoie
Académie
Versailles
Département
Hauts-de-Seine
Région
Île-de-France

La carte est indicative. Vérifiez l’accès avant votre déplacement.

Objectifs

A l'issue de cette formation, vous serez capable de :

  • Construction et alimentation d'une infrastructure de gestion de données.
  • Analyse exploratoire, descriptive et inférentielle de données.
  • Analyse prédictive de données structurées par l'intelligence artificielle.
  • Analyse prédictive de données non-structurées par l'intelligence artificielle.
  • Industrialisation d'un algorithme d'apprentissage automatique et automatisation des processus de décision.
  • Direction de projets de gestion de données.

Débouchés / Résultats attendus

Obtention du Titre Professionnel par le Certificateur JEDHA niveau 6 (Bac+3)

Lien pour visualiser le détail du Titre enregistré au RNCP : https://www.francecompetences.fr/recherche/rncp/35288/

Programme & Référentiel

Intro à la data et à l'environnement technique

  • Présentation du programme,
  • Outils utilisés,
  • Prise en main de l'environnement de travail,
  • Découverte de l'écosystème data.

Linux Bash et administration

Préparer Docker (installation, volumes, docker-compose)

Mini Data Lake local (MinIO + Docker + S3 Python SDK)

Python bases

Python avancé

Initiation à Git et Jupyter

Bases de données relationnelles & modélisation

SQL fondamental (SELECT, WHERE, GROUP BY)

SQL avancé (JOINS, VUES, AGREGATS)

ETL

Web scraping avec Python

NoSQL

Stockage Cloud avec AWS S3 / MinIO

éval Bloc 1

  • étude de cas Data Lake & ETL : étude de cas sur l'intégration et le traitement de données massives via un data lake.

ETL distribué avec Spark + Pandas

Manipulation avec Numpy & Pandas

Spark SQL & DataFrames distribués

Nettoyage avec Spark & Pandas

Visualisation de données (Matplotlib, Seaborn, Plotly)

Statistiques inférentielles & tests

Analyse multivariée

éval Bloc 2

  • Analyse exploratoire & Spark : études de cas avec données massives sur Spark.

ML supervisé avec Scikit-learn

ML avec Spark MLlib

Optimisation & évaluation des modèles

Apprentissage non-supervisé

  • Découvrir les techniques de segmentation (clustering, réduction de dimension) et leur mise en ouvre.

éval Bloc 3

  • ML Scikit vs Spark : évaluation comparative entre deux pipelines ML sur Scikit-learn et Spark MLlib appliqués à des données volumineuses.

Prétraitement texte et NLP

Deep Learning avec TensorFlow (MLP, CNN)

Modèles avancés et évaluation

éval Bloc 4

  • étude de cas NLP : étude de cas complète : entraîner un modèle pour analyser des sentiments sur des avis utilisateurs textuels.

Dockerisation d'un projet Data

Création d'API Flask / FastAPI

Déploiement via Docker + SageMaker

MLflow, suivi des modèles

éval Bloc 5

  • Déploiement IA + API : évaluation complète incluant le déploiement d'un modèle ML dans une API Dockerisée et testée.

Gestion de projet Data

Indicateurs, pilotage et vulgarisation

Agilité

Posture professionnelle

Projet final data

éval Bloc 6

  • Soutenance Projet Data : Soutenance du projet global devant jury.

TRE Techniques de recherche d'emploi

Révisions & Examens blancs

Autonomie

  • E-learning/TP