Ensitech - data engineer

Certification : Data engineer

Proposée par École supérieure ENSUP - Campus Guyancourt — 78180 Montigny-le-Bretonneux

Formation Professionnelle Apprentissage
RNCP 37172 +3
Présentiel
Apprentissage envisageable

Type

Catégorie de la certification

Autre certification inscrite au RNCP

Niveau de sortie

Niveau reconnu si applicable

Bac +5 (Niveau 7 - équivalence européenne)

Prix

Indiqué par l'établissement

12 500 €

Présentation

Des intervenants experts du métier et de chacun des langages abordés dans le cadre de la formation. Une approche expérientielle qui favorise l'approche projet.

Formation dispensée en Présentiel à l'adresse suivante :

Localisation & Rattachements

Adresse
Square Benjamin Franklin 78180 Montigny-le-Bretonneux
Académie
Versailles
Département
Yvelines
Région
Île-de-France

La carte est indicative. Vérifiez l’accès avant votre déplacement.

Objectifs

La data est devenue un sujet stratégique avec le développement des outils permettant de « dématérialiser » les données et ainsi de les rendre plus facilement « partageables ». L’exemple le plus basique est le logiciel de bureautique qui a permis de passer de tableaux de données papier d’une expérience, à un tableau de données numériques de cette même expérience. La donnée est ainsi devenue une data : elle a été numérisée. En une petite quinzaine d’années, à peine, le développement constant d’outils informatiques permettant de numériser toute sorte de données (images, sons, textes, vidéos, …) et l’avènement d’internet ont non seulement permis d’accélérer la numérisation des données, mais aussi leur production en masse ; les activités économiques et sociales de toute nature (vente en ligne, services, formation), ayant elles aussi migré vers l’internet. Ainsi l'accroissement de la quantité de données produites par les entreprises, les particuliers, les organisations, … est exponentiel. Les chiffres de 2019 et les projections faites par les experts, le démontrent. Ainsi, « Selon les estimations publiées dans le Digital Economy Compass 2019 de Statista, le volume annuel de données numériques créées à l'échelle mondiale a été multiplié par plus de vingt au cours de la dernière décennie et devrait s'approcher de 50 zettaoctets cette année ». On parle désormais de big data, ou données massives, les volumes générés de data étant gigantesques. Dans ce contexte le Data Engineer est l’architecte des données massives et du développement de l’intelligence artificielle, qui sont des conditions de réussite sine qua none de la transformation numérique de notre société : le développement de ce métier clef constitue donc une opportunité. A l'issue de la formation, vous saurez : - Conduire et réaliser le développement ou l’adaptation d’une solution pour collecter, nettoyer, traiter, stocker et exploiter des données - Manager la transition data de l'entreprise - Organiser et mettre en œuvre le déploiement ou l’industrialisation et la maintenance d’une solution opérationnelle de gestion de données - Concevoir, mettre en œuvre et optimiser un modèle d'Intelligence Artificielle/Machine Learning - Exploiter la donnée pour piloter l'activité de l’entreprise et créer de nouvelles opportunités

Débouchés / Résultats attendus

Après avoir validé l'ensemble des blocs de compétences, vous obtiendrez la certification professionnelle Data Engineer, délivrée par Lunalogic.

Programme & Référentiel

Les modules de la formation Data Engineer sont articulés autour des 5 blocs de compétences de la certification : Bloc 1 : Conduire et réaliser le développement ou l’adaptation d’une solution pour collecter, nettoyer, traiter, stocker et exploiter des données - Analyse du besoin et rédaction du cahier des charges - Protection juridique de l’entreprise - Sécurité des données et des systèmes d'information - Architecture d'un système de gestion de données - SQL et bases de données - Extraction, nettoyage et traitement des données (Kafka et spark) - Python pour la Data - Les outils de la data - Hbase et Hive Bloc 2 : Manager la transition data de l'entreprise - Éthique et droit appliqués à la donnée - Stratégie d'entreprise et stratégie de données - Gestion de projet - Accompagnement au changement - Veille technologique, juridique et règlementaire Bloc 3 : Organiser et mettre en œuvre le déploiement ou l’industrialisation et la maintenance d’une solution opérationnelle de gestion de données - Management d'équipe et Leadership - Déploiement Cloud : AWS - Déploiement In-House - Gestion et monitoring du SGDD - Sécurité du SGDD et des données - Maintenance préventive et corrective du SI et du SGDD Bloc 4 : Concevoir, mettre en œuvre et optimiser un modèle d'Intelligence Artificielle/Machine Learning - Introduction à l'IA et au Machine Learning - Mathématiques pour l'IA et le Machine Learning - Apprentissage Supervisé et Non Supervisé - Réseaux de Neurones - Optimisation des Modèles d'IA et Tests - Python pour le ML - Déploiement de Modèles de Machine Learning - Préparation et Nettoyage des Données pour l'IA/ML Bloc 5 : Exploiter la donnée pour piloter l'activité de l’entreprise et créer de nouvelles opportunités - Analyse de données pour le Business - Tableau de Bord pour le BI (Power BI, Grafana,...) - Test de cohérence de données (sortie algorithmie ou sortie d'IA) - Visualisation de données et communication des résultats
Consulter le référentiel

Informations complémentaires

Financement / Coûts
1390 euros en 2025 (6990 euros par an, gratuit en apprentissage)