La formation Data Science vise à :
- Fournir une maîtrise des outils de manipulation, analyse, visualisation et modélisation des données (SQL, Python,, outils de machine learning, deep learning, etc.).
- Permettre l’acquisition de compétences pratiques dans le traitement de grandes quantités de données, ainsi que dans le déploiement de solutions d'intelligence artificielle dans des environnements de production.
- Former des professionnels polyvalents, capables de comprendre et de résoudre des problématiques complexes à travers l'analyse et la gestion des données, en appliquant des modèles statistiques, des techniques de machine learning supervisé et non supervisé, et des méthodes avancées d’analyse de données.
- Développer des compétences en cloud computing et déploiement avec l'utilisation des technologies comme Docker, Kubernetes, et les plateformes de gestion de machine learning comme Dataiku, Hugging Face Hub.
- Mettre l'accent sur l'éthique de l'IA, la gouvernance des données, et la gestion des projets d’analyse de données dans un contexte de travail en équipe.
> OBJECTIFS DES COMPÉTENCES : Les objectifs en termes de compétences visées par cette formation incluent :
- Manipulation des données : Traitement des données avec Python, SQL, et des outils comme Pandas, NumPy, Dataiku, et BigQuery.
- Visualisation des données : Compétences avancées en visualisation à travers des outils comme Power BI, Tableau, Looker Studio, ainsi que des techniques de visualisation Python avec Bokeh et Streamlit.
- Machine Learning : Compétences approfondies dans les modèles supervisés (classification, régression, évaluation, préparation des données, optimisation des hyperparamètres) et non supervisés (clustering, réduction de dimensionnalité, détection des anomalies).
- Deep Learning : Connaissance des réseaux de neurones (CNN, MLP, RNN, attention mechanisms) et des applications avancées comme la reconnaissance faciale et la détection d’objets.
- Traitement du langage naturel (NLP) : Techniques pour analyser et traiter des données textuelles, y compris la modélisation de sujets, l’analyse de sentiments, l’embedding des mots et l’utilisation des librairies comme spaCy.
- Data Engineering : Maîtrise des outils et processus d'ingénierie des données pour la mise en production de modèles de machine learning, déploiement via Docker, Kubernetes, et mise à disposition d’un modèle avec FastAPI, Flask et Hugging Face.
- Data Governance et Éthique : Compétences sur la gestion des données, la gouvernance, ainsi que la régulation et les bonnes pratiques dans le domaine de l’intelligence artificielle.