Informations générales
Description du poste
Contrat
Stage
Durée du contrat
6 mois
Description de l'emploi
Stage PFE au sein de la Data Custodian (Data Engineering, Data Mining & Delivery).
# Description du projet :
Prédiction des Pannes Systèmes avec l'Apprentissage Automatique
Ce UC vise à mettre en place un système de prédiction anticipée des pannes systèmes, minimisant les temps d'arrêt et optimisant la maintenance préventive. En tirant parti de l'apprentissage automatique, nous visons à analyser des données issues de sources variées pour anticiper les défaillances potentielles et réduire les coûts d'intervention
# Compétences requises :
i) Compétences en traitement des données :
- ETL (Extract, Transform, Load) : Collecte de données de multiples sources (IoT, logs systèmes, bases de données, etc.).
- Big Data : Utilisation d'outils comme Apache Spark, Hadoop, ou Kafka pour gérer des volumes importants de données en temps réel.
- Bases de données : Maîtrise des bases relationnelles (SQL) et non relationnelles (MongoDB, Cassandra).
ii) Infrastructure et architecture IT :
- Déploiement des modèles : Utilisation de conteneurs (Docker, Kubernetes) pour garantir la scalabilité et l'efficacité.
- CI/CD pour le ML : Mise en œuvre de pipelines d'apprentissage automatique (MLOps).
iii) Compétences en optimisation et maintenance :
- Analyse des séries temporelles : Utilisation de techniques comme les modèles ARIMA, LSTM, ou Prophet pour traiter les données temporelles.
iv) Diversité des Modèles : Intégrer des approches avancées en apprentissage profond (Deep Learning) et apprentissage machine (Machine Learning), incluant des techniques non ou semi-supervisées, pourrait enrichir significativement le traitement des données peu étiquetées.
# Résultats attendus et livrables :
i) Prédictions fiables des pannes :
- Identification anticipée des pannes potentielles avec une précision minimale de 85-90%.
- Classement des pannes par ordre de criticité (pannes majeures vs mineures).
ii) Scalabilité :
- Métriques et Risques : L'accent sur la minimisation des faux positifs est essentiel. Ajouter des méthodes de calibration renforcerait la précision dans les cas critiques.
- Une évaluation des performances dans différents environnements de production garantirait une meilleure robustesse.
iii) Visualisation des performances et des risques :
Mise en place d'un tableau de bord interactif (via PowerBI, Tableau ou équivalent) permettant :
- Le suivi en temps réel des KPI (temps d'arrêt, coûts de maintenance, taux de précision des prédictions).
- Une visualisation des tendances et des modèles de pannes.
Profil
Etudiant(e) en dernière année de formation Bac+5 en école d'ingénieur avec des compétences en data
Localisation du poste
Lieu d'affectation
Casablanca