PowerForcast - Prédiction de la Consommation Électrique à Tétouan
Résumé du Projet
Dans le cadre de ma formation en science des données organisée par Isheero, en partenariat avec EVC Africa Tech Tour, j’ai eu l’opportunité de participer à un projet appelé PowerForcast. Ce projet visait à prédire la consommation électrique à Tétouan en utilisant des données de séries temporelles, notamment des facteurs météorologiques comme la température, l’humidité et la vitesse du vent, ainsi que les données de consommation d’énergie dans différentes zones géographiques. Le projet a été une excellente occasion de mettre en pratique mes compétences en data science et machine learning, tout en abordant une problématique énergétique de grande envergure.
Contexte et Motivation :
Ce projet a été réalisé lors de ma formation en science des données, où j’ai eu l’occasion de travailler sur une application concrète de l’analyse de données. En tant qu’étudiant dans ce domaine, participer à un projet en partenariat avec des entreprises de la tech m’a permis de découvrir l’impact réel de l’intelligence artificielle et du machine learning dans des secteurs comme celui de l’énergie.
L’opportunité de travailler sur PowerForcast m’a permis de comprendre l’importance d’anticiper la demande énergétique pour une gestion optimisée des ressources. Cette tâche devient cruciale pour les gestionnaires de réseau, les autorités locales, et les entreprises, afin de maintenir une fourniture d’électricité fiable et de prendre des décisions éclairées pour l’infrastructure énergétique de la ville.

Objectifs du Projet :
Prédire la Consommation Électrique Future :
Développer un modèle de machine learning capable de prédire la consommation d’énergie en fonction de facteurs météorologiques et de données historiques.
Analyser l’Influence des Facteurs Météorologiques :
Étudier comment des variables comme la température, l’humidité et la vitesse du vent affectent la demande en électricité dans la ville de Tétouan.
Optimiser la Planification et la Gestion Énergétique :
Fournir des prévisions qui aident les gestionnaires de réseau à mieux gérer l’approvisionnement en énergie et à anticiper les pics de consommation.
Technologies Utilisées :
Pour la réalisation de ce projet, plusieurs technologies et outils puissants ont été utilisés afin de maximiser la qualité de l’analyse, de la modélisation et de la présentation des résultats :
Python : Le langage principal utilisé pour la collecte, le nettoyage et l’analyse des données. Python est extrêmement populaire pour les projets de data science en raison de sa simplicité, de sa flexibilité, et de la richesse de ses bibliothèques, qui facilitent la manipulation et l’analyse des données.
Pandas et NumPy : Ces bibliothèques ont été utilisées pour la manipulation des données, notamment pour nettoyer, transformer et structurer les données brutes en formats adaptés à l’analyse. Pandas permet de gérer des données sous forme de tableaux (DataFrame), tandis que NumPy offre des outils puissants pour le calcul numérique.
Matplotlib et Seaborn : Ces bibliothèques de visualisation de données ont été utilisées pour créer des graphiques clairs et interactifs. Elles ont permis d’identifier les tendances dans la consommation énergétique par rapport aux facteurs météorologiques, facilitant ainsi l’interprétation visuelle des résultats.
XGBoost : Un algorithme de machine learning basé sur le gradient boosting. Il a été utilisé pour prédire la consommation d’électricité en raison de sa capacité à bien performer sur des données complexes et de traiter les relations non linéaires. XGBoost permet d’obtenir des modèles précis et robustes, en particulier sur des ensembles de données volumineux.
LSTM (Long Short-Term Memory) : Un modèle de réseau neuronal récurrent qui a été utilisé pour l’analyse des séries temporelles. LSTM permet de capturer les dépendances à long terme dans les données temporelles, comme les variations de la consommation d’électricité au fil du temps. Ce modèle est particulièrement adapté pour la prédiction de valeurs séquentielles.
Jupyter Notebooks : J’ai utilisé Jupyter Notebooks pour développer et tester le code, explorer les données et visualiser les résultats de manière interactive. Cette plateforme est idéale pour les projets de data science, car elle permet d’exécuter du code, d’intégrer des visualisations et de documenter les analyses dans un format reproductible.
Streamlit : Pour rendre le projet interactif et plus accessible, j’ai utilisé Streamlit. Cette bibliothèque permet de créer des applications web interactives de manière simple et rapide. Elle a été utilisée pour déployer des modèles de prédiction et créer une interface utilisateur conviviale, permettant de visualiser les prévisions de consommation énergétique en temps réel.
GitHub : Le code final ainsi que les fichiers Jupyter Notebooks (ipynb) ont été hébergés sur GitHub, ce qui permet de suivre l’évolution du projet de manière transparente et collaborative. Cela facilite aussi le partage des résultats avec la communauté et les parties prenantes intéressées.
Résultats
Le projet PowerForcast a permis d’obtenir des résultats prometteurs grâce à l’utilisation des modèles XGBoost et LSTM pour prédire la consommation électrique à Tétouan. Voici un résumé des résultats clés obtenus pendant le projet :
1. Prédictions de Consommation Électrique :
Les modèles de machine learning (XGBoost et LSTM) ont été capables de prédire la consommation d’électricité future dans les différentes zones géographiques de Tétouan avec un degré d’exactitude élevé. Les prévisions ont montré une capacité à estimer la demande énergétique en fonction des paramètres météorologiques tels que la température, l’humidité et la vitesse du vent.
XGBoost : Ce modèle a donné des résultats rapides et précis, notamment en capturant des relations non linéaires dans les données. Il a permis de réaliser des prévisions sur le court terme avec une précision élevée.
LSTM : Le modèle LSTM a particulièrement bien performé pour capturer les tendances à long terme, en tenant compte des dépendances temporelles dans les séries de consommation. Il a montré une bonne capacité à prévoir les variations saisonnières de la consommation d’électricité.


2. Visualisation des Tendances :
Grâce aux visualisations interactives réalisées avec Matplotlib et Seaborn, nous avons pu observer des tendances claires dans la consommation électrique en fonction des différentes variables météorologiques. Par exemple :
Une augmentation de la consommation a été observée pendant les périodes de forte chaleur, ce qui est logique car la demande en électricité augmente généralement avec l’utilisation de la climatisation.
L’humidité et la vitesse du vent ont également montré des relations intéressantes avec la consommation, bien que leur influence soit moins marquée que celle de la température.



3. Impact des Facteurs Météorologiques :
L’analyse des variables météorologiques a permis de mieux comprendre comment les différents paramètres affectent la demande en électricité :
Température : A montré une forte corrélation avec la consommation d’énergie, notamment durant les périodes de forte chaleur.
Humidité et Vitesse du Vent : Ces deux variables ont montré une influence modérée sur la consommation d’électricité, mais ont joué un rôle significatif lors de certains événements climatiques (comme les tempêtes).
4. Évaluation des Performances des Modèles :
Les performances des modèles ont été évaluées à l’aide de diverses métriques de précision, telles que l’Erreur Absolue Moyenne (MAE), l’Erreur Quadratique Moyenne (RMSE), et le R2.
XGBoost a montré une faible MAE, ce qui indique des prévisions relativement précises pour des intervalles à court terme.
LSTM a montré de meilleures performances pour les prévisions à long terme, avec un RMSE plus faible, ce qui témoigne de sa capacité à saisir les tendances à long terme de la consommation.



Impact Personnel du Projet :
Ce projet a eu un impact significatif sur mon parcours personnel et professionnel en science des données :
Renforcement de Mes Compétences Techniques :
Travailler avec des technologies avancées comme XGBoost et LSTM m’a permis de consolider mes compétences en machine learning et en analyse de séries temporelles. C’était l’occasion d’appliquer des concepts théoriques à un cas réel, ce qui a considérablement enrichi mon expérience.
Compréhension Pratique des Séries Temporelles :
La manipulation et la prévision de séries temporelles, notamment pour la consommation énergétique, ont été des expériences très formatrices. J’ai appris à identifier des patterns, à gérer des données temporelles complexes et à optimiser des modèles pour des prévisions à long terme.
Approfondissement de la Prise de Décisions Basée sur les Données :
Ce projet m’a permis de voir l’impact direct de la data science sur la prise de décisions stratégiques. J’ai compris à quel point les prévisions basées sur les données peuvent influencer des décisions dans des domaines comme la gestion de l’énergie, ce qui a renforcé ma passion pour l’utilisation des données dans des secteurs pratiques.
Préparation au Marché du Travail :
Travailler sur un projet en partenariat avec des organisations comme Isheero et EVC Africa Tech Tour m’a exposé aux exigences du monde professionnel, m’a appris à collaborer efficacement et m’a permis de présenter des résultats concrets lors de la démonstration du projet. Cela m’a non seulement permis de renforcer mon CV, mais aussi d’élargir mon réseau professionnel.
Accédez au Projet Complet sur GitHub :
Pour explorer l’intégralité du projet PowerForcast, y compris le code source, les notebooks Jupyter, les visualisations, et les modèles utilisés pour prédire la consommation électrique, vous pouvez consulter le dépôt GitHub suivant :
Dans ce dépôt, vous trouverez :
Le code Python utilisé pour le nettoyage et l’analyse des données.
Les notebooks interactifs pour visualiser les résultats et tester les prévisions.
L’implémentation des modèles XGBoost et LSTM pour la prédiction de la consommation énergétique.
Les visualisations de données pour observer les tendances de consommation par rapport aux variables météorologiques.
N’hésitez pas à cloner le projet, à l’exécuter et à l’adapter à vos besoins. Le projet est open source, ce qui vous permet de l’explorer, d’y apporter des contributions ou de l’utiliser dans vos propres analyses de données énergétiques.