Portfolio Adrien GAUCHÉ

Présentation de mes réalisations et projets

View the Project on GitHub adrien-gauche/portfolio

Data Scientist & ingénieur génie électrique

Adrien GAUCHÉ

⚡️ Ingénieur avec 4 ans d’expérience dans les secteurs de l’énergie électrique et de l’hydrogène, j’ai enrichi mon profil technique grâce à une thèse CIFRE en data science, optimisation et analyse de séries temporelles

🌱 Passionné par l’analyse de données, je suis reconnu pour mon sérieux, ma rigueur, mon adaptabilité et mon organisation. Prêt à relever des défis dans le domaine de la data science, je suis ouvert à des opportunités dans l’énergie, la santé , ainsi qu’à tout domaine ayant un impact sur la transition énergétique.

📞 Références

🛠️ Compétences et Outils

🏢 Expériences professionnelles

🎓 Formation


📊 Portfolio Data Science

Voici une sélection de projets illustrant mes compétences en data science et machine learning réalisés durant ma formation ainsi que sur mon temps personnel.

🌞 Prédiction de l’Ensoleillement

Développement d’un modèle de prédiction de l’ensoleillement pour anticiper la génération d’énergie solaire et intégrer les prévisions dans un modèle de gestion d’énergie (unit commitment).

Voir le projet sur Kaggle

Série temporelle / Régression / Feature Engineering / Optimisation des hyper-paramètres / Clustering / Réduction de dimension

📊 Données

Les données proviennent de la base open data NSRDB et couvrent trois ans, avec un pas de temps de 15 minutes. Elles incluent l’irradiance, la température, le vent et l’angle zénithal du soleil.

🚀 Démarche

⭐ Résultats

🔍 Prédiction des Exacerbations des Patients atteints de FPI

Ce projet a pour objectif de prédire les exacerbations des patients atteints de fibrose pulmonaire idiopathique (FPI), une maladie chronique des poumons. À partir d’une base de données médicale, l’objectif est d’anticiper la probabilité d’aggravation de l’état de santé d’un patient.

Classification / Nettoyage de données / REGEX / gestion des valeurs manquantes / Tests statistiques (Student, Chi²) / Hyper-paramètres / Gradient Boosting

📊 Données

Les données proviennent de fichiers Excel remplis manuellement par des soignants, nécessitant un travail approfondi de nettoyage et de structuration.

🚀 Démarche

P-value des variables qualitatives

Sélection des variables par élimination récursive

Calibration curve

⭐ Résultats

Le modèle XGBoost, optimisé grâce à Optuna, a permis d’obtenir des prédictions robustes, offrant un outil utile pour l’aide à la décision clinique dans la gestion des patients atteints de FPI.

La figure illustre la contribution des variables du modèle pour ajuster la valeur de base (moyenne calculée sur l’ensemble du jeu de données d’entraînement) vers la valeur prédite pour un exemple donné. Les variables qui augmentent la prédiction sont représentées en rouge tandis que celles qui la diminuent sont en bleu [Article Nature].

Importance des features

Une précision élevée est obtenue avec peu de faux positifs dans les résultats prédits, et un rappel (recall) élevé est obtenu en ayant peu de faux négatifs [Article précision recall].

Seuil de précision

La courbe ROC, est un graphique qui illustre les performances d’un système de classification binaire lorsque son seuil de discrimination varie. Elle est créée en traçant la fraction des vrais positifs parmi les positifs (TPR = taux de vrais positifs) par rapport à la fraction des faux positifs parmi les négatifs (FPR = taux de faux positifs), à différents seuils [Article ROC].

Courbe receiver operating characteristic

Application en ligne


Développement logiciel

🔋 Logiciel de dimensionnement de microréseau électrique

Création de zéro d’un logiciel de simulation et de dimensionnement de microréseau avec génération renouvelable et stockage hydrogène. Conçu durant mon stage de fin d’études en 2020, ce logiciel est toujours en utilisation.

Série temporelle / Dashboard Qt5 / Visualisation de données / Architecture logicielle UML / Modèle-vue-contrôleur

Données

Séries temporelles de mesures d’ensoleillement, de vent et de consommation électrique

Démarche

Résultats

Capture d'écran du logiciel réalisé