Portfolio Adrien GAUCHÉ

Présentation de mes réalisations et projets

View the Project on GitHub adrien-gauche/portfolio

Data Scientist & ingénieur génie électrique

Adrien GAUCHÉ

⚡️ Ingénieur avec 4 ans d’expérience dans les secteurs de l’énergie électrique et de l’hydrogène, j’ai enrichi mon profil technique grâce à une thèse CIFRE en data science, optimisation et analyse de séries temporelles

🌱 Passionné par l’analyse de données, je suis reconnu pour mon sérieux, ma rigueur, mon adaptabilité et mon organisation. Prêt à relever des défis dans le domaine de la data science, je suis ouvert à des opportunités dans l’énergie, la santé , ainsi qu’à tout domaine ayant un impact sur la transition énergétique.

📞 Références

🛠️ Compétences et Outils

🏢 Expériences professionnelles

🎓 Formation


📊 Portfolio Data Science

Voici une sélection de projets illustrant mes compétences en data science et machine learning réalisés durant ma formation ainsi que sur mon temps personnel.

🌞 Prédiction de l’Ensoleillement

Développement d’un modèle de prédiction de l’ensoleillement pour anticiper la génération d’énergie solaire et intégrer les prévisions dans un modèle de gestion d’énergie (unit commitment).

Voir le projet sur Kaggle

Série temporelle / Régression / Feature Engineering / Optimisation des hyper-paramètres / Clustering / Réduction de dimension

📊 Données

Les données proviennent de la base open data NSRDB et couvrent trois ans, avec un pas de temps de 15 minutes. Elles incluent l’irradiance, la température, le vent et l’angle zénithal du soleil.

🚀 Démarche

⭐ Résultats

🔍 Prédiction des Exacerbations des Patients atteints de FPI

Ce projet a pour objectif de prédire les exacerbations des patients atteints de fibrose pulmonaire idiopathique (FPI), une maladie chronique des poumons. À partir d’une base de données médicale, l’objectif est d’anticiper la probabilité d’aggravation de l’état de santé d’un patient.

Classification / Nettoyage de données / REGEX / gestion des valeurs manquantes / Tests statistiques (Student, Chi²) / Hyper-paramètres / Gradient Boosting

📊 Données

Les données proviennent de fichiers Excel remplis manuellement par des soignants, nécessitant un travail approfondi de nettoyage et de structuration.

🚀 Démarche

P-value des variables qualitatives

Sélection des variables par élimination récursive

Calibration curve

⭐ Résultats

Le modèle XGBoost, optimisé grâce à Optuna, a permis d’obtenir des prédictions robustes, offrant un outil utile pour l’aide à la décision clinique dans la gestion des patients atteints de FPI.

Importance des features

Seuil de précision

Courbe receiver operating characteristic


Développement logiciel

🔋 Logiciel de dimensionnement de microréseau électrique

Création de zéro d’un logiciel de simulation et de dimensionnement de microréseau avec génération renouvelable et stockage hydrogène. Conçu durant mon stage de fin d’études en 2020, ce logiciel est toujours en utilisation.

Série temporelle / Dashboard Qt5 / Visualisation de données / Architecture logicielle UML / Modèle-vue-contrôleur

Données

Séries temporelles de mesures d’ensoleillement, de vent et de consommation électrique

Démarche

Résultats

Capture d'écran du logiciel réalisé