Travail chez LIRIS

Lors de mon stage au sein du laboratoire de recherche LIRIS, j'ai participé à un projet faisant suite à une thèse. L'objectif était d'évaluer un jeu de données (dataset) au préalable à l'entrainement d'un algorithme de Machine Learning, afin d'identifier de potentielles données incorrectes. Pour ce faire, j'ai créé des algorithmes Python utilisant des méthodes de Blocking pour analyser le jeu de données et mettre en avant les élements conflictuels.

Ainsi, j'étais responsable du développement et de la mise en œuvre des algorithmes, de leur test et de l'analyse des résultats. J'ai travaillé avec de grands jeux de données et géré ces données de manière efficace (notamment via de la parallélisation des algorithmes), ainsi qu'utilisé diverses bibliothèques telles que pandas et numpy.

Cette expérience m'a permis de développer mes compétences en matière d'analyse de données, de prétraitement des données et d'apprentissage automatique (Marchine Learning). Elle m'a également permis de mieux comprendre l'importance de la qualité des données dans le Machine Learning et de m'assurer que les données sont correctes avant d'entraîner un modèle.

Associé