Déconstruire l’intelligence, un algorithme à la fois
Bonjour et bienvenue sur mon site qui est aussi celui de la communauté Artificialis ! Le projet Artificialis vise à vulgariser et démystifier l’intelligence artificielle et le numérique.
Parcours
Je m’appelle Nils Schaetti, docteur et chercheur en intelligence artificielle, basé près de Genève. Certains disent que je suis l’équivalent suisse de Skynet, mais rassurez-vous, je préfère utiliser l’IA pour résoudre des problèmes réels, pas pour dominer le monde (du moins, pour l’instant). Après un Bachelor et un Master en Informatique de l’Université de Franche-Comté, terminés avec les plus hautes distinctions en 2011 et 2015, j’ai décidé d’explorer le thème du Reservoir Computing et des réseaux de neurones récurrents (RNN). Je vous promets, c’est plus excitant que ça en a l’air…
Avant tout ça, j’étais un technicien informatique certifié, ayant obtenu mon CFC et un Diplôme Fédéral en Informatique à Genève. À l’époque, je codais en C++ chez Brady PLC, un éditeur de logiciels de trading – et non, je n’ai pas programmé d’algorithmes pour faire sauter la bourse. Mais si vous cherchez un développeur pour Matrix 5, je suis partant.
Enseigner n’est pas du divertissement, mais il est peu probable que cela réussisse à moins d’être divertissant (le mot plus respectable est intéressant).
Hebert Simon
Entre 2011 et 2013, j’ai joué avec des clusters HPC à l’EPFL, en tant que spécialiste des systèmes Linux HPC. Imaginez des serveurs géants à la Matrix, sauf que là, c’était pour de la recherche scientifique (et pas pour révolter des machines). J’ai aidé à déployer et maintenir ces monstres de calcul, tout en développant des logiciels de monitoring pour garder un œil sur eux… au cas où ils décideraient de prendre vie.
Ensuite, de 2014 à 2016, je me suis retrouvé chez Nagravision (groupe Kudelski), à tester des systèmes DRM pour une multitude de plateformes. C’était un peu comme être un agent de la Matrice, sauf qu’au lieu de traquer Neo, je traquais les bugs dans un cadre d’intégration continue. De la programmation, des plateformes, des DRM – un vrai cocktail de code, mais sans les lunettes noires.
De 2016 à 2020, j’ai plongé tête la première dans une thèse de doctorat à l’Université de Neuchâtel dans le domaine du traitement du langage naturel (NLP). J’ai exploré des domaines comme l’analyse d’auteur, l’attribution et le profilage, tout en utilisant des techniques de deep learning. Enfin, en tant que postdoc à l’Université de Genève, j’ai continué mes recherches sur le deep learning, toujours à la recherche du prochain défi en intelligence artificielle.
Je suis actuellement collaborateur scientifique au DMML (Data Mining and Machine Learning) à la Haute École de Gestion de Genève. Mon travail tourne autour du self-supervised learning et du contrastive learning, des techniques appliquées à la segmentation sémantique d’images. En d’autres termes, j’entraîne des machines à comprendre ce qu’elles voient, même sans leur tenir la main.
En parallèle de tout ça, j’ai décidé de partager ma passion pour l’IA avec le monde. Fin 2022, j’ai lancé deux chaînes YouTube : Artificialis et Artificialis Code. L’idée ? Démystifier l’intelligence artificielle et montrer à tout le monde, experts comme curieux, que même les algorithmes les plus complexes peuvent devenir un jeu d’enfant.
Politique et engagement
Je m’engage aussi depuis quelques années en politique avec le Parti Pirate Vaudois (PPVD), où je milite pour un numérique plus rationnel et inclusif. En 2022, j’ai pris du galon en devenant co-président.
N’hésitez pas à faire un tour sur mon site pour découvrir mes travaux, mes projets, et jeter un œil aux contenus de mes chaînes YouTube.
Merci d’être passé, et à bientôt dans le monde de l’IA ou ailleurs !
Le premier principe est de ne pas se tromper soi-même, et vous êtes la personne la plus facile à tromper.
Richard P. Feynman
Parcours académique
Doctor of Philosophy (PhD) , Machine Learning
Université de Neuchâtel, Neuchâtel, Suisse, de 2016 à 2020
Pendant ma thèse de doctorat à l’Université de Neuchâtel, une institution reconnue pour son excellence en recherche et son approche interdisciplinaire, j’ai exploré l’application des réseaux de neurones récurrents (RNN) dans le domaine de l’analyse d’auteur, un sous-domaine de la linguistique computationnelle. L’Université de Neuchâtel, située dans un cadre idyllique au bord du lac et au cœur des montagnes suisses, encourage une recherche de pointe tout en favorisant un environnement académique stimulant et collaboratif.
Mon travail s’est concentré sur la comparaison empirique de différents modèles de réseaux récurrents, notamment les Echo State Networks (ESN), les Long Short-Term Memory (LSTM) et les Gated Recurrent Units (GRU), sur trois tâches distinctes d’analyse d’auteur. La première tâche, l’attribution d’auteur, consistait à prédire l’auteur d’un document dans un ensemble de candidats à partir du dataset Reuters C50. La deuxième, appelée profilage d’auteur, visait à déterminer le genre (homme/femme) de l’auteur de tweets en utilisant le dataset PAN 2017. Enfin, la troisième tâche, la vérification d’auteur, impliquait de retrouver des passages écrits par un auteur spécifique dans des magazines de science-fiction des années 50 à 70, avec des sous-tâches pour l’extraction et la détection d’auteurs dans un corpus collaboratif.
Ce travail a permis de montrer que des modèles simples comme les ESN peuvent rivaliser avec des méthodes traditionnelles en stylométrie, tout en ayant des temps d’entraînement plus courts et des paramètres optimisés, surpassant ainsi des modèles plus complexes comme les LSTM et GRU. J’ai également mis en évidence que la pré-formation des représentations de mots et de caractères sur des données similaires améliore la performance sur des tâches où les données sont limitées.
Mon étude a offert une vue d’ensemble des possibilités futures pour l’application des réseaux de neurones dans l’analyse d’auteur, en particulier dans les domaines où les données sont rares et les explications cruciales. L’Université de Neuchâtel, avec son cadre propice à l’innovation et son ouverture aux collaborations internationales, a été un environnement idéal pour développer ce projet de recherche de haute envergure.
Publications
Certificate of Higher Education, Mathematical Sciences
The Open University, Milton Keynes, UK, de 2011 à 2016
- Introduction aux mathématiques pures, aux mathématiques appliquées et aux statistiques ;
- Savoir travailler avec des idées abstraites ;
- modélisation de problèmes du monde réel et utilisation de logiciels mathématiques et statistiques ;
- Option de commencer les études à un niveau plus élevé et à un rythme plus rapide ;
- Établit des bases solides pour des études ultérieures ;
Master of Science (MSc), Informatique avancée et applications
Université de Franche-Comté, Besançon, France, de 2011 à 2015
Avec les plus grandes distinctions, mention très bien, summa cum laude.
En parallèle d’une activité professionnelle à temps plein et d’un certificat en mathématiques.
Publications
- Mémoire: » Echo State Networks-Based Reservoir Computing for MNIST Handwritten Digits Recognition » ; Note de 19.5 sur 20.
Bachelor of Science (BSc), informatique
Université de Franche-Comté, Besançon, France, de 2009 à 2011
Avec les plus grandes distinctions, mention très bien, Summa cum laude.
En parallèle d’une activité professionnelle à temps plein et d’un certificat en mathématiques.
Diplôme Fédéral de Technicien ES en informatique
CEPTA, Onex, Suisse, de 2005 à 2008
Le technicien ou technicien informatique intervient sur des ensembles liés aux ordinateurs personnels et aux réseaux informatiques, tant du côté logiciel que matériel. Ils ont des responsabilités dans des domaines tels que la fabrication, la programmation, l’installation, la maintenance, la réparation ou le service après-vente des ordinateurs, des systèmes et des équipements informatiques.
Certificat Fédéral de Capacité (CFC), informaticien
CEPTA, Onex, Suisse, de 2001 à 2005
Parcours professionnel
Collaborateur scientifique
Data Mining and Machine Learning Group, Haute École de Gestion (HEG), de 2022 à aujourd’hui
Recherche sur le Self-Supervised Learning (SSL) appliqué à la segmentation d’images.
Chargé du cours » Introduction to Machine Learning «
Chercheur postdoctoral
Université de Genève, Genève, Suisse, de 2020 à 2021
Rercherche sur le Deep Learning appliqué à la détection d’anomalies dans des séries temporelles.
- Machine Learning
- Artificial Intelligence
- Deep Learning
- Data Science
Doctorant
Université de Neuchâtel, Neuchâtel, Suisse, de 2016 à 2020
Assistant pour les cours
- Statistical Learning
- Machine Learning and Data Mining
- Language and Computer
- Artificial Intelligence
Publications
- UniNE at CLEF 2017: TF-IDF and Deep-Learning for Author Profiling, Notebook for PAN at CLEF 2017
- Comparison of Neural Models for Gender Profiling
- Character-based Convolutional Neural Network and ResNet18 for Twitter Author Profiling : Notebook for PAN at CLEF 2018
- Bidirectional Echo State Network-based Reservoir Computing for Cross-domain Authorship Attribution : Notebook for PAN at CLEF 2018
- Character-based Convolutional Neural Network for Style Change Detection : Notebook for PAN at CLEF 2018
- Behaviours of Deep Echo State Network-based ReservoirComputing Models on Classification of Textual Documents
- Authorship Attribution using Echo State Network-basedRecurrent Neural Models
Ingénieur test système
Kudelski, Chéseaux-sur-Lausanne, Suisse, de 2014 à 2016
Spécialiste système HPC
École Polytechnique Fédérale de Lausanne, Ecublens, Suisse, de 2011 à 2013
À mon arrivée à l’EPFL, j’ai pris part à l’administration de l’infrastructure informatique, notamment la grille informatique des PC, en tant qu’assistant d’un collègue ingénieur doctorant de l’EPFL jusqu’à son départ en 2012. J’ai ensuite assumé la responsabilité du service jusqu’à son démantèlement en 2013.
Parallèlement à mes activités d’administration système, j’ai développé un logiciel de mesure des performances pour les clusters HPC. Le résultat de ce projet a été publié en tant que projet Open Source et est disponible pour la communauté scientifique.
Brady PLC
Développeur C++, Chêne-Bougerie, Suisse, de 2009 à 2011
Pendant mes deux ans et demi chez Brady PLC (anciennement Viveo SA), j’ai contribué au développement de logiciels de trading et de comptabilité en utilisant les technologies .NET et C++. En parallèle de mes activités de développement, j’ai été chargé du déploiement des logiciels sur l’infrastructure des clients ainsi que de veiller à la cohérence et au bon fonctionnement des bases de données SQL Server et Oracle.
Apprenti informaticien – DBM SA
Support informatique premier niveau.