L’intelligence artificielle pour améliorer le taux de diplomation des collèges québécois (partie 1)

Simon Bouchard
Simon Bouchard

Cet article est le premier d’une série sur l’application de l’intelligence artificielle en éducation. Nous y traiterons des défis propres à la science des données et à l’opérationnalisation de l’IA.

Chez Optania, la bienveillance est au centre de nos préoccupations. Nous innovons avec ISA, une technologie qui utilise l’apprentissage automatique afin d’améliorer la rétention scolaire en ayant le bien-être et la réussite des étudiants à cœur. En éducation, l’amélioration du taux de diplomation au niveau collégial passe par l’utilisation des statistiques modernes alliées à l’informatique (Castro et New, 2019). Selon le Ministère de l’enseignement supérieur, en 2015, le taux d’abandon scolaire avoisinait le 29% après 5 ans d’étude, tout programme confondu au cégep.

ISA utilise des outils d’intelligence artificielle (IA) qui sont caractérisés comme étant de l’apprentissage automatique (« machine learning »). Cette branche de l’IA consiste à deux choses : modéliser à des fins prédictives et comprendre à l’aide d’outils informatiques et statistiques les structures sous-jacentes de jeux de données complexes (James et al., 2013).

L’IA d’Optania

Le modèle prédictif développé par l’équipe d’intelligence artificielle chez Optania est un outil d’aide à la décision permettant de déceler les étudiants qui sont à risque d’échec et d’abandon scolaire ; tous les intervenants et les gestionnaires responsables de la réussite et de la persévérance des étudiants au collégial vont gagner à utiliser cet outil.

En effet, comme l’outil ISA est prédictif et qu’il se base sur les données historiques de l’étudiant, les membres du personnel du collège connaissent le portrait du niveau de risque de leurs étudiants avant même que les premiers résultats de la session d’étude soient saisis. Les intervenants scolaires responsables seront en mesure d’effectuer rapidement des interventions préventives.

Une aide à la décision

Nos principaux cégeps partenaires, le Cégep de Chicoutimi, le Cégep de Rimouski et le Cégep de Trois-Rivières accueillent annuellement un total de près de 10 000 étudiants. Comme les intervenants doivent gérer un nombre important de dossiers étudiants, il est nécessaire pour eux d’analyser de manière rapide et efficace les milliers de dossiers académiques afin de détecter les signes précoces d’un risque d’échec et d’abandon scolaire.

Le modèle d’apprentissage automatique développé par Optania est calibré de manière à être plus sensible à la détection de l’échec et de l’abandon qu’à la détection de la réussite et de la persévérance. En effet, selon une étude sur la persévérance et la réussite scolaire en éducation (Guillemette et al., 2018) «le consensus est qu’on préférerait étiqueter par erreur un diplômé potentiel comme étant un décrocheur potentiel (et lui fournir des interventions pour prévenir le décrochage scolaire) plutôt que d’étiqueter par erreur un décrocheur comme étant un diplômé potentiel et ne lui fournir aucune intervention [...]. »

Le tableau de bord ISA ne remplace en aucun moment le jugement professionnel de l’intervenant, il l’accompagne. Il offre une vue d’ensemble de la population étudiante dès le début de chaque session et ses prédictions s’adaptent tout au long de l’année scolaire en fonction de l’information qui est disponible.

Grâce à son dynamisme, l’algorithme d’apprentissage automatique accélère le travail de ciblage des intervenants en levant des drapeaux rouges sur les individus à risque tout au long de la session. Ces derniers restent au cœur des décisions, en ayant le pouvoir d’étudier par eux-mêmes le dossier du collégien et de décider d’effectuer une intervention préventive selon leur bon jugement.

Pas d’algorithme sans donnée de qualité

Avant même de penser à produire un algorithme d’intelligence artificielle, l’équipe qui y travaille doit s’assurer que les données sont de qualité. Le scientifique de données se doit de valider si les données d’entraînement respectent les principaux points suivants :

  • S’assurer de la cohérence des données;
  • Étudier la pertinence des valeurs extrêmes;
  • Étudier et gérer de manière rigoureuse le débalancement des classes : le modèle est-il plus habitué à rencontrer des individus qui persévèrent?;
  • Gérer de manière rigoureuse les données manquantes;
  • Étudier les questions reliées aux enjeux éthiques (Besse, 2020) :
    • Quel est le niveau de précision, de reproductibilité d’une décision issue d’un système d’intelligence artificielle par apprentissage?
    • Quelle explication d’une décision issue d’un système d’intelligence artificielle par apprentissage peut être apportée?
    • Quels sont les risques de biais discriminatoires à l’encontre d’un groupe vulnérable protégé par la loi?

« Les données sont de la nourriture pour l’IA. » - Andrew Ng, professeur associé au département de science informatique de l’université Stanford

Dans la deuxième partie, nous explorerons l’importance du traitement des données en apprentissage automatique.

Simon Bouchard

Scientifique de données

Références

Laissez-nous vous guider

Contacter Optania