Artwork

Content provided by Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes. All podcast content including episodes, graphics, and podcast descriptions are uploaded and provided directly by Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes or their podcast platform partner. If you believe someone is using your copyrighted work without your permission, you can follow the process outlined here https://player.fm/legal.
Player FM - Podcast App
Go offline with the Player FM app!

L'apprentissage zero-shot de l'IA, qu'est ce que c'est ?

2:58
 
Share
 

Manage episode 501498172 series 3383386
Content provided by Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes. All podcast content including episodes, graphics, and podcast descriptions are uploaded and provided directly by Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes or their podcast platform partner. If you believe someone is using your copyrighted work without your permission, you can follow the process outlined here https://player.fm/legal.

Aujourd’hui, on parle d’« apprentissage zero-shot », ou ZSL pour zero shot learning.

En clair, c’est la capacité d’un modèle d'IA à reconnaître ou classer des choses qu’il n’a jamais vues lors de son entraînement.

Et voici l’essentiel en trois points sur la base d'un document d'explication d'IBM.

Le ZSL, à quoi ça sert ?

Alors dans un premier temps, à quoi ça sert et en quoi c’est différent des méthodes d'apprentissage classiques utilisées par les concepteurs d'intelligence artificielle.

La plupart des modèles d'IA apprennent en mode supervisé. C'est à dire qu'on leur montre des milliers d’exemples étiquetés, d'un chat par exemple. Et le système apprend à reconnaître un chat avec cette méthode.

Le problème, c'est que étiqueter des données coûte cher, prend du temps, et surtout que certaines classes sont rares, voire inédites, comme les nouvelles maladies, des espèces animales peu documentées, ou encore un nouveau type d’attaque informatique. Le zero-shot répond donc à cette contrainte.

Le ZSL, comment ça marche ?

Au lieu d’apprendre à reconnaître un oiseau en regardant des photos étiquetées, l'entraînement consiste à lire à l'IA une définition qui contient par exemple plumes, bec, et ailes. L'IA apprend ainsi à reconnaître un oiseau sans l’avoir vu auparavant.

Le modèle s’appuie donc sur des connaissances auxiliaires. Le modèle ne dessine donc pas directement une frontière entre les classes qu’il a vues, mais calcule des scores de probabilité à partir des connaissances auxiliaires.

À noter que les grands modèles de langage, les LLM, excellent souvent dans l'exercice de zero-shot. Pourquoi ? Parce qu’ils comprennent les étiquettes en langage naturel et peuvent classer, extraire, résumer ou suivre des instructions sans exemples, simplement via la consigne, c'est à dire le prompt.

Le zero-shot a aussi ses limites

Enfin, le troisième point, c'est que le zero-shot a aussi ses limites. Et je vous donne direct un exemple pour que vous compreniez bien.

En se basant sur les étiquettes et non les images étiquetées, difficile de savoir si le mot jaguar fait référence à une marque de voiture ou à un animal.

Cette sensibilité sémantique fait chuter les performances si le domaine réel s’éloigne trop de ce que le modèle d'IA a appris.

Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

438 episodes

Artwork
iconShare
 
Manage episode 501498172 series 3383386
Content provided by Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes. All podcast content including episodes, graphics, and podcast descriptions are uploaded and provided directly by Guillaume Serries and ZD Tech : tout comprendre en moins de 3 minutes or their podcast platform partner. If you believe someone is using your copyrighted work without your permission, you can follow the process outlined here https://player.fm/legal.

Aujourd’hui, on parle d’« apprentissage zero-shot », ou ZSL pour zero shot learning.

En clair, c’est la capacité d’un modèle d'IA à reconnaître ou classer des choses qu’il n’a jamais vues lors de son entraînement.

Et voici l’essentiel en trois points sur la base d'un document d'explication d'IBM.

Le ZSL, à quoi ça sert ?

Alors dans un premier temps, à quoi ça sert et en quoi c’est différent des méthodes d'apprentissage classiques utilisées par les concepteurs d'intelligence artificielle.

La plupart des modèles d'IA apprennent en mode supervisé. C'est à dire qu'on leur montre des milliers d’exemples étiquetés, d'un chat par exemple. Et le système apprend à reconnaître un chat avec cette méthode.

Le problème, c'est que étiqueter des données coûte cher, prend du temps, et surtout que certaines classes sont rares, voire inédites, comme les nouvelles maladies, des espèces animales peu documentées, ou encore un nouveau type d’attaque informatique. Le zero-shot répond donc à cette contrainte.

Le ZSL, comment ça marche ?

Au lieu d’apprendre à reconnaître un oiseau en regardant des photos étiquetées, l'entraînement consiste à lire à l'IA une définition qui contient par exemple plumes, bec, et ailes. L'IA apprend ainsi à reconnaître un oiseau sans l’avoir vu auparavant.

Le modèle s’appuie donc sur des connaissances auxiliaires. Le modèle ne dessine donc pas directement une frontière entre les classes qu’il a vues, mais calcule des scores de probabilité à partir des connaissances auxiliaires.

À noter que les grands modèles de langage, les LLM, excellent souvent dans l'exercice de zero-shot. Pourquoi ? Parce qu’ils comprennent les étiquettes en langage naturel et peuvent classer, extraire, résumer ou suivre des instructions sans exemples, simplement via la consigne, c'est à dire le prompt.

Le zero-shot a aussi ses limites

Enfin, le troisième point, c'est que le zero-shot a aussi ses limites. Et je vous donne direct un exemple pour que vous compreniez bien.

En se basant sur les étiquettes et non les images étiquetées, difficile de savoir si le mot jaguar fait référence à une marque de voiture ou à un animal.

Cette sensibilité sémantique fait chuter les performances si le domaine réel s’éloigne trop de ce que le modèle d'IA a appris.

Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !


Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

  continue reading

438 episodes

Todos los episodios

×
 
Loading …

Welcome to Player FM!

Player FM is scanning the web for high-quality podcasts for you to enjoy right now. It's the best podcast app and works on Android, iPhone, and the web. Signup to sync subscriptions across devices.

 

Quick Reference Guide

Copyright 2025 | Privacy Policy | Terms of Service | | Copyright
Listen to this show while you explore
Play