Apprentissage des boules de mots avec des requêtes de correction

Leonor Becerra Bonache; Colin de La Higuera; Jean-Christophe Janodet; Frédéric Tantini

Communication Dans Un Congrès Année : 2007

Apprentissage des boules de mots avec des requêtes de correction

(1) , (2) , (2) , (2)

1
2

Leonor Becerra Bonache

Fonction : Auteur

Universitat Rovira i Virgili

Colin de La Higuera

Fonction : Auteur
PersonId : 18019
IdHAL : colin-de-la-higuera
IdRef : 053503503

Laboratoire Hubert Curien

Jean-Christophe Janodet

Fonction : Auteur

Laboratoire Hubert Curien

Frédéric Tantini

Fonction : Auteur
PersonId : 836491

Laboratoire Hubert Curien

Résumé

Dans les années 80, Angluin a développé un paradigme d'apprentissage actif basé sur un oracle, capable de répondre à des requêtes d'appartenance et des requêtes d'équivalence. Or, si dans les différentes applications de l'apprentissage actif, les réponses aux premières sont souvent faciles à obtenir, avoir droit aux secondes n'est pas toujours réaliste. Pour contourner cette difficulté, nous proposons un nouveau type de requêtes, appelées requêtes de correction, que l'on étudie ici dans un contexte d'inférence grammaticale. Quand un mot est soumis à l'oracle, ce dernier le valide s'il appartient au langage cible, ou bien propose une correction de ce mot. Une telle correction est un mot du langage qui est proche de la requête (au sens de la distance d'édition). Nous introduisons ensuite une classe non triviale de langages, celle des boules topologiques de mots. Nous montrons que cette classe n'est pas apprenable dans le modèle d'Angluin, mais qu'elle l'est, avec un nombre linéaire de requêtes de correction, voire logarithmique sous certaines hypothèses. Enfin, nous étudions le bon comportement expérimental de nos algorithmes.

Domaines

Apprentissage [cs.LG] Informatique et langage [cs.CL]

Frédéric Tantini : Connectez-vous pour contacter le contributeur

https://ujm.hal.science/ujm-00161778

Soumis le : mercredi 11 juillet 2007-15:39:21

Dernière modification le : jeudi 21 mars 2024-10:12:05

Dates et versions

ujm-00161778 , version 1 (11-07-2007)

Identifiants

HAL Id : ujm-00161778 , version 1

Citer

Leonor Becerra Bonache, Colin de La Higuera, Jean-Christophe Janodet, Frédéric Tantini. Apprentissage des boules de mots avec des requêtes de correction. CAp'07, Jul 2007, France. pp.55-70. ⟨ujm-00161778⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-ST-ETIENNE IOGS CNRS LAHC PARISTECH UDL

45 Consultations

0 Téléchargements

Apprentissage des boules de mots avec des requêtes de correction

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager