Identification à la limite de langages dans le cadre d'un bruit systématique

Frédéric Tantini; Colin de La Higuera; Jean-Christophe Janodet

Communication Dans Un Congrès Année : 2006

Identification à la limite de langages dans le cadre d'un bruit systématique

(1) , (1) , (1)

Frédéric Tantini

Fonction : Auteur
PersonId : 836491

Laboratoire Hubert Curien

Colin de La Higuera

Fonction : Auteur
PersonId : 18019
IdHAL : colin-de-la-higuera
IdRef : 053503503

Laboratoire Hubert Curien

Jean-Christophe Janodet

Fonction : Auteur

Laboratoire Hubert Curien

Résumé

Pour étudier l'apprentissage à partir de données bruitées, il est usuel de se baser sur un modèle de bruit statistique. L'influence du bruit est alors envisagé selon des critères pragmatiques ou eux-mêmes statistiques, en se basant donc sur un paradigme prenant en compte une distribution des données. Dans cet article, nous étudions le bruit comme un phénomène non statistique, en définissant la notion de bruit systématique. Nous établissons différrentes manières d'apprendre (à la limite) à partir de données bruitées. La première se base sur une technique de réduction entre problèmes et consiste à apprendre à partir des données qu'on sait bruitées, puis à débruiter la fonction apprise. La seconde consiste à débruiter à la volée les exemples d'apprentissage, à identifier ainsi à la limite les bons exemples, et à apprendre alors à partir d'exemples non corrompus. Nous donnons dans les deux cas des conditions suffisantes pour que l'apprentissage soit possible et montrons à travers différents exemples (provenant en particulier du domaine de l'inférence grammaticale) que nos techniques sont complétentaires.

Mots clés

Identification à la limite langages bruit prétopologie

Domaines

Apprentissage [cs.LG] Informatique et langage [cs.CL] Intelligence artificielle [cs.AI]

Frédéric Tantini : Connectez-vous pour contacter le contributeur

https://ujm.hal.science/ujm-00112405

Soumis le : mercredi 8 novembre 2006-15:06:48

Dernière modification le : vendredi 24 mars 2023-14:52:48

Dates et versions

ujm-00112405 , version 1 (08-11-2006)

Identifiants

HAL Id : ujm-00112405 , version 1

Citer

Frédéric Tantini, Colin de La Higuera, Jean-Christophe Janodet. Identification à la limite de langages dans le cadre d'un bruit systématique. CAp 2006, May 2006, Trégastel, France. pp.203-218. ⟨ujm-00112405⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-ST-ETIENNE IOGS CNRS LAHC PARISTECH UDL

46 Consultations

0 Téléchargements

Identification à la limite de langages dans le cadre d'un bruit systématique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager