Intégration de la structure dans un modèle probabiliste de document. - Archive ouverte HAL Access content directly
Conference Papers Year : 2008

Intégration de la structure dans un modèle probabiliste de document.

(1) , (1) , (1)
1

Abstract

En fouille de textes comme en recherche d'information, différents modèles, de type probabiliste, vectoriel ou booléen, se sont révélés bien adaptés pour représenter des documents textuels mais, ces modèles présentent l'inconvénient de ne pas tenir compte de la structure du document. Or la plupart des informations disponibles aujourd'hui sur Internet ou dans des bases documentaires sont fortement structurées. Dans cet article, nous proposons d'étendre le modèle probabiliste de représentation des documents de façon à tenir compte du poids d'une certaine catégorie d'éléments structurels : les balises représentant la structure logique et la structure de mise en forme. Ce modèle a été évalué à l'aide de la collection de la campagne d'évaluation INEX 2006.
Not file

Dates and versions

ujm-00366427 , version 1 (06-03-2009)

Identifiers

  • HAL Id : ujm-00366427 , version 1

Cite

Mathias Géry, Christine Largeron, Franck Thollard. Intégration de la structure dans un modèle probabiliste de document.. Extraction et Gestion des Connaissances (EGC 2008), Jan 2008, Sophia Antipolis, France. pp.613-618. ⟨ujm-00366427⟩
22 View
0 Download

Share

Gmail Facebook Twitter LinkedIn More