Représentation et comparaison de séquences par visualisation

Résumé : Dans cet article, nous présentons un outil de visualisation de séquences modélisées par des arbres de suffixes probabilistes (Prediction suffix trees - PST). Ce type d'arbre permet de représenter une chaîne de Markov d'ordre variable. Dans différentes applications, il s'est avéré plus efficace qu'une chaîne de Markov d'ordre fixe, avec un coût calculatoire moindre. Pour ces raisons, il nous a paru intéressant d'exploiter le caractère arborescent de ce mode de représentation des séquences, non seulement d'un point de vue algorithmique, mais aussi d'un point de vue visuel. Le logiciel que nous avons développé dans ce but fournit une représentation graphique d'un PST appris à partir de séquences et, il permet de le comparer à un autre. Dans un contexte de classement supervisé d'une nouvelle séquence, il apporte une information complémentaire par rapport au PST en mettant en évidence les sous-séquences qui n'ont pas été observées dans la nouvelle séquence bien qu'elles soient caractéristiques du modèle sous-jacent à sa classe d'affectation. Ainsi, il permet de mieux appréhender la structure des séquences et d'améliorer le processus de fouille de données par leur visualisation.
Document type :
Journal articles
Complete list of metadatas

https://hal-ujm.archives-ouvertes.fr/ujm-00120349
Contributor : Christine Largeron <>
Submitted on : Thursday, December 14, 2006 - 2:58:43 PM
Last modification on : Wednesday, July 25, 2018 - 2:05:30 PM

Identifiers

  • HAL Id : ujm-00120349, version 1

Collections

Citation

Christine Largeron, Cedric Dreissia. Représentation et comparaison de séquences par visualisation. Revue des Nouvelles Technologies Numéro spécial Visualisation en Extraction des Connaissances, 2006, Volume 24 (16), pp.3153-3164. ⟨ujm-00120349⟩

Share

Metrics

Record views

98