Représentation et comparaison de séquences par visualisation - Archive ouverte HAL Access content directly
Journal Articles Revue des Nouvelles Technologies Numéro spécial Visualisation en Extraction des Connaissances Year : 2006

Représentation et comparaison de séquences par visualisation

Christine Largeron
Cedric Dreissia
  • Function : Author

Abstract

Dans cet article, nous présentons un outil de visualisation de séquences modélisées par des arbres de suffixes probabilistes (Prediction suffix trees - PST). Ce type d'arbre permet de représenter une chaîne de Markov d'ordre variable. Dans différentes applications, il s'est avéré plus efficace qu'une chaîne de Markov d'ordre fixe, avec un coût calculatoire moindre. Pour ces raisons, il nous a paru intéressant d'exploiter le caractère arborescent de ce mode de représentation des séquences, non seulement d'un point de vue algorithmique, mais aussi d'un point de vue visuel. Le logiciel que nous avons développé dans ce but fournit une représentation graphique d'un PST appris à partir de séquences et, il permet de le comparer à un autre. Dans un contexte de classement supervisé d'une nouvelle séquence, il apporte une information complémentaire par rapport au PST en mettant en évidence les sous-séquences qui n'ont pas été observées dans la nouvelle séquence bien qu'elles soient caractéristiques du modèle sous-jacent à sa classe d'affectation. Ainsi, il permet de mieux appréhender la structure des séquences et d'améliorer le processus de fouille de données par leur visualisation.
Not file

Dates and versions

ujm-00120349 , version 1 (14-12-2006)

Identifiers

  • HAL Id : ujm-00120349 , version 1

Cite

Christine Largeron, Cedric Dreissia. Représentation et comparaison de séquences par visualisation. Revue des Nouvelles Technologies Numéro spécial Visualisation en Extraction des Connaissances, 2006, Volume 24 (16), pp.3153-3164. ⟨ujm-00120349⟩
44 View
0 Download

Share

Gmail Facebook Twitter LinkedIn More