De l'importance du pré-traitement des données pour l'utilisation de l'inférence grammaticale en Web Usage Mining

Résumé : Le Web Usage Mining est un processus d'extraction et d'analyse de données pour permettre la détection d'un type d'usager sur un site internet. Cette pratique est assez répandue sur les serveurs internet dédiés au commerce. En effet, en détectant un comportement, les concepteurs de sites peuvent orienter l'utilisateur à des fins mercantiles, ergonomiques ou fonctionnelles. Cette tâche relève de la fouille de données : plusieurs étapes sont nécessaires à la réalisation du processus complet. Divers travaux décrivent des techniques de récupérations de données et de modélisation de ces dernières pour extraire de l'information. Les données utilisées correspondent usuellement aux requêtes enregistrées par un serveur. Ces dernières, pour des questions d'architecture du réseau, ne sont pas complètes. Le pré-traitement nécessaire de ses données brutes pour les rendre exploitables se situe en amont de tout le processus et est donc très important car il influe sur l'apprentissage. Dernièrement des modèles structurés sont apparus pour résoudre ce type de tâche. Nous voulons travailler sur de tels modèles, issue de l'inférence grammaticale. Nous détaillons un ensemble de techniques de traitement et d'amélioration des données brutes. Nous présentons une évaluation de ces méthodes de reconstruction de logs sur des données artificielles. Nous proposons pour terminer une série d'expérimentations mettant en évidence l'affectation des algorithmes classiques d'inférence grammaticale par la détérioration des logs réels, due aux réseaux
Document type :
Journal articles
Complete list of metadatas

https://hal-ujm.archives-ouvertes.fr/ujm-00110265
Contributor : Thierry Murgue <>
Submitted on : Friday, October 27, 2006 - 11:09:08 AM
Last modification on : Thursday, October 17, 2019 - 12:34:35 PM

Identifiers

  • HAL Id : ujm-00110265, version 1

Citation

Thierry Murgue. De l'importance du pré-traitement des données pour l'utilisation de l'inférence grammaticale en Web Usage Mining. Revue des Nouvelles Technologies de l'Information, Hermann, 2006, Chapître : Modélisation d'utilisateurs et Personnalisation de l'Interaction Homme-Machine. ⟨ujm-00110265⟩

Share

Metrics

Record views

190