De l'importance du pré-traitement des données pour l'utilisation de l'inférence grammaticale en Web Usage Mining - Université Jean-Monnet-Saint-Étienne Accéder directement au contenu
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2006

De l'importance du pré-traitement des données pour l'utilisation de l'inférence grammaticale en Web Usage Mining

Résumé

Le Web Usage Mining est un processus d'extraction et d'analyse de données pour permettre la détection d'un type d'usager sur un site internet. Cette pratique est assez répandue sur les serveurs internet dédiés au commerce. En effet, en détectant un comportement, les concepteurs de sites peuvent orienter l'utilisateur à des fins mercantiles, ergonomiques ou fonctionnelles. Cette tâche relève de la fouille de données : plusieurs étapes sont nécessaires à la réalisation du processus complet. Divers travaux décrivent des techniques de récupérations de données et de modélisation de ces dernières pour extraire de l'information. Les données utilisées correspondent usuellement aux requêtes enregistrées par un serveur. Ces dernières, pour des questions d'architecture du réseau, ne sont pas complètes. Le pré-traitement nécessaire de ses données brutes pour les rendre exploitables se situe en amont de tout le processus et est donc très important car il influe sur l'apprentissage. Dernièrement des modèles structurés sont apparus pour résoudre ce type de tâche. Nous voulons travailler sur de tels modèles, issue de l'inférence grammaticale. Nous détaillons un ensemble de techniques de traitement et d'amélioration des données brutes. Nous présentons une évaluation de ces méthodes de reconstruction de logs sur des données artificielles. Nous proposons pour terminer une série d'expérimentations mettant en évidence l'affectation des algorithmes classiques d'inférence grammaticale par la détérioration des logs réels, due aux réseaux
Fichier non déposé

Dates et versions

ujm-00110265 , version 1 (27-10-2006)

Identifiants

  • HAL Id : ujm-00110265 , version 1

Citer

Thierry Murgue. De l'importance du pré-traitement des données pour l'utilisation de l'inférence grammaticale en Web Usage Mining. Revue des Nouvelles Technologies de l'Information, 2006, E-5, Chapître : Modélisation d'utilisateurs et Personnalisation de l'Interaction Homme-Machine. ⟨ujm-00110265⟩
434 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More