Unsupervised 3D image clustering and extension to joint color and depth segmentation

Résumé : L'accès aux séquences d'images 3D s'est aujourd'hui démocratisé, grâce aux récentes avancées dans le développement des capteurs de profondeur ainsi que des méthodes permettant de manipuler des informations 3D à partir d'images 2D. De ce fait, il y a une attente importante de la part de la communauté scientifique de la vision par ordinateur dans l'intégration de l'information 3D. En effet, des travaux de recherche ont montré que les performances de certaines applications pouvaient être améliorées en intégrant l'information 3D. Cependant, il reste des problèmes à résoudre pour l'analyse et la segmentation de scènes intérieures comme (a) comment l'information 3D peut-elle être exploitée au mieux ? et (b) quelle est la meilleure manière de prendre en compte de manière conjointe les informations couleur et 3D ? Nous abordons ces deux questions dans cette thèse et nous proposons de nouvelles méthodes non supervisées pour la classification d'images 3D et la segmentation prenant en compte de manière conjointe les informations de couleur et de profondeur. A cet effet, nous formulons l'hypothèse que les normales aux surfaces dans les images 3D sont des éléments à prendre en compte pour leur analyse, et leurs distributions sont modélisables à l'aide de lois de mélange. Nous utilisons la méthode dite « Bregman Soft Clustering » afin d'être efficace d'un point de vue calculatoire. De plus, nous étudions plusieurs lois de probabilités permettant de modéliser les distributions de directions : la loi de von Mises-Fisher et la loi de Watson. Les méthodes de classification « basées modèles » proposées sont ensuite validées en utilisant des données de synthèse puis nous montrons leur intérêt pour l'analyse des images 3D (ou de profondeur). Une nouvelle méthode de segmentation d'images couleur et profondeur, appelées aussi images RGB-D, exploitant conjointement la couleur, la position 3D, et la normale locale est alors développée par extension des précédentes méthodes et en introduisant une méthode statistique de fusion de régions « planes » à l'aide d'un graphe. Les résultats montrent que la méthode proposée donne des résultats au moins comparables aux méthodes de l'état de l'art tout en demandant moins de temps de calcul. De plus, elle ouvre des perspectives nouvelles pour la fusion non supervisée des informations de couleur et de géométrie. Nous sommes convaincus que les méthodes proposées dans cette thèse pourront être utilisées pour la classification d'autres types de données comme la parole, les données d'expression en génétique, etc. Elles devraient aussi permettre la réalisation de tâches complexes comme l'analyse conjointe de données contenant des images et de la parole
Type de document :
Thèse
Other. Université Jean Monnet - Saint-Etienne, 2014. English. 〈NNT : 2014STET4013〉
Liste complète des métadonnées

Littérature citée [100 références]  Voir  Masquer  Télécharger

https://hal-ujm.archives-ouvertes.fr/tel-01160770
Contributeur : Abes Star <>
Soumis le : jeudi 9 juillet 2015 - 10:37:06
Dernière modification le : mercredi 25 juillet 2018 - 14:05:31
Document(s) archivé(s) le : mercredi 26 avril 2017 - 01:40:05

Fichier

these-HASNAT-Abul-2014.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01160770, version 2

Citation

Md Abul Hasnat. Unsupervised 3D image clustering and extension to joint color and depth segmentation. Other. Université Jean Monnet - Saint-Etienne, 2014. English. 〈NNT : 2014STET4013〉. 〈tel-01160770v2〉

Partager

Métriques

Consultations de la notice

1067

Téléchargements de fichiers

866