Show all publications

Adaptation Au Locuteur De Modèles Acoustiques Markoviens Pour La Reconnaissance Automatique De La Parole

Download PDFDownload Bibliography in Open DocumentDownload Bibliography in HTMLDownload BibTeXDownload RISDownload Bibliographical Ontology (RDF)
Authors:
Details:
PhD thesis, Nancy 2, 2004.
Abstract:
Les systèmes de reconnaissance automatique de la parole (SRAP) actuels souffrent d'une dégradation des performances lorsqu'ils sont utilisés dans des conditions acoustiques différentes de celles employées lors de l'apprentissage. Les techniques d'adaptation permettent de pallier ce problème. Elles permettent de réduire les différences acoustiques entre les conditions d'apprentissage et les conditions d'utilisation du système, ce qui améliore le taux de reconnaissance du système pour le nouveau locuteur considéré (adaptation au locuteur) ou le nouvel environnement visé (adaptation à l'environnement). Mes travaux de thèse portent essentiellement sur l'adaptation au locuteur des modèles acoustiques d'un système de reconnaissance automatique de la parole. Toutes les techniques étudiées et proposées pendant la thèse furent implantées et évaluées à l'aide du moteur de reconnaissance vocale ESPERE. Elles furent évaluées sur un ensemble de phrases prononcées par seize locuteurs et issues du corpus de parole Resource Management. Je vous présenterai dans un premier temps les trois techniques classiques d'adaptation au locuteur qui ont été étudiées pendant ma thèse. Ces techniques sont actuellement les plus utilisées et les plus déclinées dans le domaine de l'adaptation des modèles acoustiques d'un système de reconnaissance vocale. Il s'agit des techniques Structural Maximum Likelihood Linear Regression (SMLLR), Structural Maximum A Posteriori (SMAP) et les Voix Propres (EigenVoices ou EV). Les résultats des expériences menées avec ces trois techniques confirment ceux de la littérature : - EV est efficace lorsque très peu de données d'adaptation sont disponibles (dans notre cas avec une phrase d'adaptation) - SMLLR et SMAP sont efficaces lorsque plus de trois phrases d'adaptation sont utilisées.
Keywords:
Reconnaissance automatique de la parole, adaptation au locuteur, HMM, MLLR, MAP, Eigenvoices.
Publication Category:
PhD Thesis
Copyright 2010-2019 © Laboratoire Connaissance et Intelligence Artificielle Distribuées - Université Bourgogne Franche-Comté - Privacy policy