Speaker independent acoustic-to-articulatory inversion

Posted on:2015-03-08

Degree:Ph.D

Type:Dissertation

University:Marquette University

Candidate:Ji, An

Full Text:PDF

GTID:1478390017993608

Subject:Computer Engineering

Abstract/Summary:

PDF Full Text Request

Acoustic-to-articulatory inversion, the determination of articulatory parameters from acoustic signals, is a difficult but important problem for many speech processing applications, such as automatic speech recognition (ASR) and computer aided pronunciation training (CAPT). In recent years, several approaches have been successfully implemented for speaker dependent models with parallel acoustic and kinematic training data. However, in many practical applications inversion is needed for new speakers for whom no articulatory data is available. In order to address this problem, this dissertation introduces a novel speaker adaptation approach called Parallel Reference Speaker Weighting (PRSW), based on parallel acoustic and articulatory Hidden Markov Models (HMM). This approach uses a robust normalized articulatory space and palate referenced articulatory features combined with speaker-weighted adaptation to form an inversion mapping for new speakers that can accurately estimate articulatory trajectories. The proposed PRSW method is evaluated on the newly collected Marquette electromagnetic articulography -- Mandarin Accented English (EMA-MAE) corpus using 20 native English speakers. Cross-speaker inversion results show that given a good selection of reference speakers with consistent acoustic and articulatory patterns, the PRSW approach gives good speaker independent inversion performance even without kinematic training data.

Keywords/Search Tags:

Articulatory, Inversion, Acoustic, Speaker, PRSW

PDF Full Text Request

Related items

1	Multi-Modal Acoustic-to-Articulatory Inversion Based On Speech Decomposition And Auxiliary Feature
2	The Study Of Acoustic-to-articulatory Inversion Based On Generative Adversarial Networks
3	A Study On Acoustic-to-articulatory Inversion Based On Feature Transformation Fusion And Attention Mechanism
4	Research On The Speech Emotion Recognition Fusing Articulatory And Acoustic Features
5	Morphological Normalization Of EMA-based Data For Articulatory Speech Recognition
6	Acoustic And Articulatory Study Of Ewe Vowels From A Multimodal Speech Database
7	Frequency warping by linear transformation, and vocal tract inversion for speaker normalization in automatic speech recognition
8	Text-Independent Speaker Verification Based On GMM And High-Level Information
9	Research Of Least Square Acoustic Impedance Inversion Arithmetic
10	Research On Speaker Adaptation Methods Based On RNN-BLSTM Acoustic Model