Si è affrontato il problema del riconoscimento vocale di parlato continuo mediante Modelli di Markov Nascosti (HMM). Dopo aver svolto una rassegna dello stato dell'arte per le tecnologie coinvolte, la tesi espone i diversi risultati sperimentali ottenuti per gli originali elementi innovativi introdotti. Viene innanzitutto realizzato un modello di sorgente markoviano per l'alfabeto fonetico che descrive le unità elementari di produzione linguistica, stimando le probabilità condizionate non soltanto al fonema precedente, ma anche alla posizione del fonema all'interno della parola e della sillaba, catturando così molti dei vincoli fonotattici della lingua. Quindi, l'algoritmo di stima dei parametri degli HMM che rappresentano le variabilità acustiche degli elementi fonetici è modificato allo scopo di adottare dei modelli di semi-markov, in cui la probabilità di rimanere in uno stesso stato decade esponenzialmente nel tempo, fornendo valori di probabilità di durata più verosimili per ciò che riguarda gli eventi fonatori. Infine, l'algoritmo di Viterbi necessario a svolgere il passo di riconoscimento è anch'esso modificato per tener conto del nuovo modello di durata, dimostrando un teorema che permette di mantenerne la complessità computazionale nello stesso ordine di grandezza degli HMM tradizionali.
Decodifica Acustico-Fonetica del Messaggio Vocale su basi Informativo-Strutturali mediante modelli di Markov nascosti / Falaschi, Alessandro. - STAMPA. - (1989).
Decodifica Acustico-Fonetica del Messaggio Vocale su basi Informativo-Strutturali mediante modelli di Markov nascosti
FALASCHI, Alessandro
01/01/1989
Abstract
Si è affrontato il problema del riconoscimento vocale di parlato continuo mediante Modelli di Markov Nascosti (HMM). Dopo aver svolto una rassegna dello stato dell'arte per le tecnologie coinvolte, la tesi espone i diversi risultati sperimentali ottenuti per gli originali elementi innovativi introdotti. Viene innanzitutto realizzato un modello di sorgente markoviano per l'alfabeto fonetico che descrive le unità elementari di produzione linguistica, stimando le probabilità condizionate non soltanto al fonema precedente, ma anche alla posizione del fonema all'interno della parola e della sillaba, catturando così molti dei vincoli fonotattici della lingua. Quindi, l'algoritmo di stima dei parametri degli HMM che rappresentano le variabilità acustiche degli elementi fonetici è modificato allo scopo di adottare dei modelli di semi-markov, in cui la probabilità di rimanere in uno stesso stato decade esponenzialmente nel tempo, fornendo valori di probabilità di durata più verosimili per ciò che riguarda gli eventi fonatori. Infine, l'algoritmo di Viterbi necessario a svolgere il passo di riconoscimento è anch'esso modificato per tener conto del nuovo modello di durata, dimostrando un teorema che permette di mantenerne la complessità computazionale nello stesso ordine di grandezza degli HMM tradizionali.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.