Oggigiorno, le comunicazioni vocali immersive stanno diventando sempre più parte integrante del nostro modo di interagire a distanza con altri utenti. Tuttavia i nuovi scenari immersivi sono molto sensibili alle sorgenti interferenti presenti nell’ambiente in cui avviene la comunicazione, per cui la qualità del parlato viene compromessa ancora di più. Allo scopo di mantenere elevata la qualità percepita della comunicazione nuovi sistemi intelligenti vengono applicati ai dispositivi di comunicazione. Questo lavoro propone una nuova interfaccia acustica intelligente in grado di migliorare la qualità del parlato in applicazioni di teleconferenza in condizioni ambientali avverse. In particolare, la novità di tale interfaccia intelligente consiste in una tecnica originale di beamforming adattativo progettata ad hoc per risultare robusta alle sorgenti interferenti non stazionarie in ambienti riverberanti e rumorosi. Il sistema adattativo proposto è basato su un’architettura combinata in grado di offrire complessivamente capacità di tracciamento e prestazioni a regime superiori ai sistemi convenzionali. Inoltre, la flessibilità del sistema proposto permette di elaborare le informazioni acquisite offrendo prestazioni ottimali in presenza di qualsiasi tipo di variazione indotta dalle sorgenti interferenti sull’ambiente di ascolto. La valutazione del sistema è condotta rispetto a diverse condizioni di lavoro e quindi rispetto a specifiche problematiche che possono verificarsi in scenari reali di teleconferenza. Le prestazioni sul miglioramento della qualità del segnale derivato dall’utilizzo del sistema proposto sono valutate attraverso la stima del rapporto segnale-rumore (SNR), che quantifica in particolare la riduzione di rumore interferente ottenuta. Gli esperimenti mostrano come l’interfaccia acustica intelligente proposta, in presenza di sorgenti interferenti non stazionarie, riesca ad ottenere un miglioramento qualitativo del parlato rispetto ai sistemi convenzionali utilizzati.
Un'interfaccia acustica intelligente per comunicazioni immersive in ambienti non stazionari / Comminiello, D.; Scarpiniti, M.; Cirillo, A.; Parisi, R.; Falcone, M.; Uncini, A.. - (2012), pp. 237-252. (Intervento presentato al convegno VIII Convegno Nazionale dell'Associazione Italiana di Scienze della Voce (AISV2012) tenutosi a Rome, Italy).
Un'interfaccia acustica intelligente per comunicazioni immersive in ambienti non stazionari
D. Comminiello;M. Scarpiniti;A. Cirillo;R. Parisi;A. Uncini
2012
Abstract
Oggigiorno, le comunicazioni vocali immersive stanno diventando sempre più parte integrante del nostro modo di interagire a distanza con altri utenti. Tuttavia i nuovi scenari immersivi sono molto sensibili alle sorgenti interferenti presenti nell’ambiente in cui avviene la comunicazione, per cui la qualità del parlato viene compromessa ancora di più. Allo scopo di mantenere elevata la qualità percepita della comunicazione nuovi sistemi intelligenti vengono applicati ai dispositivi di comunicazione. Questo lavoro propone una nuova interfaccia acustica intelligente in grado di migliorare la qualità del parlato in applicazioni di teleconferenza in condizioni ambientali avverse. In particolare, la novità di tale interfaccia intelligente consiste in una tecnica originale di beamforming adattativo progettata ad hoc per risultare robusta alle sorgenti interferenti non stazionarie in ambienti riverberanti e rumorosi. Il sistema adattativo proposto è basato su un’architettura combinata in grado di offrire complessivamente capacità di tracciamento e prestazioni a regime superiori ai sistemi convenzionali. Inoltre, la flessibilità del sistema proposto permette di elaborare le informazioni acquisite offrendo prestazioni ottimali in presenza di qualsiasi tipo di variazione indotta dalle sorgenti interferenti sull’ambiente di ascolto. La valutazione del sistema è condotta rispetto a diverse condizioni di lavoro e quindi rispetto a specifiche problematiche che possono verificarsi in scenari reali di teleconferenza. Le prestazioni sul miglioramento della qualità del segnale derivato dall’utilizzo del sistema proposto sono valutate attraverso la stima del rapporto segnale-rumore (SNR), che quantifica in particolare la riduzione di rumore interferente ottenuta. Gli esperimenti mostrano come l’interfaccia acustica intelligente proposta, in presenza di sorgenti interferenti non stazionarie, riesca ad ottenere un miglioramento qualitativo del parlato rispetto ai sistemi convenzionali utilizzati.File | Dimensione | Formato | |
---|---|---|---|
Comminiello_Interfaccia-acustica_2012.pdf
solo gestori archivio
Tipologia:
Versione editoriale (versione pubblicata con il layout dell'editore)
Licenza:
Tutti i diritti riservati (All rights reserved)
Dimensione
418.12 kB
Formato
Adobe PDF
|
418.12 kB | Adobe PDF | Contatta l'autore |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.