Publication:
Reconocimiento del habla con acento español basado en un modelo acústico

dc.contributor.authorSánchez -Zhunio, Cristina
dc.contributor.authorPlaza Salto, Johanna Gabriela
dc.contributor.authorZambrano Martínez, Jorge Luis
dc.contributor.authorCedillo Orellana, Irene Priscila
dc.contributor.authorOrellana Cordero, Marcos Patricio
dc.contributor.authorAcosta Urigüen, María Inés
dc.date.accessioned2022-07-25T21:29:37Z
dc.date.available2022-07-25T21:29:37Z
dc.date.issued2022
dc.descriptionEl objetivo de este artículo fue generar un modelo reconocimiento automático de voz (RAV) basado en la traducción de la voz humana a texto, a este proceso se lo ha considerado como una de las ramas de la inteligencia artificial. El análisis de voz permite identificar información sobre la acústica, fonética, sintáctica, semántica de las palabras, entre otros elementos que pueden identificar ambigüedad en términos, errores de pronunciación, sintáctica similar pero semántica diferente, que representan características propias del lenguaje humano. El modelo se centró en el análisis acústico de las palabras, proponiendo la generación de una metodología para reconocimiento acústico, a partir de transcripciones del habla de audios que contienen voz humana. Se utilizó la tasa de error por palabra para identificar la precisión del modelo. Los audios son llamadas de emergencia registrados por el Servicio Integrado de Seguridad ECU 911. El modelo fue entrenado con la herramienta CMUSphinx para idioma español sin conexión a internet. Los resultados mostraron que la tasa de error por palabra varía en relación con la cantidad de audios; es decir a mayor cantidad de audios menor cantidad de palabras erróneas y mayor exactitud del modelo. La investigación concluyó haciendo énfasis en la duración de cada audio como variable que afecta la precisión del modelo.
dc.description.abstractThe objective of the article was to generate an Automatic Speech Recognition (ASR) model based on the translation from human voice to text, being considered as one of the branches of artificial intelligence. Voice analysis allows identifying information about the acoustics, phonetics, syntax, semantics of words, among other elements where ambiguity in terms, pronunciation errors, similar syntax but different semantics can be identified, which represent characteristics of the language. The model focused on the acoustic analysis of words proposing the generation of a methodology for acoustic recognition from speech transcripts from audios containing human voice and the error rate per word was considered to identify the accuracy of the model. The audios were taken from the Integrated Security Service ECU911 that represent emergency calls registered by the entity. The model was trained with the CMUSphinx tool for the Spanish language without internet connection. The results showed that the word error rate varies in relation to the number of audios; that is, the greater the number of audios, the smaller number of erroneous words and the greater the accuracy of the model. The investigation concluded by emphasizing the duration of each audio as a variable that affects the accuracy of the model.
dc.identifier.doi10.29019/enfoqueute.839
dc.identifier.issn1390-6542
dc.identifier.urihttp://dspace.ucuenca.edu.ec/handle/123456789/39510
dc.identifier.urihttps://doi.org/10.29019/enfoqueute.839
dc.language.isoes_ES
dc.sourceEnfoque UTE
dc.subjectRAV
dc.subjectModelo de lenguaje
dc.subjectCMUSphinx
dc.titleReconocimiento del habla con acento español basado en un modelo acústico
dc.title.alternativeSpeech recognition based on spanish accent acoustic model
dc.typeARTÍCULO
dc.ucuenca.afiliacionAcosta, M., Universidad del Azuay, Cuenca, Ecuador
dc.ucuenca.afiliacionOrellana, M., Universidad del Azuay, Cuenca, Ecuador
dc.ucuenca.afiliacionPlaza, J., Universidad del Azuay, Cuenca, Ecuador
dc.ucuenca.afiliacionSánchez, C., Universidad del Azuay, Cuenca, Ecuador
dc.ucuenca.afiliacionZambrano, J., Universidad del Azuay, Cuenca, Ecuador
dc.ucuenca.afiliacionCedillo, I., Universidad de Cuenca, Facultad de Ingeniería, Cuenca, Ecuador
dc.ucuenca.areaconocimientofrascatiamplio2. Ingeniería y Tecnología
dc.ucuenca.areaconocimientofrascatidetallado2.11.2 Otras Ingenierias y Tecnologías
dc.ucuenca.areaconocimientofrascatiespecifico2.11 Otras Ingenierias y Tecnologías
dc.ucuenca.areaconocimientounescoamplio07 - Ingeniería, Industria y Construcción
dc.ucuenca.areaconocimientounescodetallado0714 - Electrónica y Automatización
dc.ucuenca.areaconocimientounescoespecifico071 - Ingeniería y Profesiones Afines
dc.ucuenca.correspondenciaCedillo Orellana, Irene Priscila, priscila.cedillo@ucuenca.edu.ec
dc.ucuenca.idautor0102815842
dc.ucuenca.idautor0000-0002-3671-9362
dc.ucuenca.idautor0000-0003-4865-2983
dc.ucuenca.idautor0000-0002-9952-4853
dc.ucuenca.idautor0000-0003-1998-441X
dc.ucuenca.idautor0104445556
dc.ucuenca.indicebibliograficoSciELO
dc.ucuenca.urifuentehttps://ingenieria.ute.edu.ec/enfoqueute/index.php/revista
dc.ucuenca.versionVersión publicada
dc.ucuenca.volumenVolumen 13, número 3
dspace.entity.typePublication
relation.isAuthorOfPublication9ecaad85-5b06-4b92-b05c-0d89c7b10660
relation.isAuthorOfPublication.latestForDiscovery9ecaad85-5b06-4b92-b05c-0d89c7b10660

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
documento.pdf
Size:
322.79 KB
Format:
Adobe Portable Document Format
Description:
document

Collections