¿Algún tutorial para detectar emociones de audio usando python?

La emoción puede ser de la frecuencia de la voz o del habla. El reconocimiento de voz le permite convertir el audio a texto que se analiza para determinar qué tipo de emociones contiene.
En
La gente generalmente utiliza los paquetes opencv, pydeeplearn y nltk. Los obtienes por simple

pip instalar

instalación_ fácil

Llegar a la frecuencia de voz, eso es algo nuevo. Pruebe https://github.com/tyiannak/pyAu… que se basa en la regresión y el aprendizaje automático. Básicamente, convierte el audio en modal matemático y se compara con el conjunto de muestra existente y devuelve la relevancia de la emoción.

Puedes agregar los dos resultados de arriba usando el modo matemático común para obtener tu respuesta. Nunca probé pyaudio con nltk antes, así que háganos saber cómo va.

Si por emoción te refieres al sentimiento, entonces si abordara este problema, convertiría el audio en texto si es un discurso o contiene voz en inglés e implementaría un análisis de sentimiento en el texto de voz para obtener la emoción del discurso en audio.

U puede ir para el aprendizaje automático de NLP … análisis de sentimientos de diferentes fuentes … aquí está el proyecto completo que puede aprender de esto …

tyiannak / pyAudioAnalysis

La búsqueda rápida en el sitio web devuelto por tyiannak / pyAudioAnalysis no lo he probado, háganos saber cómo va.