La emoción puede ser de la frecuencia de la voz o del habla. El reconocimiento de voz le permite convertir el audio a texto que se analiza para determinar qué tipo de emociones contiene. En
La gente generalmente utiliza los paquetes opencv, pydeeplearn y nltk. Los obtienes por simple
pip instalar
instalación_ fácil
Llegar a la frecuencia de voz, eso es algo nuevo. Pruebe https://github.com/tyiannak/pyAu… que se basa en la regresión y el aprendizaje automático. Básicamente, convierte el audio en modal matemático y se compara con el conjunto de muestra existente y devuelve la relevancia de la emoción.
- ¿Por qué me cuesta mantener los ojos abiertos después de llorar?
- Tengo demasiada empatía. La gente me abusa de eso y siempre me lastimo por eso. ¿Hay alguna manera de tener menos empatía?
- ¿Cómo definirías el sexo en términos de ser un asunto intelectual en vez de físico?
- ¿Cuándo te sentiste más desesperado? ¿Cómo lo superaste?
- Cómo dejar de sentirse culpable por no cuidar a una madre con demencia
Puedes agregar los dos resultados de arriba usando el modo matemático común para obtener tu respuesta. Nunca probé pyaudio con nltk antes, así que háganos saber cómo va.