Vendredi 08 Novembre 2019
Reconnaitre l’identité d’une personne, son état émotif et son empreinte phonétique vocale grâce à l’intelligence artificielle
M. Sidi Yakoub, chercheur postdoctoral au LARIHS-UMCS à Graz (Autriche) pour présenter les travaux de l’équipe sur l’identification automatique de l’émotion humaine.
Agrandir l'image
Les systèmes développés sont capables de déceler au ton de la voix si une personne est triste, inquiète, joyeuse, en colère ou autre émotion. Les algorithmes basés sur l’apprentissage profond développés au LARIHS sont également capables de disséquer un continuum vocal pour repérer de façon automatique les traits phonétiques distinctifs, ce qui était jusqu’à présent l’apanage des expertes et experts humains en phonétique. Une des applications possibles de ce système est de suivre et guider l’apprentissage d’une langue tout en corrigeant les imperfections de prononciation. L’approche est également utilisée actuellement pour un objectif d’amélioration de la prononciation des personnes ayant subi des séquelles à la suite d’un AVC, par exemple.
Une partie de ces travaux, relatives à l’identification automatique de l’émotion à travers la voix a été présentée par M. Sidi Yacoub, chercheur postdoctoral (LARIHS-UMCS), au plus grand rassemblement scientifique des chercheuses et chercheurs dans le domaine (Interspeech 2019) qui s’est tenu en septembre à Graz en Autriche (voir photo).
Voici les références des publications récentes de l’équipe de recherche du LARIHS :
- Y. Seddiq, Y. A. Alotaibi, S. A. Selouani and A. H. Meftah, "Distinctive Phonetic Features Modeling and Extraction Using Deep Neural Networks," in IEEE Access Journal, vol. 7, pp. 81382-81396, 2019.
- S. Gharsellaoui S. A. Selouani, M. Sidi Yakoub, “Linear Discriminant Differential Evolution for Feature Selection in Emotional Speech Recognition”, DOI: 10.21437/Interspeech.2019-1218, September 2019.
- A. Krobba, M. Debyeche, S. A. Selouani, “Multitaper chirp group delay Hilbert envelope coefficients for robust speaker verification” journal of Multimedia Tools and Applications, Volume 78, Issue 14, Springer eds., 2019.
- B. F. Zaidi, M. Boudraa, S. A. Selouani, D. Addou, M. S. Yakoub, “Automatic Recognition System for Dysarthric Speech Based on MFCC’s, PNCC’s, JITTER and SHIMMER Coefficients”, Part of the Advances in Intelligent Systems and Computing book series (AISC, volume 944), pp. 500-510, 2019.
Retourner aux nouvelles