Nous avons développé un cadre de modélisation des processus de la communication parlée, COSMO (« Communicating Objects by Sensory-Motor Operations »), qui s’applique à la fois aux modèles de perception et de production de parole en installant les relations sensori-motrices au cœur de son programme. COSMO permet de formaliser conjointement deux cadres théoriques majeurs des recherches sur la communication parlée, les théories auditives et motrices – mais aussi de les intégrer au sein de théories perceptuo-motrices. Ceci conduit ainsi à de nouveaux modèles de perception alliant traitements auditifs et prise en compte de connaissances motrices, ou de nouveaux modèles de contrôle moteur de la parole orientés vers la réalisation de buts sensoriels multimodaux. Nous présentons ces avancées ainsi que des pistes de développement sur le traitement temporel et l’implémentation deep learning permettant d’aller vers l’apprentissage sur des données réelles.
Cite as: Schwartz, J.-L., Bessière, P., Perrier, P., Georges, M.-A., Nabé, M., Diard, J., Barnaud, M.-L., Laurent, R., Patri, J.-F., Moulin-Frier, C. (2022) COSMO : un modèle bayésien des fondements sensorimoteurs de la perception et de la production de la parole. Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022, 971-979, doi: 10.21437/JEP.2022-103
@inproceedings{schwartz22_jep, author={Jean-Luc Schwartz and Pierre Bessière and Pascal Perrier and Marc-Antoine Georges and Mamady Nabé and Julien Diard and Marie-Lou Barnaud and Raphaël Laurent and Jean-François Patri and Clément Moulin-Frier}, title={{COSMO : un modèle bayésien des fondements sensorimoteurs de la perception et de la production de la parole}}, year=2022, booktitle={Proc. XXXIVe Journées d'Études sur la Parole -- JEP 2022}, pages={971--979}, doi={10.21437/JEP.2022-103} }