Quand les machines prennent la parole

Par Franck LEFEBVRE , le 31 août 2001 à 07h00 , mis à jour le 30 août 2001 à 20h12

En France, les ergolinguistes du dialogue sont tout au plus une dizaine. Leur rôle : permettre aux hommes et aux ordinateurs de communiquer par la parole. Le point avec une de ces spécialistes du dialogue homme-machine : Latifa Taleb, de la société Telisma.

reconnaissance vocale © INTERNE

Parler, quoi de plus évident… pour un être humain, du moins. Mais pour une machine, savoir interpréter correctement une phrase simple et y répondre relève de l’exploit. Une performance que la multiplication des services ayant recours à la reconnaissance vocale – messageries à commande vocale, systèmes de réservation de billets – a eu tendance à banaliser. Ce développement des technologies de la reconnaissance de la parole a donné naissance à un métier inédit : celui d’ergolinguiste du dialogue. Une profession très recherchée avec la croissance de l’Internet : de plus en plus de portails ont recours à la reconnaissance vocale…

En France, ces spécialistes de la communication homme-machine sont une petite dizaine. Latifa Taleb en fait partie. En 1997, armée d’un DEA de linguistique et d'un doctorat de l'Institut national de recherche en informatique et en automatique (Inria), elle s’initie au dialogue homme-machine chez Holistique Communication. Aujourd'hui, à 34 ans, elle travaille chez Telisma, une société qui développe des logiciels de reconnaissance de la parole grâce à une technologie mise au point par France Telecom R&D (l’ex-Cnet). Ses travaux sont utilisés aussi bien pour la diffusion d’informations téléphoniques sur les cours de la Bourse, que pour la vente de produits par téléphone…

Et si l’interlocuteur bafouille ?

Premier obstacle au dialogue homme-machine : un ordinateur a besoin de standards reconnaissables. Or, non seulement chaque être humain a sa propre prononciation, mais celle-ci peut varier selon l’humeur ou le moment… "Les modèles de reconnaissance de la parole doivent tenir compte de toutes les variations possibles dans la prononciation d’un mot aussi simple que : ‘oui’, explique Latifa Taleb. Pour cela, il nous a fallu enregistrer un grand nombre de personnes en train de prononcer les mêmes termes du vocabulaire général, afin d’établir une moyenne."

Deuxième obstacle : le vocabulaire. "A chaque fois que l’on conçoit un nouveau service, indique Latifa Taleb, on se trouve face à des termes nouveaux et spécifiques. Nous les transcrivons sous forme phonétique. Ils seront lus par la machine et leur prononciation pourra être reconstituée grâce à un moteur de reconnaissance de phonèmes."

Malgré tout, la société Telisma reconnaît que "la reconnaissance de la parole ne peut, par nature, atteindre une fiabilité à 100%". Alors, face à un utilisateur qui hésite, bafouille ou reste coi, la seule parade est de mettre en place des "stratégies de récupération" : la machine pourra répéter la dernière question, fournir à son interlocuteur désorienté de nouvelles instructions, voire, en cas d’échec persistant… le transférer vers un opérateur. Bien humain, celui-là.

Par Franck LEFEBVRE le 31 août 2001 à 07:00
Envoyer cette page à un ami
Les champs marqués par une étoile * sont obligatoires.
Les derniers articles Sciences
  

Commentaires

Afficher : Les plus récents | Les plus appréciés

       Chargement en cours...
      Alertez-nous
        alertez-nous

        Témoin d'un événement ?

        Alertez la rédaction !

        Envoyez une alerte

        A lire aussi
        logAudience