Annonce

Réduire
Aucune annonce.

A quoi sert le Traitement automatique des langues (TAL) ?

Réduire
X
 
  • Filtre
  • Heure
  • Afficher
Tout nettoyer
nouveaux messages

  • A quoi sert le Traitement automatique des langues (TAL) ?

    Le TAL ou Traitement automatique des langues est un des domaines d'études de l'Inria. Une cinquantaine de chercheurs planchent sur les différents moyens permettant de rendre le langage humain accessible à la machine.

    Certaines de ces technologies nous sont déjà familières : le correcteur orthographique et grammatical de Word, par exemple.

    D'autres, en développement, ouvrent la voie à l'Internet du futur comme cette interface autorisant un dialogue naturel entre l'homme et la machine. À l'occasion du cinquantenaire de l'association pour le traitement automatique des langues (Atala), Laurence Danlos, chercheuse à l'Inria, fait le point sur l'état de son art.

    A quoi sert le Traitement automatique des langues (TAL) ?


    Le TAL a pour but de simuler sur machine la production de langage de l'être humain. L'être humain parle et comprend. Dans le domaine du TAL et de ses applications, nous parlons de génération pour la production de textes, et d'analyse en ce qui concerne la compréhension.

    A l'Inria, le TAL regroupe une cinquantaine de chercheurs répartis dans quatre équipes. La première, « Alpage », travaille sur la compréhension et la génération automatiques de textes. « Caligramme » développe pour sa part un analyseur syntaxique censé rendre une phrase compréhensible pour un ordinateur. La troisième équipe, « Signes » s'intéresse notamment à la langue des signes et la manière dont on peut la transcrire vers l'écrit et vice-versa. Enfin, « Talaris » a pour objectif la réalisation d'une interface homme-machine permettant le déploiement de services (réservation de train, hôtels...) sur la base d'un dialogue véritable entre un utilisateur et le système.

    Dans quels domaines les recherches sont-elles les plus avancées ?

    D'une façon générale, les technologies les plus abouties concernent des domaines dits fermés et donc circonscrits à un seul sujet : par exemple la météo ou des tableaux de chiffres réalisés par un institut de sondage. Si l'on reprend l'exemple de la météo, la réalisation d'un bulletin censé mettre en valeur les faits les plus importants pourra dans ce cas être créé automatiquement.

    S'agissant de l'analyse, le constat est identique. S'il s'agit d'un domaine fermé, on peut s'en sortir. Mais plus on élargit le domaine d'intervention, plus cela devient complexe. C'est ce que l'on constate dans les systèmes de traduction automatique. Un humain comprend le sens d'une phrase, son contexte, et la traduit en conséquence. Pour une machine, une phrase telle que « Marie a aimé cet avocat, pourtant il était véreux » aura au moins deux significations possibles.

    À plus long terme, quels sont vos domaines de réflexion ?

    Il s'agit de formaliser, de modéliser le langage naturel pour le mettre sur ordinateur. Les développements portent déjà sur sa morphologie et sa syntaxe mais de grosses recherches restent à faire dans le domaine de la sémantique. La sémantique est liée au concept. Exemple : il y a une différence entre manger quelque chose et dévorer quelque chose. Comme il y a une différence entre un discours et un dialogue.

    À terme, il s'agit de remplacer les systèmes de messagerie vocale de type réservation de billets SNCF ou de spectacle par des interfaces capables de gérer un véritable dialogue. Les difficultés sont réelles car la machine doit pouvoir écarter les parasites (bégaiements, mot à la place d'un autre,...), savoir gérer tout type de voix, même enrhumée et reconnaître les accents étrangers ou régionaux. Dans le domaine du texte, il faut pouvoir traiter indifféremment du texte très bien écrit, Flaubert, par exemple et du texte dégradé, à l'instar d'un email ou d'un SMS.

    Quelles sont les nouvelles applications les plus prometteuses ?

    Dans le domaine du vocal, on peut citer les réservations SNCF. Aujourd'hui, il s'agit la plupart du temps de domaines fermés (réservation de billets, réclamation,...). Il n'en reste pas moins que les gens sont de plus en plus habitués à converser avec une machine. Des prototypes ont été réalisés, notamment avec France Telecom. Mais il y a une différence entre faire un prototype et le déployer dans le grand public. De tels systèmes autorisant un véritable dialogue ne seront pas opérationnels avant une dizaine d'années. L'intelligence humaine reste quelque chose d'extrêmement complexe à mettre en machine.

    Et les secteurs les plus demandeurs ?

    Les entreprises de services, comme les secteurs liés à la sécurité ou la défense. Ainsi, aux Etats-Unis, toutes les recherches sur le TAL sont financées par la Darpa, l'agence pour les projets de recherche avancée de défense. On peut citer également tous les services liés à la protection de la société civile (surveillance de sites web à caractère raciste ou pédophiles). Les grandes entreprises à l'instar de Renault, Peugeot ou EADS sont également clientes. Certaines disposent déjà d'un TAL en interne pour retrouver un document, disposer d'un outil d'extraction d'information ou de veille économique.

    Sur l'échiquier international du TAL, la France est-elle bien placée ?


    Plutôt bien. L'anglais reste la langue la plus étudiée. Le français arrive en seconde position. Notre association, l'Atala (Association pour le traitement automatique des langues) célèbre d'ailleurs cette année son cinquantenaire !

    Par l'Expansion
Chargement...
X