Interview : Des ordinateurs qui sauront bientôt lire

Tom M. Mitchell, 56 ans, directeur du département Apprentissage automatique de l’Université Carnegie Mellon de Pittsburgh, aux États-Unis, axe ses recherches sur l’apprentissage automatique, l’intelligence artificielle et la neuroscience cognitive. Ancien président de l’American Association of Artificial Intelligence (AAAI) et nouveau membre du Computer Science and Telecommunications Board du Conseil national américain de la recherche, il est également l’auteur de l’ouvrage de référence « Machine Learning ».

Dans quels domaines les ordinateurs joueront-ils un rôle majeur en tant qu’assistants numériques ?

Tom M. Mitchell (TMM) : Nous utilisons déjà les systèmes GPS dans nos voitures mais ce secteur va encore se développer. La généralisation de cette technologie nous permettra, à terme, de localiser tous les véhicules et aussi de repérer les routes sur lesquelles ils sont brusquement immobilisés. Ces assistants seront également capables d’assimiler les préférences de chaque individu et de sélectionner un itinéraire en conséquence.

Quelles seront les possibilités offertes par les assistants de bureau numériques, c’est-à-dire les ordinateurs de demain ?

TMM : Eh bien, si l’on parvenait à équiper chacun de nous d’un assistant personnel, nous serions tous plus productifs car ces aides informatisées nous déchargeraient d’une partie de nos tâches administratives. Nous aurions ainsi pu utiliser un assistant pour échanger, à notre place, les e-mails qui nous ont permis d’organiser cet entretien. Mais les ordinateurs ne parviennent pas encore à interpréter ni à lire correctement le contenu textuel. Nous pourrions probablement leur apprendre à assimiler 80 % de nos échanges, mais, pour le reste, il faudrait comprendre les nuances. Un travail passionnant est actuellement réalisé dans ce domaine. Il existe d’ailleurs des systèmes efficaces capables de déchiffrer des documents et des pages Web spécifiques, mais alors qu’ils excellent à repérer certains noms de sociétés ou de personnes et des dates, ils peinent à adopter une approche plus structurée de l’interprétation des informations et ne réussissent pas, par exemple, à faire le lien entre ces catégories de noms. Nous travaillons assidûment sur cet aspect.

De quoi seraient capables les ordinateurs s’ils savaient lire ?

TMM : Par exemple, si je souhaitais me rendre à une conférence sur l’intelligence artificielle, mon ordinateur pourrait réserver mon vol et mon hôtel, et même m’indiquer qui je pourrais rencontrer sur place, et ce, sans aucun intermédiaire humain. Il serait également possible d’accéder plus rapidement à une multitude d’informations sur Internet. Les sociétés Microsoft, Google ou encore Yahoo ont toutes développé des moteurs de recherche pour extraire des données du Web mais les systèmes informatiques de la prochaine génération seront, en plus, capables d’analyser le contenu textuel. Imaginons qu’un jour nous puissions, au lieu de taper quelques mots-clés, soumettre une question complète à notre ordinateur et qu’il nous réponde. Voilà qui révolutionnerait la vie de chacun d’entre nous.

Dans combien de temps pourrons-nous bénéficier concrètement de ce progrès ?

TMM : Cela se produira dans moins de dix ans et ce sera alors un de ces prodigieux bonds en avant tant attendus. Certaines sociétés y consacrent déjà énormément de ressources. Et je fais le pari que, d’ici 2015, les programmes informatiques pourront lire 80 % des données Web. À partir de là, nous serons capables de collecter de gigantesques volumes d’informations.

Comment pouvez-vous être certain que cela prendra moins de 10 ans ? La percée des assistants intelligents avait déjà été annoncée il y a plus de 25 ans !

TMM : Des sommes colossales sont investies dans ce domaine et les sociétés telles que Google, Microsoft et Yahoo avancent à grands pas. Et puis, certains progrès techniques, notamment en termes d’algorithmes d’apprentissage automatique, confortent mon idée. Les ordinateurs n’ont jamais eu accès à autant de texte depuis l’émergence d’Internet il y a une dizaine d’années. La redondance du texte et la disponibilité d’importants volumes de données permettent de tester efficacement ces algorithmes.

L’accessibilité de ces données permettrat- elle de développer des systèmes d’aide au diagnostic médical, par exemple ? Quels sont les problèmes induits par l’utilisation de l’informatique dans ce domaine ?

TMM : La confidentialité sera un enjeu majeur et il nous faudra résoudre ce problème si nous voulons que cette technologie se généralise. À ce sujet, la National Academy of Sciences devrait publier cette année une étude à laquelle j’ai participé. Nous devons notamment nous préoccuper de la diffusion des informations personnelles de santé. D’un côté l’accès à une multitude de données pourrait offrir de nombreux avantages, de l’autre il soulève certaines interrogations qui nous obligeront à faire des compromis.

Entretien réalisé par Karen M. Dente