Quand l’ordinateur interprète les images

Comment apprendre à un ordinateur à interpréter, classer et chercher des images dans des bases de données et à identifier leurs similitudes ?

Contrairement à l’homme, habitué à nuancer son jugement, les ordinateurs « pensent » de façon binaire, en termes de 1 et de 0. Ils ont été conçus pour traiter des chiffres, et non pas des textes ou des images. Et c’est précisément cette lacune que les chercheurs tentent de combler.

Le Web sémantique, ou Web 3.0, est ainsi l’objet de toutes les attentions. Depuis 2007, le projet Theseus, dont la direction a été confiée à Siemens par le Ministère allemand de l’éducation et de la recherche, y consacre tous ses efforts. Notamment Medico de Theseus rassemble des experts de Siemens Corporate Technology et du Secteur Industry qui collaborent au développement du logiciel Medico. D’autres partenaires participent à ce programme, comme le Centre allemand de recherche en intelligence artificielle de Kaiserslautern, l’Institut Fraunhofer d’infographie de Darmstadt et l’Université Ludwig Maximilians de Munich.

Dans ce cadre, les connaissances médicales seront, pour la première fois, mises en relation avec de nouvelles méthodes de traitement des images, de traitement des données basé sur les connaissances et d’apprentissage automatique. Alok Gupta, du département DAO et Knowledge Solutions de Siemens Medical Solutions à Malvern (États-Unis), et Jörg Freund, du Secteur Healthcare, à Erlangen (Allemagne), coordonnent l’étude d’un moteur de recherche Medico universel d’images médicales.

Associations d’images

Medico pourra reconnaître des structures anatomiques et les modifications pathologiques associées, classer automatiquement les données et collecter des images comparatives et des rapports de traitement dans plusieurs bases de données.

D’après Jörg Freund, « l’idée est de mettre à la disposition de chaque médecin l’ensemble des informations existantes sur l’objet de son examen : comptes-rendus cliniques, symptômes, diagnostics et thérapies ». Les premiers essais de fonctionnement se dérouleront fin 2009 au CHU d’Erlangen.

La recherche intelligente d’images n’en est cependant qu’à ses balbutiements. Les bases de données actuelles basées sur le Web, telles que les systèmes d’archivage des images et de communication et les systèmes d’information de radiologie, utilisent encore une indexation par mots-clés.

Les associations sont donc sélectionnées par l’homme au lieu d’être générées automatiquement par des systèmes d’interprétation des images. Les experts se concentrent sur des méthodes d’imagerie comme la scanographie, l’IRM et l’échographie afin de combler le « fossé sémantique ». La sémantique a ici un sens plus large, s’appliquant à la compréhension du contenu des images par un programme informatique.

« La mission première de Theseus est de traiter cette masse imparfaite de données grâce au développement d’une méthode d’expression du contenu respectant un ordre et une hiérarchie », indique Volker Tresp, coordinateur CT des six scénarios d’application de Theseus. Son objectif est de permettre aux ordinateurs d’associer des informations à l’image appropriée, de trouver ces informations et de les interpréter, qu’il s’agisse de texte, de vidéo ou de données multimédias. La création de ce moteur de recherche intelligente d’images exige donc de nombreux développements : méthodes de reconnaissance de modèles et de modélisation ontologique (technique traduisant les connaissances conceptuelles en informations compréhensibles par un ordinateur), systèmes de reconnaissance assistée par ordinateur, systèmes d’aide à la prise de décisions cliniques…

Comprendre le médecin

Pour décrire le contenu des images, Volker Tresp et d’autres experts ont recours aux ontologies mises au point par des médecins, telles que RadLex et FMA (Foundational Model of Anatomy). « Grâce à ces outils, nous représentons hiérarchiquement le contenu des images en fonction de l’anatomie humaine », précise Jörg Freund. « Il est ainsi possible de déterminer plus rapidement si la taille d’un organe ou d’une tumeur a évolué par rapport à l’examen précédent. »

« Si Medico s’articule autour des recherches sémantiques dans des bases de données médicales, l’éventail de ses applications potentielles est néanmoins bien plus large », ajoute-t-il. Une fois que les questions éthiques et de réglementations sur la protection des données seront résolues, l’industrie pharmaceutique pourrait notamment tirer parti de cette technologie en automatisant l’analyse des études cliniques, y compris le contenu de leurs images, ce qui permettrait de tirer plus rapidement des conclusions précises sur les effets des traitements médicaux.

Klaudia Kunze