Micromégas : objectifs et contexte

L'objectif du projet Micromégas est de développer de nouvelles interfaces pour naviguer et visualiser des données de grande taille (à l'échelle humaine) en explorant des approches dites multi-échelles. Nous nous intéressons à des données que nous qualifions de familières, c'est-à-dire des données qui ont été créées ou au moins organisées par leurs utilisateurs, mais dont la masse est, de fait, telle que leur exploitation est de plus en plus fastidieuse. L'enjeu du projet est lié à l'ubiquité de ces données - elle concernent aussi bien les activités professionnelles que personnelles - et leur taille croissante : à titre d'exemple, la capacité moyenne des disques durs d'ordinateurs individuels a augmenté en 20 ans d'un facteur 1000 et cette progression, exponentielle, se poursuit. A l'heure où la société de l'information recouvre de plus en plus d'aspects de notre vie, la capacité à naviguer efficacement dans ces données revêt une importance cruciale afin de permettre à chacun de constituer et de gérer efficacement sa parcelle de cyberespace.

Le verrou scientifique principal auquel s'attaque le projet est la difficile maîtrise des masses de données, que nous proposons de lever grâce aux représentations et aux techniques de navigation multi-échelles, en offrant aux utilisateurs des interfaces de navigation intuitives et efficaces pour des masses de données allant jusqu'à la dizaine de millions d'items. Sur le plan technologique, la visualisation interactive de données de grande taille nécessite des architectures logicielles capables d'affichages plein-écran à des cadences d'au moins 10 images par seconde, nécessitant des optimisations dans l'organisation des données et dans les techniques de rendu graphique.

Le projet mobilise une équipe pluri-disciplinaire associant psychologues, informaticiens et ergonomes et traite à la fois des aspects fondamentaux de cette approche et de son application à des domaines concrets, par l'intermédiaire d'études de cas.

Données familières

Nous avons choisi de nous intéresser dans ce projet à un type de données particulier, les données familières. Ces données peuvent être caractérisées informellement de la façon suivante : ce sont toutes les données qui font la différence entre la machine d'une personne et la même machine appartenant à une autre personne. Ces données sont de nature très diverse : documents textes, images, vidéos, messages électroniques, code source, fichiers de configuration, programmes, etc. Elles peuvent être liées à l'activité professionnelle de la personne concernée ou à sa vie privée (ou les deux - par exemple le courrier électronique).La personne qui conserve ces données n'en est pas nécessairement l'auteur. Les données familières sont donc aussi bien des données produites par leur utilisateur que des données qu'il a reçues de l'extérieur (typiquement des messages électroniques, des documents attachés) ou des données qu'il a collectées (par exemple des pages Web ou des documents téléchargés).

Masses de données familières

En 1981, la capacité maximale du disque dur du Xerox Star était de 40 Mo [1]. Les ordinateurs d'aujourd'hui sont vendus avec des disques durs d'une capacité de plusieurs dizaines de giga-octets. A titre d'exemple, un ordinateur portable acheté il y a un an contenait un disque de 48 Go (1000 fois la taille du disque du Star). Le propriétaire de la machine (un enseignant/chercheur) y avait alors transféré 4 Go environ de données familières provenant de sa machine précédente. Un an après, le disque dur de cette machine contient près de 20 Go de données familières (plus de 44000 fichiers) parmi lesquelles :

Selon certaines études, d'ici 5 ans, un disque d'un téra-octets (25000 fois la taille de celui du Star) devrait coûter moins de 300 euros [2]. Remplir un tel disque en un an équivaut à stocker chaque jour (au choix) :

Ces chiffres incitent à penser qu'il sera bientôt inutile de supprimer des fichiers pour "faire de la place". Nous devrions bientôt être capables de conserver tout ce qui nous passe entre les mains et que nous jugeons digne d'intérêt, réalisant ainsi une partie de la vision de Vannevar Bush en 1945 [3].

A l'échelle des capacités cognitives humaines, ces chiffres correspondent à des masses de données considérables, d'autant que chacun de ces 44000 fichiers contient lui-même une grande quantité d'information : mots, paragraphes, pages d'un document texte, clips d'une vidéo, transparents d'une présentation, etc. La manipulation de ces données familières implique donc de fréquentes tâches de recherche d'un item parmi quelques dizaines de milliers à quelques dizaines de millions, selon la granularité de l'item recherché.

Navigation dans les données familières

Malgré l'évolution dramatique de la taille des données familières, les interfaces de navigation n'ont pratiquement pas évolué depuis le "desktop" du Xerox Star il y a 20 ans. Elles sont fondées sur une organisation des données hiérarchique (répertoires et sous-répertoires), spatiale (placement des icones sur un desktop), ou temporelle (liste chronologique de messages). L'utilisateur, grâce à son modèle mental de l'organisation des données et/ou à l'information qu'il peut directement extraire de leur représentation, préfère souvent naviguer dans ces données plutôt qu'effectuer une recherche par des outils d'indexation. En effet, la recherche dans des données familières est caractérisée par la connaissance que l'utilisateur a de leur organisation et par la mémorisation de chemins d'accès plutôt que par la spécification de critères de recherche. Ce type de recherche est donc bien différent d'une recherche dans un environnement non familier (par exemple la recherche d'une page Web), dans lequel l'élément recherché n'est pas caractérisé par un chemin d'accès, mais par des critères qui peuvent être fournis par exemple à un moteur de recherche. On peut donc distinguer :

  1. la recherche d'un élément inconnu (je ne sais pas s'il existe) ;
  2. la recherche d'un élément connu (je sais qu'il existe mais je ne sais pas où il est) ;
  3. la navigation vers un élément connu (je sais qu'il existe et je sais comment y aller).

Nous nous intéressons à la troisième situation qui, parce qu'elle paraît la plus favorable, a été relativement peu étudiée. Certains travaux en visualisation d'information, notamment sur les interfaces zoomables [4] ont proposé des méthodes applicables à ces données. D'autres travaux ont mis l'accent sur l'organisation temporelle [5, 6] ou sur un type particulier de données, comme le courrier électronique [7, 8]. Le terme de Personal Information Management ou PIM a fait son apparition, mais il recouvre un sous-ensemble des données familières (agenda, contacts, courrier électronique), et les travaux concernent moins le problème de la masse de ces données que celui de leur interopérabilité. Pourtant, l'évidence empirique montre que l'on passe une partie significative de son temps à naviguer vers des éléments connus (situation 3 ci-dessus), ou à rechercher des éléments connus (situation 2 ci-dessus) car le chemin de navigation que l'on croyait correct est erroné. L'augmentation exponentielle du nombre d'éléments de nos masses de données personnelles rend les tâches de navigation de plus en plus fastidieuses : d'une part, les chemins de navigation deviennent de plus en plus long, d'autre part, on est de plus en plus souvent confronté à un échec de la navigation.

Certes, il est tentant de se ramener systématiquement à la situation 1, unifiant ainsi la recherche sur le Web avec la navigation dans ses données personnelles. C'est ce que les environnements actuels tendent à faire, en offrant par exemple des moteurs de recherche unifiant recherche sur le Web et recherche sur le disque dur local (Sherlock sur MacOS par exemple). On peut cependant douter que cette méthode soit la plus efficace. D'une part, il faut pouvoir exprimer le critère de recherche sous une forme utilisable par la machine, ce qui n'est pas toujours possible, surtout lorsque l'on manipule des données multimédia (photos, vidéos). D'autre part, si le critère n'est pas bien ciblé, on sera confronté à une longue liste de réponses, qu'il faudra parcourir linéairement, ce qui est coûteux. Enfin, ce type de recherche "aveugle" ne permet pas de se familiariser avec l'organisation des données puisque celle-ci n'est jamais exposée à l'utilisateur.

Une hypothèse qui sous-tend ce projet est que plus on navigue dans les données, plus celles-ci deviennent familières, et plus on peut optimiser la navigation : la navigation est active, en ce sens qu'elle est en elle-même pourvoyeuse d'informations qui peuvent être capitalisées par l'utilisateur pour des activités futures. Certains indices tels que le groupage ou la localisation spatiale des items sont des aides informelles à la navigation. Il apparaît donc que, à l'instar de la lecture active [9], la navigation pourrait être grandement améliorée en permettant à l'utilisateur d'ajouter des informations aux items qu'il consulte et aux chemins qu'il parcourt, et en faisant en sorte que le système enregistre un certain nombre de données de navigation afin de produire de nouvelles visualisations plus faciles à naviguer.

On assiste actuellement au développement des techniques de fouille, d'indexation, de recherche, d'extraction de données. Ce projet est parfaitement complémentaire de ces approches, pour une simple raison d'échelle : alors que nous nous intéressons à des masses de données de l'ordre de dix mille à dix millions d'items, masses déjà gigantesques à l'échelle humaine, les techniques évoquées ci-dessus s'intéressent à des données d'un ordre de grandeur potentiellement bien supérieur. Il est peu probable que ces techniques soient capables de donner des réponses précises dans tous les cas, particulièrement lorsqu'il est difficile de formaliser le critère de recherche. Leur but est plutôt de réduire l'espace de recherche et d'organiser les résultats de façon à faciliter la tâche de l'utilisateur dans la navigation vers l'élément souhaité. C'est cette dernière étape, souvent fastidieuse mais néanmoins indispensable qui peut être grandement améliorée par l'approche que nous proposons lorsque les données concernées sont de très grande taille.

De plus, l'utilisation systématique des procédures de recherche automatisées dans des masses de données familières n'est pas sans inconvénient : faute de parcourir activement, de manière périodique, des arborescences qu'on a soi-même composées, on en oublie progressivement la structure même si le résultat de la recherche rappelle la localisation de la cible. Nous pensons que l'optimisation de l'interaction entre l'humain et ses masses de données familières passe par un équilibre entre recherche automatique et navigation active.

L'hypothèse centrale de ce projet est qu'une approche multi-échelles permet d'organiser les données et de les visualiser de telle sorte que cette navigation soit plus efficace qu'avec les techniques actuelles. Cette hypothèse sera testée grâce à une approche pluri-disciplinaire : expérimentations contrôlées (psychologie), développement de prototypes (informatique), évaluation de l'utilisabilité (ergonomie).

Travaux antérieurs de l'équipe

L'équipe du projet regroupe un ensemble pluri-disciplinaire de compétences critiques pour le projet. Le LMP apporte son expertise en psychologie du mouvement et de la perception appliquée à l'interaction homme-machine ; il a en particulier travaillé sur l'interaction multi-échelles et a déjà collaboré sur ce sujet avec le projet In Situ. Le projet In Situ apporte son expertise en visualisation d'information, en ingénierie des interfaces et en conception participative. Il a déjà collaboré avec l'Institut Pasteur pour l'étude des cahiers de laboratoire des biologistes. Le projet MErLIn apporte son expertise en ergonomie cognitive pour l'interaction homme-machine. Il a déjà travaillé à l'évaluation de techniques de visualisation. Enfin le pôle informatique de l'Institut Pasteur apporte son expertise sur les outils informatiques utilisés par les biologistes et sur leurs méthodes de travail, et par ses travaux sur la constitution d'environnements de programmation destinés aux non-programmeurs.

Références

[1] J. Johnson, T. Roberts, W. Verplank, D. Smith, C. Irby, M. Beard and K. Mackey. The Xerox Star: a retrospective. IEEE Computer, 22(9):11-29, September 1989. [Google] [2] J. Gemmell, G. Bell, R. Lueder, S. Drucker and C. Wong. MyLifeBits: Fullfilling the Memex vision. In Proceedings of ACM Multimedia 2002, pages 235-238, December 2002. ACM Press. [ACM] [Google] [3] V. Bush. As we may think. Atlantic Monthly, 176(1):101-108, June 1945. [Google] [4] K. Perlin and D. Fox. Pad: An alternative approach to the computer interface. In SIGGRAPH '93: Proceedings of the 20th annual conference on Computer graphics and interactive techniques, pages 57-64, 1993. ACM Press. [ACM] [Google] [5] E. Freeman and D. Gelernter. Lifestreams: A Storage Model for Personal Data. SIGMOD Record, 25(1):80-86, March 1996. [ACM] [Google] [6] J. Rekimoto. Time-machine computing: a time-centric approach for the information environment. In Proceedings of ACM UIST 1999 Symposium on User Interface Software and Technology, pages 45-54, November 1999. ACM Press. [ACM] [Google] [7] W. Mackay. More than Just a Communication System: Diversity in the Use of Electronic Mail. In Proceedings of ACM CSCW'88 Conference on Computer-Supported Cooperative Work, September 1988. ACM Press. [ACM] [Google] [8] S. Whittaker and C. Sidner. Email overload: exploring personal information management of email. In Proceedings of ACM CHI'96 Conference on Human Factors in Computing Systems, pages 276-283, 1996. ACM Press. [ACM] [Google] [9] B. Schilit, G. Golovchinsky and M. Price. Beyond paper: supporting active reading with free form digital ink annotations. In Proceedings of ACM CHI'98 Conference on Human Factors in Computing Systems, pages 249-256, 1998. ACM Press. [ACM] [Google]