Exploring Large Social Networks with Matrix-Based Representations
Elle se fera en anglais, précédée d’un cours résumé en français, devant le jury composé des membres suivants:
Rapporteurs:
M. Ulrik Brandes, Professeur, Université de Konstanz
M. Jarke Van Wijk, Professeur, Université de Technologie de Eindhoven
Examinateurs:
M. Guy Mélançon, Professeur, Université de Bordeaux 1
M. Eric Lecolinet, Maître de Conférences, TELECOM ParisTech (ENST)
Mme Françoise Détienne, Directrice de Recherche, TELECOM ParisTech (ENST)
Co-Directeur : Jean-Daniel Fekete, Directeur de Recherche, INRIA Saclay
Co-Directeur : Peter Eades, Professeur, University of Sydney
La soutenance sera suivie du traditionnel pot à la cafétéria du LRI où j’espère vous voir nombreux.
RésuméGrâce à la banalisation des outils de communication électroniques, les chercheurs en sciences sociales disposent de nombreuses données. Les communautés en ligne telles que FaceBook et Flickr par exemple, fournissent de riches informations sur la façon dont les personnes communiquent et l’évolution de leurs réseaux sociaux. Pour analyser ces données, les sociologues ont besoin d’outils robustes, pouvant manipuler de grandes quantités de données, et flexibles, permettant l’exploration a de multiples niveaux: de la vue d’ensemble a l’analyse détaillée d’une sous partie.
Nous proposons de visualiser les données car le cerveau humain est très efficace pour traiter les informations visuelles. La majorité des outils de visualisation de réseaux sont basés sur des diagrammes nœuds-liens. Ces représentations ayant d’importants problèmes de lisibilités, nous explorons dans cette thèse des représentations alternatives basées sur des matrices d’adjacence.
Nous présentons trois systèmes interactifs conçus avec des chercheurs en sciences sociales: MatrixExplorer, MatLink et NodeTrix. MatrixExplorer combine matrices et nœuds-liens. Les deux représentations sont synchronisées et un panel d’outils interactifs permet de les manipuler. MatLink est une matrice augmentée de liens interactifs, qui permettent de mieux percevoir la connectivité du réseau. Enfin NodeTrix représente les réseaux par des diagrammes nœuds-liens et leurs parties denses par des matrices. NodeTrix est particulièrement efficace pour des réseaux petit-monde. Cette thèse présente la conception et l’évaluation de ces trois systèmes ainsi qu’une étude de cas analysant 20 ans de publications en Interaction Homme-Machine.
AbstractWith the increasing use of Internet technologies, social scientists have more data to analyze. Online communities such as FaceBook or Flickr provide rich information on how people communicate and how their social network evolves. To analyze this data, social scientists require robust tools that can handle large and complex networks and allow a flexible analysis from overviews of the entire dataset to detailed analysis of important sections.
As human brain is particularly effective at processing visual information, we propose to support the exploration of social networks by information visualization. Previous tools for network visualization are mostly based on node-link diagrams, suffering of readability issues (node overlapping or edge crossing) for either large or dense networks. In this thesis, we investigate alternative representations based on adjacency matrices.
Following participatory design principles, we involved social scientists into the design of three interactive visual systems: MatrixExplorer, MatLink and NodeTrix. MatrixExplorer combines matrices and node-link diagrams. Both representations are coordinated and a set of interactive tools allows their manipulation. MatLink is an augmented matrix, providing interactive links on its border to help performing some connectivity tasks. Finally, NodeTrix represents networks as node-link diagrams, using matrices for dense sub-parts. NodeTrix is particularly suited for small-world networks, globally sparse but locally dense. This dissertation presents the design and evaluation of these three systems including a case study analyzing 20 years of publications data in Human-Computer Interaction.