Hyphe


Hyphe est un logiciel libre de crawler web permettant aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique (par exemple, l'huile de palme ou le coronavirus).

Ces pages web sont sélectionnées par les chercheurs et peuvent être regroupées en « webentités », qui peuvent être des pages individuelles, des sites web, des sous-domaines ou même une combinaison de ceux-ci. Ces entités représentent différents acteurs de la problématique à traiter (par exemple, une personne, une organisation, etc.).

https://medialab.sciencespo.fr/static/network_f6475b93-7d69-4319-95da-df227b99b2c7.png

En les crawlant, Hyphe permet de construire itérativement et de visualiser un réseau des relations entre ces acteurs à travers les hyperliens reliant ces webentités.

De nouvelles webentités sont automatiquement suggérées en explorant les hyperliens de chaque entité présente dans le corpus. Les chercheurs peuvent ensuite les examiner dans un processus itératif et qualitatif.

https://medialab.sciencespo.fr/static/prospect_4ca1c375-6a43-4aa5-af73-b1494b3c056d.png

Hyphe permet aux chercheurs de choisir et de catégoriser manuellement les acteurs qu'ils souhaitent ajouter à leur corpus. À ce titre, il doit être considéré comme un outil quali-quantitatif.

https://medialab.sciencespo.fr/static/network-tags_2e7fe049-2fb9-4b94-bef1-9821bba42f34.png

https://hyphe.medialab.sciences-po.fr/

Mathieu Jacomy, Benjamin Ooghe-Tabanou, Paul Girard, Guillaume Plique, Martin Delabre

https://github.com/medialab/hyphe
https://github.com/medialab/hyphe/wiki
http://hyphe.medialab.sciences-po.fr/demo/