minet
Minet est à la fois une librairie python et un outil en ligne de commande ayant pour objectif d'aider ses utilisateurs à accomplir de nombreuses tâches typiques de webmining, notamment pour analyser des données tirées des réseaux sociaux ou d'autres pages web.
Minet peut par exemple être utilisé pour :
- Télécharger de très nombreuses urls le plus rapidement possible
- Extraire le contenu textuel de pages HTML
- Collecter des données via les APIs de Twitter, Crowdtangle (Facebook), YouTube, Instagram, Media Cloud, etc.
Minet est le produit d'une dizaine d'années d'expérience du médialab en webmining et est utilisé aujourd'hui quotidiennement dans le cadre de nombreux projets reposant sur de la collecte de données web.
- https://medialab.sciencespo.fr/outils/minet/
Guillaume Plique, Jules Farjas, Pauline Breteau, Jean Descamps, Héloïse Théro, Amélie Pellé
- https://github.com/medialab/minet
- https://github.com/medialab/minet/tree/master/cookbook