dimanche 12 février 2012

Recherche éveillée #2

Voici la deuxième – et dernière – partie du résumé du livre consacré à la recherche éveillée sur internet, qui complète le post précédent.

Foenix-Riou, B. (2011) Recherche éveillée sur internet: mode d’emploi. Outils et méthodes pour explorer le web. Paris: Lavoisier.

La dernière fois, on avait parlé de l’importance de la recherche éveillée et des moteurs de recherche, tandis que dans ce post on va regarder de plus près les annuaires internet et les outils du web2.

1

Homepage de l’annuaire Yahoo.com   en février 1997

Les annuaires internet sont en réalité l’ancêtre des moteurs de recherche contemporains; les usagers qui fréquentent internet depuis ses débuts se souviendront de yahoo.com (ou, pour les italiens, de virgilio.it).

Comme explique le troisième chapitre du livre, les annuaires fonctionnent un peu comme des bottins du téléphone, se proposant de recenser les sites pertinents sur les différents domaines et de les classer selon les sujets traités pour les rendre plus visibles et accessibles.

2

Homepage de l’annuaire Viirgilio.it    en août 2001

Cependant la démocratisation de l’outil, les changements dans les marchés publicitaires (du cpm au cpc) et les avancées dans les algorithmes de recherche ont signé le déclin des annuaires internet généralistes, au profit des moteurs de recherche.

Aujourd’hui, seul un annuaire généraliste semble avoir réellement survécu au changement: il s’agit de l’Open Directory Project (ODP ou DMOZ), un annuaire fondé dans l’esprit du mouvement Open Source et qui est entretenu par des bénévoles. L’utilité de ce type d’outil est de se faire une idée à propos d’un sujet qu’on connait peu ou mal, pour trouver quelques sites de base d’où démarrer la recherche.

Par exemple, imaginons que l’on souhaite mieux connaitre le panorama homoparental dans le monde: DMOZ représente un très bon point de départ. En suivant la directory: Society: Gay, Lesbian and BIsexual: Family and Relationship: Parenting, on tombe sur une bonne liste de références, quoique majoritairement anglophones.


3

Bien sûr, on aura déjà une idée du sujet, mais si on souhaite centrer un peu plus la recherche (sur un aspect plus précis, sur une région ou un pays donné, etc.) la meilleure chose à faire est passer à un annuaire plus spécialisé. Dans notre exemple, imaginons de recarder la recherche sur la France. Pour trouver un annuaire spécialisé, on a plusieurs solutions. La première, est de passer par un annuaire d’annuaires, soit un répertoire d’annuaires spécialisés, comme LesAnnuaires.com.

Comme on peut facilement imaginer, les annuaires LGBTQ ne sont pas très fréquents, et surtout ils sont majoritairement des annuaires de personnes (et non pas des directories internet); cependant, le deuxième lien proposé par cet annuaire d’annuaires mène vers le répertoire du magazine Têtu, dont le premier résultat pour la recherche “Famille” est le site de l’association ADFH (le même site serait sorti comme 6ème résultat de la recherche google du terme “homoparentalité”).



4

6

7

Un autre système pour trouver des sites pertinents est d’exploiter les sites qu’on a déjà identifié afin de construire des syntaxes avancées sur les moteurs de recherche (cf. le 4ème chapitre de l’ouvrage). Ainsi, en utilisant les commandes dont on a parlé l’autre fois, on pourrait par exemple:

  • lancer une requête du type: related:www.tetu.com/associations/ pour obtenir des nouvelles listes de liens similaires à celle proposée par le magazine Têtu;
  • lancer une requête du type: link:www.adfh.com pour trouver des sites qui “pointent” vers le site de l’ADFH, et donc qui contiennent probablement des contenus liés;
  • lancer une requête graphique sur les liens entre sites sur Touchgraph.com (image ci-dessous); ceci ne donne pas beaucoup de résultats, mais peut mener vers des sites auxquels on n’aurait pas forcément eu accès avec les deux méthodes précédentes (pourvu qu’on ait assez de patience pour explorer les liens et en créer des autres).

9

Au delà de ces méthodes, on peut aussi exploiter des répertoires sélectifs, soit des recueils de liens sélectionnés pour leur intérêt particulier, très souvent établis par des institutions culturelles ou éducatives (par exemple, les universités) ou par des organisations professionnelles. La plupart des répertoires sélectifs universitaires ont été développés dans des pays anglophones, en particulier au Royaume Uni. Manquant cruellement de fonds depuis les coupes budgétaires du gouvernement Cameron, beaucoup de ces derniers ne sont plus mis à jour (comme BUBL Link) ou doivent compter sur le travail gratuit de volontaires (comme Ipl2), mais ils restent des ressources utiles pour identifier des sites fiables et de bonne qualité, par exemple des centres de recherche, des revues, des sites d’information etc.  Voici par exemple le résultat de la recherche du mot “queer” sur BUBL Link et sur Ipl2.

10 11

En France aussi on compte des répertoires sélectifs, par exemple Les Signets de la BNF et Signets-Universités, qui contient des liens sélectionnés par les bibliothèques universitaires françaises.

Entre ces deux, Les signets de la BNF sont sans doute plus riches et l’interface permet d’avancer de manière plus intuitive. De plus, le recueil Les signets propose des fiches très détaillés pour chaque site, qui permettent d’approfondir très rapidement la recherche. Voici par exemple le résultat de la recherche du mot “genre” sur les deux sites.



13
14 15

Le dernier annuaire spécialisé que je vais mentionner est OpenDoar, un répertoire des ressources académiques en ligne en accès ouvert qui peut aussi être très utile pour les chercheurs et les étudiants.

Finalement, le dernier chapitre du livre parle des outils du web2, c’est-à-dire des outils “sociaux” (blogs, micro-blogs, réseaux sociaux…bref, toutes les formes “démocratiques” de diffusion de contenu sur le web).

Si vous êtes en train de lire cette page, c’est que vous y connaissez déjà quelque chose au monde des blogs. Pour chercher des blogs en particulier, il y a plusieurs techniques: ajouter le mot “blog” à une recherche sur un moteur généraliste, utiliser l’onglet “blog” des moteurs généralistes – par exemple Google Blogsearch, ou utiliser un moteur spécialisé sur les blogs. Les moteurs spécialisés sur les blogs mentionnés dans le bouquin sont l’incontournable Technorati (qui ne donne cependant pas des résultats toujours fiables et il indexe désormais seulement les blogs en anglais) et le défunt BlogPulse, qui a été transformé en NM Incite et offre des prestations de consulting.

Très souvent, il est possible de suivre les blogs grâce à la diffusion de “Rich Site Summary”, ou “Really Simple Sindication”: en somme, les flux RSS. Sans nous pencher sur ce qu’est un flux RSS ou sur comment on le lit, on va mentionner les moteurs spécialisés dans ce domaine: RSSMicro, qui permet la recherche de flux RSS mais aussi de posts, images et vidéos sur un sujet particulier; Feedage, qui identifie énormément de flux (blogs et podcasts), majoritairement anglophones; FluxRSS, annuaire spécialisé dans les flux du monde francophone.

On peut aussi réaliser des recherches sur les sites de micro-blogging. Le plus connu de ces sites est sans doute Twitter, qui compte 383 millions de profils (dont le mien) et permet de poster des tous petits messages publics (140 caractères), à propos d’arguments, identifiés par le symbole #, ou adressés à des autres usagers, identifiés par le symbole @.  Tout le monde, même ceux qui ne sont pas inscrits, peut effectuer des recherches et voir des profils. Ainsi, par exemple, voici les recherches pour le hashtag “Onpc” (“On n’est pas couché”) et le profil de l’animateur Laurent Ruquier.

16 17

Sur Twitter, on trouve des messages d’information et d’opinion sur des sujets d’actualité; souvent les messages sont accompagnés d’un lien vers un site externe, qui développe l’information plus en profondeur. Le fait de s’inscrire permet de créer un réseau d’informateurs privilégiés sur un argument donné, et aussi de poster du contenu sur le site.

Les premières formes de réseaux social étaient sans doute les mailing lists académiques. Avec l’évolution du web, elles ont été quelque peu marginalisées mais elles n’ont pas du tout disparu; il en existent même des répertoires, comme sur JiscMail (par exemple, le répertoire des listes concernant la géographie).

Avec la fonction “suivre”, Twitter crée une fonction qui se rapproche du réseau social sans en être vraiment un. L’ouvrage de Béatrice Foenix-Riou présente plusieurs réseaux sociaux (notamment Facebook et Viadeo; LinkedIn est mentionné, alors que Google Plus n’apparait pas, probablement il n’existait pas encore quand l’ouvrage a été rédigé). Malgré le fait que les réseaux sociaux connaissent une croissance exponentielle (ce qui implique un volume d’informations difficile à traiter) et qu’on y trouve tout et n’importe quoi (dernier en date: l’inutile Little Monsters), ils représentent quand même une source importante, surtout si on s’intéresse à l’actualité ou si l’on recherche un professionnel en particulier. Un très bon moteur spécialisé dans les réseaux sociaux est SocialMention; sinon, seul Yahoo semble proposer une fonction de recherche qui intègre les messages publiés sur Twitter (les autres mentionnés dans l’ouvrage n’existent plus).

Vue l’augmentation du nombre de sites intéressants, une fonction intéressante du web2 est le “social bookmarking”, c’est-à-dire le partage de ses signets sur des plateformes ad-hoc. Deux exemples sont Delicious et Diigo. Ce dernier, fonctionnant seulement avec une inscription préalable, offre en plus un espace de travail en ligne permettant de prendre des notes et de partager/créer des contenus avec un groupe d’usagers. Il s’agit de plateformes permettant, en quelques sortes, la création de mini-annuaires personnalisés.

(A ce propos, le livre ne parle pas de la curation, nouvelle tendance qui permet de créer des mini-journaux personnalisés: on ne partage plus seulement les signets, mais aussi les actualités, vidéos, podcasts etc., dans un but d’organisation de l’information – et non seulement de collection.)

Le livre se termine avec un chapitre dédié aux exemples pratiques et aux méthodologies de recherche, et avec dix fiches pratiques sur des outils spécifiques (Google, Exalead, DMOZ etc.).

Pour terminer ce “court” résumé, on peut affirmer qu’il s’agit d’un ouvrage très riche et documenté, bien écrit et facile à comprendre (pas besoin d’être un informaticien pour effectuer une recherche éveillée!). Dommage que, comme tout ce qui touche à l’internet, ça souffre d’une obsolescence hyper-rapide, à cause de l’ouverture et fermeture soudaine de plusieurs services et sites. Cependant, les exemples sont fouillés et les principes généraux restent valides, donc lisez-le si vous voulez en savoir un peu plus à propos du web.

Sur cela, quittons nous avec une chanson que j’écoute pas mal dernièrement, Synthesizer des Electric 6 (faut croire que je suis dans une phase de “Electric 6 manie”). Bonne route!

Electric 6, Synthesizer

3 commentaires:

  1. Molto interessante anche questa volta; purtroppo la navigazione su internet,come ogni attività, per essere "fruttuosa" richiede conoscenza e tempo che immacabilmente viene sottratto ad altro. Per chi è appassionato come te ad esplorare il mondo virtuale credo che libri come quello che hai letto siano molto utili.
    Bella la canzone, peccato che non ho tempo per cercare e tradurre il testo. Ciao "buona strada" anche a te, francesca

    RépondreSupprimer
  2. I am impressed by the quality of information on this website. There are a lot of good resources here. I am sure I will visit this place again soon.

    RépondreSupprimer
  3. I am impressed by the quality of information on this website.
    Game of Thrones Season 7 all Episodes http://hhmovies.com

    RépondreSupprimer