samedi 25 février 2012

La dame de fer

En cette période de crise, de manœuvres économiques rigides et d’élections (du moins, dans certains pays), aucun film ne tombe mieux que “La dame de fer”, sorti le 15 février et que nous nous sommes hâtées d’aller voir cette semaine.

Cette production anglo-française, qui a coutée environ 13 millions de dollars, voit l’actrice américaine Meryl Streep dans le rôle de l’ancienne première ministre anglaise Margaret Thatcher.

Tout le film alterne des images de l’Iron Lady désormais vieille et sénile et des flashbacks de sa jeunesse et de sa vie politique.


Iron_lady_film_poster

On assiste ainsi à la naissance de la foi dans l’individualisme et dans le libre marché de cette jeune fille d’épiciers et au cheminement des valeurs néolibérales dans son esprit dès la fin de la guerre. L’engagement en politique est aussi documenté, dès l’élection à la chambre des communs à la fonction de premier ministre et enfin au déclin, en passant par les transformations de son physique et de son style de communication.

Le film aborde les aspects les plus marquants des onze années du Thatcherisme en Angleterre: coupes budgétaires et fascination pour les USA de Ronald Reagan et le style de vie américain, grèves, guerrilla urbaine et répression violente, guerre des Malouines, chute du communisme.

Le tout est enrichi de vidéos de l’époque ou de reconstructions très réalistes, au mot près; par exemple, le discours que la Dame de fer a prononcé lors de son emménagement au 10 Dowining Street est repris presque à l’identique dans le film.

Margaret Thatcher après son élection

Il ne s’agit cependant pas d’un simple documentaire sur la carrière de Margaret Thatcher. En effet, une large place est faite aux sentiments et au coté intime de la vie de l’ancienne premier ministre. Ainsi, on voit les conflits au sein de son foyer familial quand elle renonce quelque peu au rôle de mère de famille pour s’investir dans l’espace public, mais aussi la grande tendresse entre elle et son mari et la conviction profonde qui anime son action politique. Une grande partie du film est dédiée à la vieille Margaret Thatcher, celle d’aujourd’hui, et à sa maladie d’Alzheimer; il s’agit sans doute de la partie la plus universelle du récit, qui touche un thème allant au delà du personnage de la dame de fer et qui parle de la vieillesse d’une façon touchante, en créant presque un film dans le film.

On a apprécié cette trame intéressante et bien construite, mais aussi le talent de Meryl Streep, qui incarne la politicienne de manière magistrale (on a beaucoup parlé du travail sur la voix, mais on peut aussi remarquer d’autres détails comme les gestes, l’allure…). Le film ne fait pas la propagande du néolibéralisme, mais il rend toutefois plus intelligibles les liens entre l’idéologie et le vécu personnel de Margaret Thatcher. Bref, un beau film qu’il vaut la peine d’aller voir.

Pour en savoir plus sur le parcours de la Dame de fer, je vous conseille de faire un tour sur le site de la Fondation Thatcher, qui recueille une impressionnante quantité de documents de et sur l’ancienne première ministre.

Margaret Thatcher et le Thatcherisme ont inspiré une grande quantité de chansons, films et autres créations culturelles. Pour nous quitter, j’ai choisi une chanson qui fait aussi partie de la colonne sonore du film (elle est insérée comme fond à des images de révolte, manifestations et répression violente). Il s’agit de “I’m in love with Margaret Thatcher” des anglais Notsensibles: un morceau de punk à prendre au 2ème degré. Bonne route!

Notsensibles, I’m in love with Margaret Thatcher

samedi 18 février 2012

Lausanneité

La semaine dernière j’ai eu l’occasion d’aller à Genève et de m’y promener un petit moment. Pas le temps de tester les nouveaux services des TPG, ni de faire du méga-shopping, mais j’ai quand même pu passer chez Payot et ramener à la maison…un bouquin sur Lausanne!
Thévenet, A. (2011) Précis de lausanneité à l’usage des curieux, des empiristes, des ornitophiles. Lausanne: Paulette éditions.
Ce tout petit livre (128 pages), paru en décembre 2011, recueille les meilleurs posts publiés par le français Arnaud Thévenet sur le Lausanne Bondy Blog entre 2009 et 2010. Il s’agit de petits récits sur des sujets variés, de l’amitié à la knismolagnie en passant par les spécificités de Lausanne (où se passent bon nombre de ces petites histoires) et du comportement des pigeons.

En deux mois, l’ouvrage a déjà fait parler de  lui en Suisse romande, notamment sur La Liberté, bien évidemment sur le Lausanne Bondy Blog et aussi sur la RSR (avec interview de l’auteur).


IMAG2103

Ces 29 textes sont drôles et bien écrits. Dans un style politiquement correct, et en adoptant sans hésitation un langage épicène (par exemple, on remarque l’usage de mots tel “ille”, pour “il ou elle”), l’auteur dresse une série de tableaux aux couleurs délicates: des histoires relativement simples et riches en bons sentiments, mais très joliment mises en scène, en tout cas assez pour être touchantes.
Presque tous les récits ont comme personnage principal Page, une “silhouette”, un(e) protagoniste sans autre caractéristique que celle d’être humain(e), ou peut-être juste un prétexte pour parler d’humanité. Parce qu’en faite, sous le masque de “livret local”, se cachent des courtes histoires à portée universelle. Profondément convaincu de la bonté de l’être humain, un peu en rousseauiste du XXIe siècle, Thévenet ne nous offre pas la lumière d’un phare, mais plutôt 29 mini-bougies (comme celles des gâteaux d’anniversaire), qui permettent de poser un regard bienveillant sur nos semblables (au moins le temps de la lecture). Donc, quelques jolies histoires qui non seulement nous sortent de notre cynisme quotidien, mais en plus sont drôles et ont le mérite de ne pas être mièvres.
Tous les textes inclus dans le livre se retrouvent aussi sur internet, non seulement sur le Lausanne Bondy Blog mais aussi sur Dernière Page, le blog de Thévenet-Page. Pour que vous puisiez vous faire une idée du style de ces récits, voici un de ceux que j’ai préféré, repris du Lausanne Bondy Blog:
Parler avec son corps.
Examinons un instant le ver de terre le plus proche. Ce n’est pas ce que l’on peut appeler un spectacle très ragoûtant… Esthétiquement, le ver de terre est pour le moins terne, sans vraiment d’intérêt, et se distingue en cela assez facilement du plafond de la Chapelle Sixtine. Mais, grâce au travail de chercheuses et de chercheurs de l’Université de Liège, nous allons voir que ces fadasses annélides recèlent, eux aussi, un secret d’une rare poésie.
Nos lombrics sont dénués de bouches pour parler, d’oreilles pour entendre, et de diffuseurs de phéromones pour communiquer à la manière des fourmis. En gros, rien ne semble les rapprocher, rien ne semble leur permettre de discuter de la direction à prendre, ou du dernier livre de Bernard Werber (très lu chez les invertébrés). On pourrait donc en conclure que nos vers de terre sont des individualistes forcenés, qu’ils n’ont aucun comportement social, etc. Eh bien Lara Zirbes et ses collègues viennent de nous donner tort : Si les vers de terre sont incapables de communiquer de manière traditionnelle, ils sont en revanche capables de se transmettre des informations par simple contact. En se frottant l’un à l’autre, deux vers de terre peuvent se mettre d’accord sur une direction à prendre. D’après Lara Zirbes, eisenia fetida (le nom savant de l’espèce qu’elle étudie), serait l’une des seules espèces au monde à communiquer exclusivement par le toucher.
Imaginez, maintenant, imaginez un monde sans lumière, sans bruit, uniquement perceptible par des vibrations diffuses le long des anneaux mous qui vous constituent. Vous avancez, seul.e, dans l’immensité sombre et humide d’un monde constitué uniquement des galeries creusées par vous. Soudain, un frottement survient, quelqu’un se glisse près de vous, se love contre votre corps. « On va par là ? », semble-t-il dire. « On va par là », répondez-vous, content.e de ne plus errer seul.e dans l’humus. Et votre oeuvre de fertilisation de continuer de plus belle, avec désormais au coeur le ravissement de la découverte du monde à deux.
Joli, n’est-ce pas? Comme quoi les vers de terre ont eux aussi leur poésie.

Des autres exemples de la bonne prose de Thévenet se trouvent ici, ici et encore ici; je vous conseille d’y jeter un coup d’oeil, ça en vaut la peine!
Pour finir, puisqu’il était question de vers tout à l’heure, pour une fois on ne va pas se quitter avec une chanson, mais avec une vidéo “à thème”, un épisode de la série d’animation Minuscule (si chou!)…bonne route!

Minuscule–Les vers sont dans la pomme

dimanche 12 février 2012

Recherche éveillée #2

Voici la deuxième – et dernière – partie du résumé du livre consacré à la recherche éveillée sur internet, qui complète le post précédent.

Foenix-Riou, B. (2011) Recherche éveillée sur internet: mode d’emploi. Outils et méthodes pour explorer le web. Paris: Lavoisier.

La dernière fois, on avait parlé de l’importance de la recherche éveillée et des moteurs de recherche, tandis que dans ce post on va regarder de plus près les annuaires internet et les outils du web2.

1

Homepage de l’annuaire Yahoo.com   en février 1997

Les annuaires internet sont en réalité l’ancêtre des moteurs de recherche contemporains; les usagers qui fréquentent internet depuis ses débuts se souviendront de yahoo.com (ou, pour les italiens, de virgilio.it).

Comme explique le troisième chapitre du livre, les annuaires fonctionnent un peu comme des bottins du téléphone, se proposant de recenser les sites pertinents sur les différents domaines et de les classer selon les sujets traités pour les rendre plus visibles et accessibles.

2

Homepage de l’annuaire Viirgilio.it    en août 2001

Cependant la démocratisation de l’outil, les changements dans les marchés publicitaires (du cpm au cpc) et les avancées dans les algorithmes de recherche ont signé le déclin des annuaires internet généralistes, au profit des moteurs de recherche.

Aujourd’hui, seul un annuaire généraliste semble avoir réellement survécu au changement: il s’agit de l’Open Directory Project (ODP ou DMOZ), un annuaire fondé dans l’esprit du mouvement Open Source et qui est entretenu par des bénévoles. L’utilité de ce type d’outil est de se faire une idée à propos d’un sujet qu’on connait peu ou mal, pour trouver quelques sites de base d’où démarrer la recherche.

Par exemple, imaginons que l’on souhaite mieux connaitre le panorama homoparental dans le monde: DMOZ représente un très bon point de départ. En suivant la directory: Society: Gay, Lesbian and BIsexual: Family and Relationship: Parenting, on tombe sur une bonne liste de références, quoique majoritairement anglophones.


3

Bien sûr, on aura déjà une idée du sujet, mais si on souhaite centrer un peu plus la recherche (sur un aspect plus précis, sur une région ou un pays donné, etc.) la meilleure chose à faire est passer à un annuaire plus spécialisé. Dans notre exemple, imaginons de recarder la recherche sur la France. Pour trouver un annuaire spécialisé, on a plusieurs solutions. La première, est de passer par un annuaire d’annuaires, soit un répertoire d’annuaires spécialisés, comme LesAnnuaires.com.

Comme on peut facilement imaginer, les annuaires LGBTQ ne sont pas très fréquents, et surtout ils sont majoritairement des annuaires de personnes (et non pas des directories internet); cependant, le deuxième lien proposé par cet annuaire d’annuaires mène vers le répertoire du magazine Têtu, dont le premier résultat pour la recherche “Famille” est le site de l’association ADFH (le même site serait sorti comme 6ème résultat de la recherche google du terme “homoparentalité”).



4

6

7

Un autre système pour trouver des sites pertinents est d’exploiter les sites qu’on a déjà identifié afin de construire des syntaxes avancées sur les moteurs de recherche (cf. le 4ème chapitre de l’ouvrage). Ainsi, en utilisant les commandes dont on a parlé l’autre fois, on pourrait par exemple:

  • lancer une requête du type: related:www.tetu.com/associations/ pour obtenir des nouvelles listes de liens similaires à celle proposée par le magazine Têtu;
  • lancer une requête du type: link:www.adfh.com pour trouver des sites qui “pointent” vers le site de l’ADFH, et donc qui contiennent probablement des contenus liés;
  • lancer une requête graphique sur les liens entre sites sur Touchgraph.com (image ci-dessous); ceci ne donne pas beaucoup de résultats, mais peut mener vers des sites auxquels on n’aurait pas forcément eu accès avec les deux méthodes précédentes (pourvu qu’on ait assez de patience pour explorer les liens et en créer des autres).

9

Au delà de ces méthodes, on peut aussi exploiter des répertoires sélectifs, soit des recueils de liens sélectionnés pour leur intérêt particulier, très souvent établis par des institutions culturelles ou éducatives (par exemple, les universités) ou par des organisations professionnelles. La plupart des répertoires sélectifs universitaires ont été développés dans des pays anglophones, en particulier au Royaume Uni. Manquant cruellement de fonds depuis les coupes budgétaires du gouvernement Cameron, beaucoup de ces derniers ne sont plus mis à jour (comme BUBL Link) ou doivent compter sur le travail gratuit de volontaires (comme Ipl2), mais ils restent des ressources utiles pour identifier des sites fiables et de bonne qualité, par exemple des centres de recherche, des revues, des sites d’information etc.  Voici par exemple le résultat de la recherche du mot “queer” sur BUBL Link et sur Ipl2.

10 11

En France aussi on compte des répertoires sélectifs, par exemple Les Signets de la BNF et Signets-Universités, qui contient des liens sélectionnés par les bibliothèques universitaires françaises.

Entre ces deux, Les signets de la BNF sont sans doute plus riches et l’interface permet d’avancer de manière plus intuitive. De plus, le recueil Les signets propose des fiches très détaillés pour chaque site, qui permettent d’approfondir très rapidement la recherche. Voici par exemple le résultat de la recherche du mot “genre” sur les deux sites.



13
14 15

Le dernier annuaire spécialisé que je vais mentionner est OpenDoar, un répertoire des ressources académiques en ligne en accès ouvert qui peut aussi être très utile pour les chercheurs et les étudiants.

Finalement, le dernier chapitre du livre parle des outils du web2, c’est-à-dire des outils “sociaux” (blogs, micro-blogs, réseaux sociaux…bref, toutes les formes “démocratiques” de diffusion de contenu sur le web).

Si vous êtes en train de lire cette page, c’est que vous y connaissez déjà quelque chose au monde des blogs. Pour chercher des blogs en particulier, il y a plusieurs techniques: ajouter le mot “blog” à une recherche sur un moteur généraliste, utiliser l’onglet “blog” des moteurs généralistes – par exemple Google Blogsearch, ou utiliser un moteur spécialisé sur les blogs. Les moteurs spécialisés sur les blogs mentionnés dans le bouquin sont l’incontournable Technorati (qui ne donne cependant pas des résultats toujours fiables et il indexe désormais seulement les blogs en anglais) et le défunt BlogPulse, qui a été transformé en NM Incite et offre des prestations de consulting.

Très souvent, il est possible de suivre les blogs grâce à la diffusion de “Rich Site Summary”, ou “Really Simple Sindication”: en somme, les flux RSS. Sans nous pencher sur ce qu’est un flux RSS ou sur comment on le lit, on va mentionner les moteurs spécialisés dans ce domaine: RSSMicro, qui permet la recherche de flux RSS mais aussi de posts, images et vidéos sur un sujet particulier; Feedage, qui identifie énormément de flux (blogs et podcasts), majoritairement anglophones; FluxRSS, annuaire spécialisé dans les flux du monde francophone.

On peut aussi réaliser des recherches sur les sites de micro-blogging. Le plus connu de ces sites est sans doute Twitter, qui compte 383 millions de profils (dont le mien) et permet de poster des tous petits messages publics (140 caractères), à propos d’arguments, identifiés par le symbole #, ou adressés à des autres usagers, identifiés par le symbole @.  Tout le monde, même ceux qui ne sont pas inscrits, peut effectuer des recherches et voir des profils. Ainsi, par exemple, voici les recherches pour le hashtag “Onpc” (“On n’est pas couché”) et le profil de l’animateur Laurent Ruquier.

16 17

Sur Twitter, on trouve des messages d’information et d’opinion sur des sujets d’actualité; souvent les messages sont accompagnés d’un lien vers un site externe, qui développe l’information plus en profondeur. Le fait de s’inscrire permet de créer un réseau d’informateurs privilégiés sur un argument donné, et aussi de poster du contenu sur le site.

Les premières formes de réseaux social étaient sans doute les mailing lists académiques. Avec l’évolution du web, elles ont été quelque peu marginalisées mais elles n’ont pas du tout disparu; il en existent même des répertoires, comme sur JiscMail (par exemple, le répertoire des listes concernant la géographie).

Avec la fonction “suivre”, Twitter crée une fonction qui se rapproche du réseau social sans en être vraiment un. L’ouvrage de Béatrice Foenix-Riou présente plusieurs réseaux sociaux (notamment Facebook et Viadeo; LinkedIn est mentionné, alors que Google Plus n’apparait pas, probablement il n’existait pas encore quand l’ouvrage a été rédigé). Malgré le fait que les réseaux sociaux connaissent une croissance exponentielle (ce qui implique un volume d’informations difficile à traiter) et qu’on y trouve tout et n’importe quoi (dernier en date: l’inutile Little Monsters), ils représentent quand même une source importante, surtout si on s’intéresse à l’actualité ou si l’on recherche un professionnel en particulier. Un très bon moteur spécialisé dans les réseaux sociaux est SocialMention; sinon, seul Yahoo semble proposer une fonction de recherche qui intègre les messages publiés sur Twitter (les autres mentionnés dans l’ouvrage n’existent plus).

Vue l’augmentation du nombre de sites intéressants, une fonction intéressante du web2 est le “social bookmarking”, c’est-à-dire le partage de ses signets sur des plateformes ad-hoc. Deux exemples sont Delicious et Diigo. Ce dernier, fonctionnant seulement avec une inscription préalable, offre en plus un espace de travail en ligne permettant de prendre des notes et de partager/créer des contenus avec un groupe d’usagers. Il s’agit de plateformes permettant, en quelques sortes, la création de mini-annuaires personnalisés.

(A ce propos, le livre ne parle pas de la curation, nouvelle tendance qui permet de créer des mini-journaux personnalisés: on ne partage plus seulement les signets, mais aussi les actualités, vidéos, podcasts etc., dans un but d’organisation de l’information – et non seulement de collection.)

Le livre se termine avec un chapitre dédié aux exemples pratiques et aux méthodologies de recherche, et avec dix fiches pratiques sur des outils spécifiques (Google, Exalead, DMOZ etc.).

Pour terminer ce “court” résumé, on peut affirmer qu’il s’agit d’un ouvrage très riche et documenté, bien écrit et facile à comprendre (pas besoin d’être un informaticien pour effectuer une recherche éveillée!). Dommage que, comme tout ce qui touche à l’internet, ça souffre d’une obsolescence hyper-rapide, à cause de l’ouverture et fermeture soudaine de plusieurs services et sites. Cependant, les exemples sont fouillés et les principes généraux restent valides, donc lisez-le si vous voulez en savoir un peu plus à propos du web.

Sur cela, quittons nous avec une chanson que j’écoute pas mal dernièrement, Synthesizer des Electric 6 (faut croire que je suis dans une phase de “Electric 6 manie”). Bonne route!

Electric 6, Synthesizer

samedi 4 février 2012

Recherche éveillée #1

Avec l’arrivée de la désormais fameuse “vague de froid”, on est confronté à des phénomènes assez surprenants…comme, chez nous, la glace sur le rebord (interne ! Surpris Glaciale) de la fenêtre.

IMAG2096

Dans ces conditions, sortir n’est vraiment pas une bonne idée (d’autant plus qu’il y a un vent assez impressionnant), donc je profite de ces conditions météo difficiles pour partager avec vous quelques trouvailles intéressantes à propos de la recherche éveillée sur internet. En effet, j’ai (enfin! Clignement d'œil …je vais bientôt le rendre, promis) lu le manuel:

Foenix-Riou, Béatrice (2011) Recherche éveillée sur Internet: mode d’emploi. Outils et méthodes pour explorer le web. Paris: Lavoisier.

…dont voici un “court” résumé en deux parties, contenant les infos les plus intéressantes. Dans ce premier épisode, on va parler des moteurs de recherche généralistes, de quelques moteurs spécialisés et des fonctions avancées de recherche. Dans le prochain épisode, on parlera des annuaires généralistes et spécialisés, des réseaux sociaux et des autres éléments du “web 2.0 – web2”.

Le livre se compose de trois sections: la première sur les outils de la recherche (moteurs, annuaires etc.), la deuxième sur les méthodes de recherche et la troisième sur des outils spécifiques tels Google Scholar, Exalead etc. Chacune des sections est divisée en plusieurs chapitres, identifiés par un code couleur différent, ce qui rend la lecture plus agréable.

Importance de la recherche éveillée

Tout d’abord, l’auteure décrit l’utilité de se former à une recherche éveillée (chapitre 1). En premier lieu, les résultats d’une “simple” recherche sur internet, changent en fonction de comment on la formule, mais aussi de l’outil qu’on emploie. Par exemple, en formulant la même requête sur Google et sur Yahoo(Bing), on obtient des liens tout à fait différents. Pour en avoir la preuve, on peut faire un test avec Tumbshots Ranking, qui met en parallèle les deux moteurs; voici le résultat de la recherche du mot “rideau”:

1

Pour éviter ce problème de discordance des réponses, on peut utiliser des métamoteurs, soit des “moteurs de moteurs”. L’auteure (pp.103-106) nous conseille: Twingine.no, qui permet de visualiser les résultats sur Yahoo et sur Bing en même temps, à droite et à gauche de l’écran (j’ai pas réussi à visualiser Yahoo vs. Google, mais il doit bien y avoir une manière de le faire); Harvester42, qui permet de visualiser les résultats de plusieurs moteurs (parmi lesquels Google Scholar, Google Books, Delicious, Exalead…) un à la suite de l’autre en vertical; Spezify.com, qui a une visualisation particulièrement novatrice (post-it) et moins ennuyeuse que les métamoteurs classiques et qui reprend sélectivement certaines des données produites par les autres moteurs. Bien évidemment, leur usage dépend non seulement des préférences de l’utilisateur, mais aussi du but de la recherche. Pour se faire une idée rapide sur un sujet, Spezify est selon moi le meilleur outil; au contraire, pour une recherche très approfondie, Harvester42 est sans doute les meilleurs de ces trois métamoteurs.

En plus des différences entre moteurs, il faut rappeler que celui que l’on consulte d’habitude n’est que le “web visible”; à ceci s’ajoute un immense “web invisible” (soit non indexé par les moteurs) qui peut contenir, par exemple, des immenses bases de données dont seulement la page d’accueil sera indexée. Le web invisible se compose de l’“opaque web” (qui pourrait être indexé, mais ne n’est pas, par exemple parce qu’une page a été créée suite au passage du robot sur un site), du “private web” (dont l’indexation a été interdite par le créateur), du “proprietary web” (accès restreint, par exemple par un mot de passe) et du “truly invisible web” (accès impossible pour des raisons techniques; c’est très fréquent dans le cas des bases de données).

Utilisation des moteurs de recherche généralistes

Heureusement, le web invisible devient de plus en plus accessible. En effet, plusieurs moteurs (notamment Google) indexent désormais non seulement les pages en html, mais aussi des documents en différents formats (.doc, .pdf, .xls, .ppt…). Ceci est très utile, surtout quand on cherche des publications sur un argument très précis, par exemple des brochures. Pour définir le format du document que le moteur va chercher, on peut le définir à l’aide de la commande spécifique (filetype:*). Ainsi, par exemple, si je recherche le recueil de poèmes “Les fleurs du mal” pour le lire, la solution sera de chercher non simplement le titre, ce qui donnerait ce résultat

2

mais de préciser aussi que je cherche un fichier du type .pdf …ce qui me mènera directement vers le lien au document lui-même:

3

Ceci nous mène vers le chapitre 2 de l’ouvrage de Foenix-Riou, dédié aux moteurs de recherche. C’est un des chapitres centraux du livre, avec des nombreux trucs et astuces pour interroger Google, Yahoo ou Exalead de manière performante. En effet, à part le fait de saisir une requête pertinente en choisissant les bons mots, il est utile de les écrire en profitant des outils avancés proposés par les moteurs.

Un certain nombre de ces syntaxes sont liées à la présence des mots dans le texte des pages indexées. Ce tableau résume les principaux cas de figure (basé essentiellement sur Google):

Je cherche… Je tape…
les deux mots Black Dahlia black dahlia
(l’opérateur AND, qui indique la recherche d’un mot ET de l’autre, est sous-entendu)
des pages contenant le mot Black, le mot Dahlia, mais pas les deux
black OR dahlia
des pages contenant les deux mots Black Dahlia, mais pas les mots movie et film
black dahlia
–movie –film
des pages contenant exactement le mot colle, mais pas le mot collé (accent) +colle
(sinon,Google ne fait pas la différence entre les deux)
des pages contenant exactement le nom Mylène Farmer “Mylène Farmer”
(ceci empêche au moteur de trouver des pages où il y aurait écrit, par exemple, “Mylène cosmétique…….bla bla bla…Simon Farmer”; quand on utilise cette syntaxe pour chercher des personnes, comme c’est le cas ici, il faut penser aussi à chercher dans l’ordre opposé, notamment “Farmer Mylène”)
des pages contenant les mots Association et football, séparés par plusieurs autres mots (par exemple, Association Suisse de Football) association * football
(cette syntaxe, qui fonctionne seulement sur Google,  ne spécifie pas combien de mots il y a entre les deux; on tombe par exemple sur “Association Suisse de Football”, et aussi sur “Association cantonale vaudoise de football”…mais le moteur exclut “Association Football Club”).

association NEAR:3 football
(cette syntaxe, propre à Bing/Yahoo, permet de trouver les mots association et football séparés par au maximum trois mots; cela va donc trouver aussi bien l’“Association Egyptienne de Football” que la “Ghana Football Association”)
des pages contenant les mots Titanic movie, plus un chiffe compris entre 1975 et 1980









des pages contenant le mot caviar, plus une valeur comprise entre 150 et 200 dollars
titanic movie 1975..1980
(cette syntaxe – numrange -, propre à Google, permet de définir une fourchette de valeurs recherchée; sur le plan logique, elle équivaut à la syntaxe titanic movie 1975 OR 1976 OR 1977 OR 1978 OR 1979 OR 1980….mais le résultats ne sont toutefois pas les mêmes!)

caviar $150..200
(toujours sur Google, on va trouver des boites de caviar à un prix entre 150 et 200 dollars…dommage que cela semble fonctionner seulement avec l’indicateur $, et pas avec £, € etc.)
des pages similaires à www.unil.ch




des recherches associées avec Unil













des contenus similaires à Lausanne
related:www.unil.ch
(cette syntaxe, propre à Google, fera apparaitre des pages comme unige.ch, unine.ch etc.)

Sur Google, on parcourt la barre verticale à gauche (plus d’outils) et on choisit
recherches associées; cela fait apparaitre les plus fréquentes des recherches effectuées par rapport à l’Unil, comme “unil formation continue” ou “unil ssp”. Une alternative est d’utiliser AdWords de Google, qui élabore des statistiques sur les co-occurrences des mots insérés dans les recherches sur le moteur.

Sur Exalead, la barre verticale gauche propose des termes associés, comme “canton de Vaud” ou “Lac Léman”

Le site Touchgraph.com (p.137) propose aussi une recherche de contenus similaires et liés; par exemple, voici le résultat de la requête “Lausanne”:

5
Deux autres syntaxes intéressantes sont spellslike:… et soundslike:… sur Exalead, qui devraient permettre d’identifier des mots sur la base d’une prononciation ou d’une orthographe approximative. L’idée est bonne, mais les tests que j’ai fait ne se sont pas révélés probants.

Des autres syntaxes sont liées à la présence de certains critères (par exemple mots-clés) dans une partie de la page (par exemple, l’url). Voici les principaux cas de figure (principalement sur Google):

Je cherche… Je tape…
des pages contenant dans le titre le mot rêve

des pages ayant pour titre “signification des rêves”
intitle:rêve


allintitle: signification des rêves
des pages contenant dans leur url le mot rêve


des pages contenant dans leur url les mots rêve et signification
inurl:rêve ou inurl:reve
(les tests sans accent se montrent plus probants)

allinurl:reve signification
des pages contenant les mots rêve et signification et faisant partie d’un site particulier, par exemple celui de l’Unil
rêve signification site:unil.ch
des pages contenant les mots Barack Obama et publiées entre 2005 et 2006 Barack Obama, puis sur Google dérouler la barre gauche (période personnalisée) et insérer les dates 2005 et 2006

Si l’on souhaite avoir une vision globale du trafic sur Google à propos de Barack Obama, on peut utiliser Google Trends, qui fournit un graphique et met en exergue les moments avec le plus de trafic sur le sujet.

4
des pages contenant des liens vers une page en particulier, par exemple toutes les pages avec un lien vers la page d’accueil du site de l’Unil

des pages contenant des liens vers tout un domaine, par exemple vers toutes les pages du site www.unil.ch
link:www.unil.ch
(cette syntaxe fonctionne sur Yahoo(Bing) )



Il existait la fonction linkdomain, mais cela a été intégré d’abord dans Site Explorer et puis dans Bing Webmaster Tools (désavantage: seul l’administrateur du domaine a accès aux données!). Une alternative est fournie par Ahrefs, mais il faut s’enregistrer pour avoir accès à tous les données.

Souvent, surtout si on recherche une information venant de l’étranger, il vaut mieux élargir la recherche aux pages en une langue différente de la notre. Les fonctions de recherche avancée de Google sont très performantes de ce point de vue. Il suffit en effet de choisir “pages en langue étrangère traduites” dans la bande verticale à gauche pour voir apparaitre en haut de la fenêtre une nouvelle interface, où nous pouvons choisir les langues-cible. Ainsi, par exemple, si l’on tape le nom du groupe musical “Janas” dans une recherche “simple” sur google.ch…

14

…on observe que les résultats seront très différents (et plus pertinents) si on concentre la recherche sur des sites italiens traduits:

15

Dans ce deuxième chapitre on trouve aussi des notions sur l’histoire des moteurs de recherche, dont on ne va pas donner de détails ici. Pour les nostalgiques: si cela vous intéresse, le site WayBackMachine propose des captures d’écran des sites internet, réalisées depuis 1996.

Les moteurs de recherche spécialisés

Pour compléter, l’introduction aux moteurs, le cinquième chapitre propose une introduction aux moteurs spécialisés (p. 160 et suivantes). L’intérêt des moteurs spécialisés est qu’ils indexent seulement une petite partie du web, celle pertinente à leur domaine. Ainsi, les informations non-pertinentes ne polluent pas les résultats de la recherche…et celles pertinentes sont sans doute indexées et ne sont pas noyées dans le reste.

Les moteurs spécialisés proposés par le livre ne sont pas intéressants en soi; cependant, en effectuant une recherche ciblée sur des annuaires de moteurs de recherche (par exemple: Les Annuaires), il est facile de trouver des moteurs spécialisés dans l’argument qui nous intéresse. Ainsi, pour ce qui est de l’éducation, on signalera les français Spinoo et PEclic (intéressants mais, il faut le dire, encore pas au top et avec une fréquence de balayage du moteur encore insatisfaisante – beaucoup de liens “morts”), l’anglais EEP (bon pour des liens “variés”), l’américain ERIC (bon pour des recherches bibliographiques) et, spécialement pour les géographes, l’anglais GeoSearchEngine.

Pour vous faire une idée de la différence des résultats selon le moteur utilisé, voici les captures d’écran d’une recherche sur le mot “gentrification” effectuée avec les trois derniers moteurs mentionnés et avec Google.

6

7

8

9

Comme on peut lire sur la page d’accueil de GeoSearchEngine, ce site fonctionne grâce à une personnalisation du moteur de recherche Google. En effet, à travers la fonction Google Custom Search Engine, il est possible de créer son propre moteur de recherche: il suffit de “dire” à Google sur quels sites il faut chercher, et c’est plutôt simple (interface “Google recherche personnalisée”, pp.171-174). Un autre site qui permet de créer des moteurs personnalisés est Rollyo; l’avantage est qu’ici les moteurs thématiques peuvent être partagés…et en les consultant on peut découvrir des nouvelles sources intéressantes.

Des autres moteurs spécialisés sont ceux dédiés à l’information scientifique. Le livre mentionne Google Scholar (p.177), sur lequel je ne vais pas m’arrêter. Une belle découverte est Scirus (p.175), moteur créé par Elsevier, qui offre une interface plus intuitive par rapport à Google Scholar et qui permet de affiner ses recherches beaucoup plus simplement que Scholar. En effet sa barre verticale gauche propose des filtres par rapport à la source (journal, site, type de fichier) et à des mots-clé additionnels.

10

Finalement, des moteurs spécialisés se concentrent sur la recherche de certains types de documents. Ainsi, il y a les moteurs pour images (notamment, le livre mentionne Flickr (bonne recherche avancée, qui permet entre autre de choisir le type de licence des images trouvés), Picsearch (indexe de manière indépendante 3 milliards d’images, mais les fonctions de recherche ne sont pas super pointues), Pixolu (permette de faire une recherche parallèle sur deux images, affichant les images similaires aux deux en même temps).

Il existe aussi des moteurs de recherche de vidéos. Parmi ceux là, le plus impressionnant est sans aucun doute Voxalead. Ce moteur, développé par Exalead et Vecsys et spécialisé dans l’information, permet de rechercher à l’intérieur des bandes sonores transcrites de nombreuses vidéos et émissions de radio, parmi lesquelles des journaux télévisés indexés très rapidement (compter quand même un jour de décalage par rapport à l’actualité). L’outil est très pratique: une vision standard des résultats est complétée par une bande horizontale qui illustre les occurrences du mot recherché au fil du temps; une autre bande verticale, à droite, présente les chaines d’où sont tirées les infos, les termes liés, les personnages publics en cause…

11

Cette visualisation peut-être substituée par une “carte des infos” ou par des statistiques sur les co-occurrences.

12 13

A présent, on a plus ou moins fait le tour des moteurs de recherche, en attendant de voir les annuaires et le reste dans le 2ème épisode. Puisqu’on les a mentionnés plus haut, quittons nous avec une chanson des sardes Janas, Biskisende (En souriant). Bonne route!

Janas, Biskisende - 2002