Google News s’ouvre à 200 ans d’histoire

| 0 Commentaires

Alors que le moteur de recherche d’actualités Google News ne retourne traditionnellement que les informations parues dans les trente jours qui précèdent la requête, la firme de Mountain View vient de dévoiler une fonctionnalité baptisée Google Archive Search permettant de remonter non plus trente jours, ni même trente ans, mais deux cents ans en arrière !

De grands quotidiens anglo-saxons comme le New-York Times, le Guardian, le Times, le Washington Post ou le Wall Street Journal, ont accepté de mettre tout ou partie de leurs archives à disposition du moteur de recherches. Google s’est également adressé à certains services spécialisés dans la numérisation et l’archivage de la presse, qui proposent leurs services – payants – sur Internet comme Factiva, AccessMyLibrary.com ou Fastcase. L’index ainsi constitué par Google remonte jusqu’au premier quart du XIXe siècle. Il intègre par ailleurs certaines archives d’actes notariaux qui feront la joie des généalogistes en herbe.

Le service est disponible en plusieurs langues, mais les résultats d’une recherche en français ne sont pas pertinents pour des requêtes qui ciblent la période antérieure à l’an 2000. Les résultats peuvent être compulsés comme une suite de propositions classées par pertinence, mais il est également possible de les ranger par ordre chronologique, ce qui peut se révéler pratique pour comparer le traitement d’un sujet à différentes époques.

Si l’accès au service de Google est gratuit, la consultation des contenus antérieurs à l’avènement du Web ne l’est que rarement. Il faudra généralement compter entre deux et dix dollars pour accéder à la version numérique d’un quotidien américain du début du siècle dernier. Google Archive Search complète le modèle d’organisation du savoir déjà déployé par Google avec son programme de numérisation et de consultation de livres en ligne (Google Book Search) ou son service de recherche et de consultation des manuels scolaires (Google Scholar). Archive Search a d’ailleurs été développé par l’auteur de Google Scholar, Anurag Acharya.

Google a par ailleurs récemment mis en place une fonctionnalité permettant de télécharger gratuitement, au format PDF, des copies (parfois mal scannées) d’ouvrages tombés dans le domaine public (voir Google Book : livres libres de droit en .pdf). De son côté, la Bibliothèque nationale de France propose depuis quelques mois sur son site Gallica de consulter en ligne les archives de la presse française du XIXe siècle. Gallica représente une bonne part de la contribution française au projet de Blibliothèque numérique européenne (BNE), qui prévoit la numérisation de six millions d’ouvrages d’ici 2010. Il n’est toutefois pas certains que les délais soient tenus, notamment parce que les questions relatives au droit d’auteur ralentissent les processus. Sans aller jusqu’à bafouer la propriété intellectuelle comme l’a fait Google dans certains cas, peut-être les institutions européennes devraient-elles s’inspirer de certaines des méthodes employées par ce dernier ?

Laisser un commentaire

Champs Requis *.