29.3.05

Google Print
Rappel des épisodes précédents (épisode 4) : En France, pendant ce temps-là...

Dans l'ensemble les réactions sont d'abord lentes à venir. La presse relate l'annonce, le Point par exemple rassure ses lecteurs : "Les craintes de voir le numérique éclipser le livre ne sont pas avérées : lors de la dernière décennie, celle du boom d'Internet, le nombre de visites dans les bibliothèques a doublé dans le monde. Et jamais sur la planète autant de livres en papier n'ont été publiés".

Mais il faut attendre le 22 janvier pour que les médias s'y intéressent de plus près et avec plus d'exposition. Jean-Noël Jeanneney, ci-devant président de la Bibliothèque nationale de France, dans une tribune parue dans le Monde, fait part de ses "lourdes préoccupations". "Voici que s'affirme le risque d'une domination écrasante de l'Amérique dans la définition de l'idée que les prochaines générations se feront du monde" écrit-il en appelant à la contre-attaque de l'Europe, "décidée à n'être pas seulement un marché, mais un centre de culture rayonnante et d'influence politique sans pareille autour de la planète". Pour lui la vision de Google fait la part trop belle aux fonds anglo-saxons. Il reprend la parole quelques semaines plus tard pour préciser sa pensée...

Une position que pourraient sans doute partager les Indiens ou les Chinois comme le rappelle Jack Kessler de FYI France.

Dans son article, le président de la BNF parle des efforts déjà accomplis par la France pour la numérisation des ouvrages de ses bibliothèques, avec notamment les 80 000 ouvrages proposés par Gallica.

Gallica, justement, qui pour Hubert Guillaud, rédacteur-en-chef d'Internet Actu, "n'est pas un modèle d'indexation ouverte". Bref, selon lui, "nous ne manquons pas tant de moyens ou de grands projets, que d'une capacité (ou d'une volonté) de comprendre l'écologie du web. (...) Pour exister dans cet univers, il faut s'y ouvrir, rendre ses contenus accessibles, mais aussi repérables (par des machines comme par des humains) par la multitude des intermédiaires, des moteurs, des répertoires, des sites et autres blogs". Il ajoute : "L’édition numérique souffre surtout d’être incomprise dans ses enjeux, d’être délaissée tout le long de la chaîne du livre ou des médias. Le manque d’intérêt pour la technique, notre faible compréhension des nouvelles technologies et de leurs enjeux, notre allergie à l’anglais et aux langages informatiques, constituent les premiers facteurs de notre "retard".

Nombre de ceux qui ont visité Gallica font le même constat : voilà un site utile aux chercheurs certes, mais quasiment pas mis en valeur. Quant à la navigation, on est loin de la simplicité de consultation de Google. L'accessibilité n'est pas réservée qu'aux sites grand public.

Beaucoup de sites ont critiqués les solutions proposées par Jeanneney : le weblog BiblioAcid (l'article et les commentaires qui l'accompagnent) ou l'e-magazine Commentaires.com. Pour tous (même pour Jacques Attali), la réponse est "dérisoire".

Dans le Monde toujours, Xavier Polastron, auteur de Livres en feu, répondait à Jean-Noël Jeanneney que la France, au contraire, se devait de faire partie du projet de Google, l'organisation d'une réplique européenne prenant sans doute une "génération". Il faisait lui aussi part de son scepticisme quant à la réussite de Gallica et son mode image, "espèce de mesquinerie flaubertienne et policière qui vous interdit de travailler". Voir également son journal (qui me fait penser à un site web des années 95-96).

Mais comme le dit Hervé Le Crosnier, maître de conférences à l'Université de Caen et spécialiste du sujet, l'article de Jeanneny a eu "le mérite de démultiplier les réflexions concernant les projets de numérisation de documents, le rôle réel des bibliothèques, les stratégies d'exploitation de "l'effet réseau" par les entreprises de l'internet, la place des moteurs de recherche et la nature géopolitique du savoir."
Enquête sur les librairies en-ligne dans Libération
Maintenant que la vente de livres en ligne représente 2,4% du marché français en volume, Libération revient sur cette lente progression qui fait que certains "secteurs" retrouvent une nouvelle jeunesse sur Internet (les sciences humaines et techniques) et que des librairies, au départ réticentes, sautent le pas en ouvrant leur propre site et en y proposant un fort complément rédactionnel (bibliographies, dossiers, etc.).

15.3.05


The Long Tail

Avez-vous entendu parler de ce livre écrit par un alpiniste britannique en 1988, La Mort suspendue, qui, dix ans après une sortie plutôt confidentielle, a figuré pendant 14 semaines consécutives en tête des ventes outre-Atlantique ? Et grâce à quoi ? Aux liens de recommandations d'Amazon. Wired y a consacré un article en évoquant les effets que pourraient avoir sur le système actuel de distribution de "produits culturels" (librairies, disquaires, vidéo-clubs, etc.) les sites de commerce électronique qui offrent un choix forcément plus large. Un choix qui permet d'aller au-delà des best-sellers et qui pourra aller - pourquoi pas - jusqu'à l'impression à la demande d'ouvrages épuisés...

[mise à jour : l'auteur de cet article prépare un livre sur le sujet et a ouvert un weblog qui suit ce thème]

9.3.05

Google Print
Rappel des épisodes précédents (épisode 3) :
Les réactions aux Etats-Unis

A la suite des rumeurs sur ce fameux Projet Océan de Google (devenu finalement réalité avec l'accord annoncé avec les bibliothèques), Ernest Miller se demandait pourquoi les universités n'essayaient pas de mettre en commun leur fonds pour lancer un service de recherche public... Une idée que défendait cet autre article. Le coût de la numérisation y est sans doute pour quelque chose...

Google a réussi un joli coup de relations publiques en annonçant l'extension de Google Print. Dans l'ensemble, la presse a accueilli avec beaucoup d'enthousiasme cette annonce sur le thème du "où s'arrêteront-ils ?". Vu la notoriété de Google, chaque nouvelle fonctionnalité ou chaque nouvelle sortie génère de toute façon beaucoup de bruit.

Voir les deux articles très complets de Infotoday sur le sujet qui détaillent assez précisément l'annonce et les enjeux, tout en faisant la liste des nombreuses questions qui se posent.

Après l'annonce, John Battelle se posait quelques questions : Google permettra-t-il aux autres moteurs de recherche d'indexer ce contenu ou s'en réservera-t-il l'exclusivité ? Et surtout en quoi cela influencera-t-il son "business model" ? Comment le moteur de recherche compte-t-il se rémunérer sur les livres tombés dans le domaine public ? En proposant de l'impression à la demande par exemple ? Pour Google, c'est véritablement une nouvelle étape, car cette fois-ci c'est lui qui va mettre à disposition et "héberger" du contenu.

Mais tous les éditeurs, notamment universitaires, ne partagent pas cet enthousiasme. Ils s'inquiètent que Google ne les aient pas encore consultés alors que des ouvrages qui ne sont pas tombés dans le domaine public sont également concernés par l'accord. Terry Hulbert, patron du développement électronique et de la stratégie de l'Institut de Physique britannique déclarait à Nature : "La numérisation systématique de contenu protégé par les droits d'auteurs est quelque chose qu'ils ne peuvent absolument pas faire sans avoir l'accord des ayants-droits". Un avis que partage cet universitaire américain.

[Voir également le point de vue forcément atypique de Laurence Lessig, l'homme derrière le projet Creative Commons, paru dans le Los Angeles Times en janvier dernier].

Les libraires, qui bénéficient actuellement de l'effet prescription des bibliothèques, risquent de perdre cette partie de leur clientèle qui venait acheter les ouvrages empruntés en bibliothèque. Ils devront trouver un nouveau mode de fonctionnement face à l'opportunité que représente Google Print pour leurs clients.

Du côté des bibliothécaires, les avis sont partagés. Roy Tennant fait remarquer qu'en proposant majoritairement des ouvrages du domaine public, les bibliothèques prennent le risque que les lecteurs aillent moins dans les bibliothèques chercher de l'information plus récente et dans certains cas mise à jour et corrigée. D'autres faisaient remarquer qu'il y avait à la fois un risque et une chance dans ce mouvement-là. A l'heure où de plus en plus d'étudiants et de chercheurs se tournent vers Internet pour leurs recherches, les bibliothécaires doivent trouver leur place.

Le président de l'Association des Bibliothécaires Américains (ALA) regrette quant à lui l'absence de mise en contexte de l'information sur Google Print. On fera une recherche sur une partie du livre, sans jamais pouvoir avoir (facilement) l'intégralité de l'ouvrage. Et il craint que le projet ne repose sur un postulat complètement faux : "qu'une forme de communication, l'électronique, vienne supplanter et éliminer toutes les autres formes". Son article est disponible en PDF.

Google communique peu depuis sur son projet. Les informations, parcellaires, viennent des bibliothécaires concernés : Stanford ou Harvard.

8.3.05

Google Print
Rappel des épisodes précédents (épisode 2) : Après les éditeurs, les bibliothèques

Le 14 décembre dernier, le New-York Times annonce que Google doit annoncer un accord avec de prestigieuses bibliothèques (américaines et anglaise) pour numériser une partie de leurs collections (tombées dans le domaine public) afin de les mettre en ligne sur Google Print, pour un coût estimé de 150 millions de dollars sur 10 ans. Sont concernées par l'accord les bibliothèques suivantes :
  • la bibliothèque d'Harvard pour 40 000 volumes sur les 15 millions de volumes détenus par la bibliothèque (une FAQ détaillée sur le projet est disponible ici : http://hul.harvard.edu/, tout comme une lettre de son directeur)
  • la bibliothèque de l'université du Michigan pour 7 millions de volumes (voir le communiqué de presse)
  • la bibliothèque de l'université de Stanford qui ne mentionne pas combien de volumes sont concernés sur les 8 millions qu'elle possède (une FAQ est disponible, voir également le communiqué de presse). Stanford est l'université qu'ont fréquentée les créateurs de Google.
  • la bibliothèque Bodleian de l'université d'Oxford au Royaume-Uni pour "plus de 1 million de volumes" sur un total de 11 millions (lire le communiqué de presse)
  • la New York Public Library ne communique par sur le nombre d'ouvrages concernés (sur les 20 millions de livres qu'elle possède (lire le communiqué de presse)

Soit sans doute plus de 10 millions d'ouvrages, beaucoup plus que le million et demi d'ouvrages annoncés dans certains articles...

A chaque fois, les mêmes arguments reviennent dans les communiqués de presse, y compris pour les bibliothèques qui avaient déjà un gros fonds numérisé : Google prend à sa charge la numérisation et peut le faire plus rapidement que nous (ainsi l'Université du Michigan parle d'années nécessaires pour tout numériser alors qu'elle aurait eu besoin de "centaines d'années" pour le faire elle-même). L'Université d'Harvard précise qu'elle a étudié la solution de numérisation utilisée par Google et qu'elle est plus "respectueuse" des livres que les autres solutions.

Ce sont les bibliothèques qui sélectionnent les ouvrages à numériser, ouvrages qui resteront également accessibles depuis les sites Internet des bibliothèques. L'Université du Michigan mentionne la numérisation d'ouvrages encore protégés par le copyright dont des extraits seront accessibles. Dernière information, la numérisation s'effectuera soit chez Google, soit sur place.

"Notre mission est d'organiser l'information du monde" proclame le communiqué de presse de Google.
Google Print
Rappel des épisodes précédents (épisode 1)

Le 17 décembre 2003, le site Internet spécialisé SearchEngineWatch rapportait que Google venait de lancer, au début du mois de décembre, un programme pour indexer des extraits de livres et les présenter dans les pages de résultats du moteur de recherche. Contrairement au programme "Search Inside the Book" de Amazon, Google indexe uniquement des extraits des livres tirés des 4èmes de couverture, des critiques, etc. avec un lien vers la page correspondante chez Amazon, Barnes & Noble.com et Books-a-Million. Google lançait un appel aux autres éditeurs intéressés mais déjà quelques publications de Dell, Knopf, Random House ou des guides Fodor's (toutes les quatre maisons du même groupe, c'est-à-dire Bertelsmann) étaient présentées. Cela ressemblait à un test et certains, notamment le toujours très pertinent site ResearchBuzz, leur suggérait une seconde étape : s'associer avec les universités et tous ceux qui ont de grands projets de numérisation, agréger les collections de textes déjà numérisés, partager les revenus générés par les publicités AdWords (publicités texte contextuelles), offrir des services en plus comme l'impression à la demande de livres du domaine public et même élargir le contenu indexé. Assez clairvoyant.

De toute façon, Susan Wojcicki, directrice Product management chez Google, déclarait à l'époque au New-York Times, que Google cherchait encore la façon dont ce nouveau service pourrait générer de revenus. Pour le moment, on ne parlait que d'expérimentation. Voire de contre-attaque face à Amazon (voir plus haut). La société ne communiquait aucun chiffre quant aux livres déjà indexés. Et les éditeurs avaient eux-mêmes fournis leurs ouvrages au format électronique. L'article précisait quand même que "Google avait l'expérience de la numérisation d'information imprimée" puisque depuis deux ans ils scannaient et indexaient des catalogues de vente par correspondance sur http://catalogs.google.com. Le journaliste parlait aussi de pourparlers de Google avec des bibliothèques universitaires mais sans plus de commentaires.

Quelques mois plus tard, des magazines, notamment de Reed Elsevier aux Etats-Unis, faisaient leur apparition sur Google Print [via ResearchBuzz toujours]

En février 2004, le New-York Times, toujours, dévoilait que Google avait lancé le Projet Océan en collaboration avec la bibliothèque de l'université de Stanford (dont les fondateurs de Google sont issus) pour numériser leur fonds d'ouvrages tombés dans le domaine public afin d'enrichir leur contenu de façon exclusive.

Le 7 octobre 2004, presque 1 an plus tard, Google faisait une nouvelle annonce sur Google Print au salon du livre de Francfort. Le lieu était bien choisi et cette fois l'objectif était affiché : aider les éditeurs à vendre leurs livres en ligne en indexant gratuitement leurs ouvrages, Google se rétribuant avec les publicités affichées (dont les revenus seront partagés avec les éditeurs). Cette fois-ci, la presse parlait d'une douzaine d'éditeurs déjà partants (des éditeurs professionnels notamment, Associated Press donnait les noms de Penguin, Wiley, Hyperion, Pearson, Taylor & Francis, Cambridge, Chicago, Oxford University Press, Princeton et Scholastic). Random House n'en faisait plus partie.
Les éditeurs interrogés parlaient des soucis de copyright (empêcher la récupération ou l'impression de la totalité des ouvrages) mais soulignaient l'intérêt que pouvait représenter le service pour eux (en clair passer au dessus des libraires). Les éditeurs étaient tous anglophones mais Google annonçait son ambition de s'ouvrir aux autres langues. On pouvait également trouver un lien pour acheter directement le livre sur le site de l'éditeur, en plus des liens vers Amazon et B&N.
Première tentative personnelle de couvrir les évolutions de l'édition et son futur sur Internet, quelques mois après que Google ait lancé son projet Google Print avec le retentissement que l'on sait. Retour au weblog aussi après un lointain essai de suivre l'actualité de la presse et de l'édition à une époque où de nouveaux projets se lançaient quasiment chaque semaine. Bonne lecture.