10. September 2009

Googles Bücher

"1899 was a literary annus mirabilis, which saw the publication of Raymond Chandler's Killer in the Rain, The Portable Dorothy Parker, André Malraux's La Condition Humaine, Stephen King's Christine, The Complete Shorter Fiction of Virginia Woolf, Raymond Williams's Culture and Society 1780-1950, and Robert Shelton's biography of Bob Dylan, to name just a few.

1899 war ein annus mirabilis der Literatur: Damals erschienen Raymond Chandlers Killer in the Rain, The Portable Dorothy Parker, André Malrauxs La Condition Humaine, Stephen Kings Christine, The Complete Shorter Fiction of Virginia Woolf, Raymond Williams' Culture and Society 1780-1950, und Robert Sheltons Biographie von Bob Dylan."


Diese und viele andere erschreckende Entdeckungen beschert uns Geoffrey Nunberg in seinem lesenswerten Artikel "Google's Book Search: A Disaster for Scholars" (Chronicle of Higher Education), der den etwas anderen Blick in die Google-Bücher wirft. Gleich welche Lösung für die urheberrechtlichen Fragen gefunden wird: Es liegt noch mehr im Argen.

Wenn Googles Digitalisierungsprojekt wirklich aufgrund seines Umfangs das einzige all-umfassende und damit für alle Zeiten _die_ digitale Bibliothek schlechthin bleiben wird, dann wird sich an der Qualität der Metadaten noch viel bessern müssen. Wissenschaftler lesen Bücher nicht nur, sondern betrachten sie auch als Objekte wissenschaftlicher Betrachtung. Google sei "a quick study", kapiere also schnell, meint Nunberg - doch das würde in diesem Fall bedeuten müssen, langsam, Buch für Buch, akribisch und penibel vorgehen und Fehler beheben (lassen).

1 Kommentar:

Schnickschnack hat gesagt…

In

http://languagelog.ldc.upenn.edu/nll/?p=1701#comment-41758

findet sich ein ausführlicher Kommentar von einem zuständigen Google-Mitarbeiter, in dem erläutert wird, dass ein Grossteil der Metadaten-Fehler auf Fehlern beruhen, die in "eingekauften" Daten schon vorhanden waren. Die "1899"-Daten z.B. stammen von einem Metadaten-Lieferanten, der "1899" (vermutlich sogar eher "99") als Code für "nicht eingepflegt" genutzt zu haben scheint.