11/2004 Print on the Web

Die Möglichkeiten, das Internet zu durchsuchen, werden ständig größer: Unter anderem die größte Suchmaschine Google durchsucht heute nicht nur HTML-Seiten, sondern auch PDFs oder Office-Dokumente wie Word, Excel, Powerpoint, und sogar Shockwave Flash. Weiters bietet sie neben der Standard-Websuche auch die Suche nach Bildern, Newsgroups und News (da der gewöhnliche Index im Durchschnitt immer einige Wochen hinter den Inhalten des Web hinterherhinkt). Trotzdem bleibt viel zu tun: Google umfasst aktuell mehr als vier Milliarden Seiten, doch das ist nur ein kleiner Bruchteil des so genannten Invisible Web, das aus einer um ein Vielfaches größeren Masse aus Informationen besteht, die in Datenbanken enthalten und demnach bis heute nicht zentral durchsuchbar sind. Ein Schritt in die richtige Richtung ist das neue, derzeit als Beta-Version zugängliche Werkzeug Google Print. Bereits seit Oktober 2003 gibt es auf Amazon.com – noch nicht auf den deutschsprachigen Subseiten – die Funktion „search inside the book“: Beim Start enthielt dieses Service den Inhalt von etwa 120.000 Büchern von ungefähr 200 Verlagen. Bei der Suche nach einer bestimmten Phrase werden nicht nur Buchtitel zum Thema dargestellt, sondern auch gescannte Buchseiten angezeigt, die die Phrase enthalten. Es ist dann möglich, die gefunde Seite plus zwei davor und zwei danach anzusehen und das Buch nach weiteren Begriffen zu durchsuchen – wer mehr will, muss kaufen, da der größte Feind solcher Dienste natürlich die Angst vor einem Buchschwarzmarkt am Internet la Napster ist. Darum ist das Service auch nur registrierten Kunden zugänglich. Diese Registrierung ist bei Google Print nicht nötig, das im heurigen Oktober mit einem sehr ähnlichen Angebot und ungefähr gleich vielen zu durchsuchenden Büchern begonnen hat – dort werden nämlich Cookies zur Kontrolle der angesehenen Seiten eingesetzt. Auch Google Print zeigt die Buchseite, auf der ein Begriff gefunden wurde, sowie zwei davor und danach. Die Suche in Buchinhalten ist in die gewöhnliche Google-Suche integriert, allerdings bisher nur in die amerikanische Site google.com, und da die Liste an durchsuchten Büchern in Relation zum gesamten Google-Content noch klein ist, findet man selten „zufällig“ einen Buchinhalt. Sicher geht man, Büchervorschläge zu erhalten, wenn man jeweils „books on“ und den Begriff ins Suchfeld einträgt. Alles in allem ein großartiges Werkzeug für Menschen, die mit Büchern arbeiten – es bleibt zu hoffen, dass sich die Zahl der enthaltenen Bücher bald stark vergrößert.

www.google.com
www.google.com/print
www.amazon.com