Heinz-Peter Berg:

"Wird die Nutzung wissenschaftlicher Zeitschriften überschätzt ?"
Ergebnisse des EZUL-Projektes ACCELERATE

Vortrag auf dem
1. wissenschaftlichen Symposium des IBLC
anläßlich der Frankfurter Buchmesse
am 22. Oktober 2000


Wir haben gestern und heute viel darüber erfahren, wie sich das Publikationswesen in den nächsten Jahren ändern könnte. Da war von einer Verkürzung der Publikationskette zu hören und von der Annahme, daß es bald keine Print-Journals mehr geben wird. Es wurde aber auch an beiden Tagen betont, wie wichtig die Rolle der Benutzer in diesem Zusammenhang ist, denn ihr Wille und ihre Gewohnheiten entscheiden letztlich darüber, welche Entwicklung sich durchsetzen wird. Und genau an diesem Punkt setzt mein Vortrag heute an. Wir haben an der Universitätsbibliothek Düsseldorf in einem Projekt beleuchtet, wie unsere Nutzer, also Wissenschaftler und Studenten, mit diesem inzwischen nicht mehr ganz neuen Medium elektronische Zeitschrift umgehen. Nun läuft ein Projekt manchmal zu Beginn in eine etwas andere Richtung als gedacht und so werde ich zu der Frage "wie ejournals genutzt werden" erst im zweiten Teil meines Vortrages kommen.

Folie 2: Gliederung

Der erste Teil beschäftigt sich zunächst mit der Frage, wie man überhaupt an die Informationen kommt, die Aussagen zur Nutzung ermöglichen. Eine Frage, die einen großen Teil unserer Projektzeit in Anspruch genommen hat.

Teil I

Das Projekt, über das ich hier berichten will hatte das Ziel, Akzeptanz und Nutzung von elektronischen Zeitschriften an einer Universitätsbibliothek zu untersuchen. Sie alle wissen, daß es möglich ist, im elektronischen Bereich Nutzungsstatistiken automatisch zu erstellen, und auf diesen Statistiken beruhen letztlich die Einschätzungen der momentanen Nutzung von elektronischen Zeitschriften. Wir wollten zunächst unsere Untersuchungen auf diesen Statistiken aufbauen, mußten dann aber schnell erkennen, daß uns zu wenige Informationen geliefert wurden. So gibt es z.B. Verlage, die mehrere hundert Titel als Paket anbieten und eine Nutzungsstatistik als ausreichend ansehen, die lediglich die Gesamtzahl der aufgerufenen Volltextartikel pro Monat ausweist. Gott sei Dank gehen immer mehr Verlage inzwischen immerhin zu titelbezogenen Statistiken über. Doch auch diese Information ist aus Bibliothekssicht noch nicht ausreichend und so waren wir zu Projektbeginn gezwungen, eigene Nutzungsstatistiken zu entwickeln. Ich stünde heute nicht vor Ihnen, wären wir dabei nicht zu anderen Ergebnissen gelangt, als es die offiziellen Verlagsstatistiken aussagen.

Doch warum ist das so, wo man doch eigentlich erwarten sollte, daß Nutzungsstatistiken aus dem elektronischen Bereich ziemlich objektiv die tatsächliche Nutzung wiedergeben müßten?

Das hat mehrere Ursachen. Da ist zunächst der Nutzungsbegriff. Unabhängig vom Medium stellt sich nämlich die Frage : Was ist eigentlich eine Nutzung ?

Folie 3: Was ist eine Nutzung?

Es gibt nun Verlage, die sich - meiner Meinung nach zurecht - auf den Standpunkt stellen, daß alle diese Nutzungsarten einen Wert darstellen und subsummieren eben alle auch unter dem Begriff "Nutzung"

Doch wie will man Nutzung mit dieser Definition quantitativ erfassen? In einer einzigen Zahl geht es nicht. Es wären also schon Zahlen für jede Nutzungsform einzeln erforderlich. Diese Differenziertheit findet man aber selten. Die meisten Verlage gehen den Weg, eben doch nur die Volltextzugriffe zu berücksichtigen. Dagegen ist auch nichts einzuwenden, schließlich sind es idR nur die Volltexte, die kostenpflichtig sind. Doch wie wird diese Zahl ermittelt, die letztlich das Maß für die Nutzung sein soll ? Dazu ein kurzer technischer Exkurs:

Alles, was von einem WWW-Server abgerufen wird, wird in einem sogenannten LogFile protokolliert. Das ist eine Textdatei, die chronologisch alle Zugriffe auf den Server aufzeichnet. Jeder Eintrag enthält die Informationen, wer, wann, was vom Server geladen hat.

Folie 4: Was steht in einem LogFile ?

D.h. jede Ihrer Transaktionen, also, ob sie sich ein Inhaltsverzeichnis angesehen oder einen Abstract gelesen haben, ist dort gespeichert. Bei der Statistikerstellung geht man nun her und addiert einfach alle die Einträge, die eine Volltextnutzung repräsentieren. Das würde dann zu einem vernünftigen Ergebnis führen, wenn es sich bei jedem abgerufenen Dokument um einen vollständigen Artikel handeln würde. Das muß aber nicht so sein.

Folie 5: Auswerteprobleme (1)

Es gibt Datenformate, da wird jede Seite einzeln vom Server geladen und auch einzeln protokolliert. Würde man also auf diese Weise einen zwölfseitigen Artikel lesen, hätte man statt einer 12 Nutzungen produziert. Dazu ein Beispiel einer authentischen Session:

Folie 6: Beispiel zur Sessionanalyse (hapr98108)

Dieses Screenshot zeigt den chronologischen Ablauf einer Session. Welche Transaktion der Nutzer jeweils getätigt hat, ist in der Spalte "Kürzel" zu erkennen:

Es stellt sich die Frage, wie man die einzelnen Nutzungen, die alle denselben Artikel betrafen, hier bewerten soll.

Folie 7: Auswerteprobleme (2)

Ein ganz anderer Aspekt wird deutlich, wenn man sich die Frage stellt, was der Begriff der Nutzung eigentlich impliziert ? Da beschäftigt sich jemand mit einem Artikel. Er liest, blättert vor und zurück, holt sich eine Tasse Kaffee und beginnt noch einmal von vorne. Tut er das bei einer elektronischen Zeitschrift, wird jeder einzelne Mausklick im LogFile als Volltextnutzung festgehalten, doch war es letztlich mehr als eine einzige Nutzung ? Als Analogon könnten man die Dokumentlieferung heranziehen, bei der sich jemand einen Artikel in Kopie bestellt und dann beliebig oft darin lesen kann - statistisch nur 1 Bestellung, sprich auch eine Nutzung !

Sie sehen schon, will man den Nutzungsbegriff quantifizierbar halten - und das ist schließlich das Ziel -, muß man bei der Zählung berücksichtigen, ob Mehrfachaufrufe einzelner Artikel oder Teile davon auf ein und denselben Nutzer zurückzuführen sind und wenn dies der Fall ist, eben nur eine einzige Nutzung zählen.

Ein schönes Beispiel zeigt folgende Session:

Folie 8: Beispiel zur Sessionanalyse (bapr98332)

Bei Verwendung der herkömmlichen Methode würde man also 10 Volltextzugriffe zählen, wobei es eigentlich nur ein einziger war.

Folie 9: Auswerteprobleme (3)

Zu demselben Problem führt schließlich auch noch eine Erscheinung, die erst durch unseren Auswertealgorithmus sichtbar wurde, nachdem wir nämlich das gesamte LogFile in einzelne Sessions zerlegt hatten. Die Ursache dieses Phänomens konnten wir nicht abschließend klären, es hat aber großen Einfluß auf das Zählergebnis: redundante Mehrfacheintragungen.

Auch zu diesem Aspekt ein anschauliches Beispiel:

Folie 10: Beispiel zur Sessionanalyse (sprjan9967)

Man kann das Gesagte nun für spitzfindig halten. Wir haben diese Aspekte aber natürlich darauf untersucht, welchen Einfluß sie letztlich auf die Nutzerstatistik haben und sind zu folgendem Ergebnis gekommen:

Folie 11: Auswirkungen des Redundanzphänomens

Bei Berücksichtigung des Redundanzphänomens liegen die Nutzungszahlen um ca. 30% niedriger.

Folie 12: Auswirkungen auf die Statistik

Die Berücksichtigung der Aspekte, die sich mit dem Nutzungsbegriff beschäftigen, senken unsere Nutzungszahlen noch einmal um durchschnittlich 10-20 %, sodaß unsere Zahlen nur zwischen 50 und 60% der offiziellen Verlagsstatistik lagen !

 

 

Teil II

Soweit zum Thema Nutzungsstatistik. Nun zu der Frage "wie werden elektronische Zeitschriften genutzt ?"

Um Ihnen einen Eindruck vom Umfang der Untersuchung zu geben, vorher noch zwei Statistiken zur Gesamtnutzung:

Folie 13: Nutzungsverteilung (gesamt: 1275 Titel)

Folie 14: Die TOP15 der ULB Düsseldorf

Nun aber zu der Frage, wie gehen die Benutzer mit diesem neuen Medium um ? In welchem Maß ist die Volltextnutzung überhaupt an der Gesamtnutzung beteiligt oder wie zielstrebig werden einzelne Artikel aufgerufen ?

Hierzu ist folgendes zu sagen:

Folie 15: Volltextnutzungen innerhalb einer Session

Und zum Abschluß noch ein Blick auf die Nutzungsbreite der einzelnen Titel. Oder anders ausgedrückt: wir wollten wissen, von wievielen verschiedenen Nutzern der einzelne Titel genutzt wird. Das Ergebnis unserer TOP15-Titel sei hier exemplarisch dargestellt am Beispiel unseres Spitzentitels "Trends in Neurosciences":

Folie 16: Nutzungsbreite eines Titels (1)

Folie 17: Nutzungsbreite eines Titels (2)

Folie 18: Nutzungsbreite eines Titels (3)

Fazit

Es mag jetzt etwas sonderbar klingen, wenn ich feststelle, daß sich elektronische Zeitschriften bei uns inzwischen als Nutzungsform etabliert haben. Nicht in jedem Wissensgebiet und sicher nicht bei allen. Deutliche Schwerpunkte konnten wir im Bereich der Medizin feststellen, was zum einen aber sicher daran liegt, daß die Universität Düsseldorf hier besonders etabliert ist und zum anderen daran, daß unser Angebot elektronischer Zeitschriften stark STM-lastig ist - daher vermutlich auch die weiteren Nutzungsschwerpunkte im Bereich der Naturwissenschaften. Daß eine Akzeptanz aber deutlich auszumachen ist, mache ich an den absoluten monatlichen Nutzungszahlen fest, die sich nach einer ca. halbjährigen Anlaufphase bei etwa 3000 Volltextzugriffen eingependelt haben. Es bleibt aber festzuhalten, daß viele dieser 3000 Zugriffe über den Weg der elektronischen Artikelsuche zustande kamen, eine bestimmte Zeitschrift also eher zufällig aufgerufen wurde.

Zum Thema Nutzungsstatistiken wäre noch zu sagen, daß es aus Sicht der Bibliotheken sicher wünschenswert wäre, wesentlich mehr Informationen als bisher über die Nutzung zu bekommen, denn Nutzungsstatistiken sind schließlich kein Selbstzweck, sondern sollten als fundierte Grundlage für Erwerbungsentscheidungen herangezogen werden können.

Folie 19: Fazit

Ich möchte an dieser Stelle noch auf einen Workshop aufmerksam machen, der im vergangenen Jahr auf der Grundlage unserer Projekterkenntnisse Vorschläge erarbeitet hat, wie Statistiklieferungen seitens der Verlage aussehen könnten, um den Informationsbedarf von Bibliotheken zu decken. Die Vorschläge berücksichtigen die dargestellten Zählproblematiken und sind so ausgelegt, daß der Erstellaufwand möglichst niedrig gehalten wird, individuelle Informationsbedürfnisse aber trotzdem durch Eigenleistung ermöglicht werden.

Die Vorschläge sind im Internet nachzulesen unter :

http://gesig.ub.uni-konstanz.de/deu/projekt1bericht.htm

Folie 20: Vorschlag zur Statistikerstellung