Universitäts- und Landesbibliothek Düsseldorf
 
German
 

MILOS I/II - Kurzbeschreibung der Projektinhalte

Automatische Indexierung

Unter automatischer Indexierung wird ganz allgemein die maschinelle Ermittlung von Stichwörtern aus Dokumenten verstanden. Das Spektrum der Möglichkeiten reicht dabei von einfachen Extraktionsverfahren - Selektion von Substantiven, Adjektiven und Verben aus dem Text - über linguistische Verfahren der Syntaxanalyse (sog. Parsing), bis hin zu wahrscheinlichkeitsorientierten Indexierungs- und Retrievaltechniken. Programme zur automatischen Indexierung gibt es bereits seit den 60er Jahren, doch liegt deren Anwendungsbereich vor allem bei Fachdatenbanken in englischer Sprache. Erfahrungen mit dem Einsatz der automatischen Indexierung in Bibliotheken gibt es bislang nicht.

Das Indexierungsverfahren IDX

Das in den Projekten MILOS I und II eingesetzte Indexierungssystem IDX wurde von Prof. Dr. Harald H. Zimmermann, Fachrichtung Informationswissenschaft der Universität des Saarlandes, entwickelt. Es handelt sich um ein rein wörterbuchbasiertes Verfahren, d.h. alle Arbeiten am Text beruhen auf einem Abgleich mit verschiedenen elektronischen Wörterbüchern. Dabei unterstützt IDX folgende Funktionen für die Sprachen Deutsch, Englisch und Französisch:

  • Ermittlung von Grundformen zu den im Text vorkommenden Wortformen (Bibliotheken -> Bibliothek)
  • Markierung bzw. Eliminierung von Stoppwörtern
  • Bereitstellung von Wortableitungen und von (sinnvollen) Bestandteilen von Komposita
    (bibliothekarisch -> Bibliothek;
    Bibliothekswissenschaft -> Bibliothek, Wissenschaft)
  • Bereitstellung von Begriffsrelationen
    (Stichwort -> Schlagwort;
    Begriff -> Oberbegriff;
    Begriff -> verwandter Begriff)
  • Mehrwort-Erkennung und Wortbindestrichergänzung
    (Regeln für den Schlagwortkatalog;
    Buch- und Bibliothekswesen -> Buchwesen, Bibliothekswesen)

Seit Januar 1994 wird an der Universitäts- und Landesbibliothek Düsseldorf im Rahmen der von der Deutschen Forschungsgemeinschaft geförderten Projekte MILOS I und MILOS II (Maschinelle Indexierung zur erweiterten Literaturerschließung in Online-Systemen) untersucht, welche Möglichkeiten für den Einsatz von IDX in Bibliotheken bestehen.

MILOS I

Ziele von MILOS I waren die Weiterentwicklung von IDX und die Anpassung des Systems an die spezielle Arbeitsumgebung einer wissenschaftlichen Universalbibliothek. Während der einjährigen Laufzeit des Projekts wurden in grossem Umfang Titeldaten der ULB Düsseldorf automatisch indexiert, aus dem praktischen Einsatz heraus zahlreiche Systemverbesserungen programmiert und auf der Grundlage der indexierten Daten neueWörterbücher aufgebaut bzw. bereits bestehende stark erweitert. Ein abschliessender Retrievaltest mit automatisch erzeugten Indexaten führte zu durchweg positiven Ergebnissen, so daß die ULB die automatische Indexierung als festen Bestandteil der Suchmöglichkeiten in ihren OPAC integrieren wird. Im Hinblick auf eine möglichst umfassende Aus- und Nachnutzung der Systemmöglichkeiten bietet sich für die Zukunft der Einsatz der automatischen Indexierung auf Verbundebene geradezu an.

MILOS II

Aufbauend auf den Ergebnissen von MILOS I wird innerhalb des Folgeprojektes MILOS II seit Januar 1995 an einer Ausweitung der Funktionalität von IDX gearbeitet. Ziel von MILOS II ist die sinnvolle Zusammenführung von konventionellen Methoden der inhaltlichen Erschließung - verbale Sacherschließung nach den Regeln für den Schlagwortkatalog (RSWK), klassifikatorische Erschließung - mit den Möglichkeiten eines automatischen Indexierungsverfahrens. In Zusammenarbeit mit der Deutschen Bibliothek wird IDX durch die Einbindung von Thesaurusrelationen der Schlagwortnormdatei in das Wörterbuchkonzept um semantische Funktionalitäten erweitert werden (Elektronischer Thesaurus). Die für die automatische Indexierung im neuen Funktionsumfang notwendige Erweiterung der Wörterbücher erfolgt im Sinne größtmöglicher Nachnutzbarkeit auf der Grundlage der maschinenlesbaren Titeldaten der DDB.

Redaktion: Heinz-Peter Berg       Stand: 06.01.2011, 10:18
Seitenende
Universitäts- und Landesbibliothek © 2008 Heinrich-Heine-Universität Düsseldorf http://www.ub.uni-duesseldorf.de/home/en/ueber_uns/projekte/abgeschlossene_projekte/milos/mil_kurz4329bf20>