Term of the Month:
Thesaurus
"Thesauros" bezeichnete in der griechischen Antike die Schatzkammer innerhalb einer Tempelanlage, wo die Opfergaben gesammelt wurden. Später wurde der Begriff für den Wortschatz übernommen. In der Dokumentationswissenschaft steht der Begriff für ein kontrolliertes Vokabular und seine Relationen (thematischen Beziehungen), durch die seine Begriffe miteinander verbunden sind. Entsprechend umfasst ein Fachthesaurus das Fachvokabular bzw. den Wortschatz eines Fachbereiches.
Diese Menge aller Termini (= Wörter) eines Fachgebiets ohne die anderen Merkmale der Fachsprache wie etwa Phraseologie oder Grammatik wird auch als Terminologie bezeichnet. Sie kann in einem Wörterbuch, einem Glossar oder einem Thesaurus formuliert sein.
Anders als in einem Wörterbuch oder einem Glossar ist ein Thesaurus nicht bloß eine alphabetische Ordnung von Wörtern, sondern er beschreibt auch ihre inhaltlichen Beziehungen. Haben verschiedene Wörter dieselbe Bedeutung, so nennt man sie Synonyme. Werden jedoch unterschiedliche Bedeutungen mit gleichklingenden Wörtern beschrieben, so werden diese Homonyme genannt. Antonyme sind Begriffe mit gegenteiliger Bedeutung. Assoziationen sind Wörter mit ähnlicher Bedeutung oder solche, "die Sie auch interessieren könnten". Solche Wörter können folglich in einem hierarchischen Zusammenhang (Über- oder Unterbegriffe), in einer Äquivalenz- oder in einer Assoziations-Relation stehen. Ein Thesaurus weist auf all diese Beziehungen hin.
In der gesprochenen Sprache kümmert man sich um diese Zusammenhänge wenig, da sie meist aus dem Kontext heraus verständlich sind. Im Bereich des Information Retrieval werden Thesauri für die inhaltliche Erschließung und Indexierung verwendet. Denn für Suchmaschinen stellt die Erweiterung der Suchanfrage auf Synonyme und Unterbegriffe neben dem eigentlichen Suchbegriff (Deskriptor) eine wesentliche Möglichkeit dar, um die Suche semantisch anzureichern und somit ein präziseres oder erweitertes Suchergebnis zu liefern, das eher dem Kontext bzw. dem Sinn als der Form der Frage entspricht. Der Thesaurus dient somit als Dokumentationssprache zum Indexieren, Speichern und Finden von Dokumenten.
Elektronische Thesauri wie jener in Microsoft WORD sind Verzeichnisse von beliebigen Wörtern z.B. für die Erkennung von Rechtschreibfehlern. Ihr Vokabular ist nicht notwendigerweise kontrolliert und kann von den Benutzern ergänzt werden. Solche Thesauri können auch den gesamten Wortschatz einer Sprache umfassen und als Wörterbuch für einfache Übersetzungen verwendet werden.
Regeln für den Aufbau von Thesauri (Auswahl von Index-Termen etc.) sind u.a. in den "UNESCO's Guidelines for the Establishment and Development of Monolingual Thesauri" enthalten, deren Inhalte den ISO-Standard 2788:1986 wesentlich beeinflussten. Durch die hohe Vernetzung von Begriffen untereinander sind Thesauri im Gegensatz zu Klassifikationen meist polyhierarchisch organisiert.
Auch ein semantisches Netz ist ein formales Modell von Begriffen und ihren Beziehungen (Relationen). Dabei übersteigt die Komplexität der Beziehungen jene eines Thesaurus.
Eine Ontologie im Sinne der Informatik bildet ebenfalls Begrifflichkeiten in einem bestimmten Gegenstandsbereich und die zwischen ihnen bestehenden Beziehungen ab. Diese Beziehungen gehen jedoch in der Regel weit über die in einem Thesaurus dargestellten Beziehungen hinaus. Vielmehr stellt eine Ontologie ein Netzwerk von Informationen mit logischen Relationen bzw. Regeln dar, das Schlussfolgerungen auf Computerebene und somit durch Software der Artificial Intelligence ermöglichen soll. Die verschiedenen Methoden der Wissensrepräsentation bilden die Grundlage für das Semantic Web, das in Zukunft die inhaltsbezogene assoziative Informationssuche ermöglichen soll.
Und was ist ein Thesaurus Rex?
"A person who uses a word program or internet thesaurus in order to make their papers or written works appear smarter by replacing common words with larger or uncommon words." (http://www.urbandictionary.com/define.php?term=Thesaurus+Rex)