Zur schnellen Informationsgewinnung und dem Auffinden aus bekannten wie auch nicht bekannten (aber auf den Medien vorhandenen) Dokumenten wird die Volltextrecherche genutzt. Die Volltextrecherche dient daher dem Auffinden, Entdecken und Extrahieren unbekannter, nicht trivialer und wichtiger Informationen aus großen Mengen von unstrukturierten Texten/Dateien und ist somit auch ein wichtiger Teilbereich des Text Mining. Sie ist eine Sofortlösung, um für eine konkrete Fragestellung auf Systeme wie Dokumentenmanagement und Data-Mining verzichten zu können.
Im Kontext von Datenbanken bedeutet Volltextsuche, dass zusätzlich zu einer sonst etwa genutzten SQL-Abfrage, die eine Kenntnis der Feldstruktur voraussetzt, auch feldunabhängig gesucht werden kann.
Grundlegende Sucharten
Diese Aufzählung ist nicht abschließend:
Je nach verwendetem Suchsystem gibt es folgende Suchmöglichkeiten:
- Wortsuche
- beliebige Wörter
- Phrasensuche: "Mit Wikipedia kann man"
- Boolesche Operatoren: "und/oder/nicht"
- Umfeldsuche: Wörter oder Phrasen die "n" Wörter voneinander entfernt sind (bei PDF-Index kleiner als 3 Seiten)
- Platzhaltersuche:
- für einzelne Buchstaben "?" wie Ma?er = Mayer/Maier/Mauer...
- für beliebig viele Buchstaben "*"
- innerhalb von Datenbanktabellen mit SQL "SELECT text FROM tabelle WHERE text LIKE '%suchbegriff%'"
- Unscharfe bzw. fehlertolerante Suche Fuzzy-Suche
- Thesaurus-/Synonym-Suche
- Natürlichsprachliche Suche mit Relevanzsortierung: "Finde alle IT-Artikel in Wikipedia"
- Kombination mit den vorgenannten Möglichkeiten
- Makro-Suche: Eine Möglichkeit mit vordefinierten Makros wiederkehrende Suchabfragen durchzuführen
- ...
Dieser Artikel basiert auf dem Artikel Volltextrecherche aus der freien Enzyklopädie Wikipedia und steht unter der Doppellizenz GNU-Lizenz für freie Dokumentation und Creative Commons CC-BY-SA 3.0 Unported (Kurzfassung (de)). In der Wikipedia ist eine Liste der Autoren verfügbar.