Such-Indexierung von Dokumenten
Dokumente können in den Such-Index aufgenommen werden. Somit können Inhalte in externen Dateien in der Suche gefunden werden. Die Indexierung umfasst Daten und Metadaten der Dokumente.
Folgende Dokumenttypen werden prinzipiell unterstützt.
Typ |
XML-basiert |
Unterstützt |
Nicht unterstützt |
Dateiendung |
---|---|---|---|---|
Excel |
Ja |
ab Excel '97-2003 Dateiformat, Excel 2007+ .xlsx OOXML |
Keine Limitation bekannt |
xls, xla, xlw, xlt |
Word |
Ja |
ab Word '97(-2007) Dateiformat, Word 2007+ .docx OOXML |
Keine Limitation bekannt |
doc, dot |
Powerpoint |
Ja |
ab Powerpoint 2007+ .pptx OOXML |
Keine Limitation bekannt |
ppt, pps, ppa, pot |
Adobe-Pdf |
Nein |
Keine Limitation bekannt |
Keine Limitation bekannt |
|
Open Document Format bzw. Open Office 2.0 |
Ja |
Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen') |
Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen') |
odg, dtg, odp, otp, odt, ott, odf, ods, ots |
Open Office 1.0 |
Ja |
Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen') |
Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen') |
sxd, std, sxi, sti, sxw, stw, sxc, stc, sxm |
Star Office StarDraw 3.0, StarImpress 5.0, 4.0 StarDraw 5.0 StarWriter 5.0 / 4.0 / 3.0 StarMath 5.0 StarCalc 5.0 / 4.0 / 3.0 |
Ja |
Xml-basiert (sehr wahrscheinlich verstärktes 'Rauschen') |
Keine Limitation bekannt |
vor, sdd, sda, sdw, smf, sdc |
Xml |
Ja |
Verstärktes Rauschen |
Keine Limitation bekannt |
xml (Evtl. über Konfigurationseinstellungen nachdenken, so dass auch Mindmaps etc. durchsuchbar sind.) |
Voraussetzungen:
-
Im Schema ist für die Kategorien Dokument die Option Objekte in Index aufnehmen aktiviert.
-
Der alte Index (gleichnamiger Ordner im Datenbankverzeichnis) muss gelöscht werden, bevor Aeneis gestartet wird.
Siehe auch: Index löschen
-
Im Portal-Bericht muss im Eintrag Durchsuchte Kategorien die Kategorie Dokument referenziert sein.
Limitationen:
-
Es gibt keine Garantie für die Vollständigkeit der Indexierung von Inhalten von Dokumenten. (Dies ist auch von dem Funktionsumfang zugrundeliegender Bibliotheken abhängig.) Dies betrifft insbesondere nicht unterstützte Dokumenttypen, aber auch die unterstützten.
-
Der Speicherbedarf für den Index kann stark ansteigen.
-
Die Dauer der Abfragen kann durch die Inhalte der Dokumente evtl. stark verlangsamt werden. Dies hängt von der Performance der Suchmaschine "Lucene" ab.
-
Besonders bei Dateien im Xml-basierten Format kann es zu einem ungewollten Indexieren von Dateiformat-Informationen kommen, die eigentlich nicht sinnvoll in der Suche sind (Werte wie 'true', 'false', Koordinaten etc.). → Oben 'Rauschen' genannt.
-
Alle in diesen Zusammenhängen auftretenden Probleme, die nicht zu Ausnahmen führen, können in Support-Fällen generell als Verbesserung aber nicht als Fehler gehandhabt werden.