Such-Indexierung von Dokumenten

Dokumente können in den Such-Index aufgenommen werden. Somit können Inhalte in externen Dateien in der Suche gefunden werden. Die Indexierung umfasst Daten und Metadaten der Dokumente.

Folgende Dokumenttypen werden prinzipiell unterstützt.

Typ

XML-basiert

Unterstützt

Nicht unterstützt

Dateiendung

Excel

Ja

ab Excel '97-2003 Dateiformat,

Excel 2007+ .xlsx OOXML

Keine Limitation bekannt

xls, xla, xlw, xlt

Word

Ja

ab Word '97(-2007) Dateiformat,

Word 2007+ .docx OOXML

Keine Limitation bekannt

doc, dot

Powerpoint

Ja

ab Powerpoint 2007+ .pptx OOXML

Keine Limitation bekannt

ppt, pps, ppa, pot

Adobe-Pdf

Nein

Keine Limitation bekannt

Keine Limitation bekannt

pdf

Open Document Format bzw. Open Office 2.0

Ja

Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen')

Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen')

odg, dtg, odp, otp, odt, ott, odf, ods, ots

Open Office 1.0

Ja

Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen')

Keine Limitation bekannt (aber evtl. Verstärktes 'Rauschen')

sxd, std, sxi, sti, sxw, stw, sxc, stc, sxm

Star Office

StarDraw 3.0, StarImpress 5.0, 4.0

StarDraw 5.0

StarWriter 5.0 / 4.0 / 3.0

StarMath 5.0

StarCalc 5.0 / 4.0 / 3.0

Ja

Xml-basiert (sehr wahrscheinlich verstärktes 'Rauschen')

Keine Limitation bekannt

vor, sdd, sda, sdw, smf, sdc

Xml

Ja

Verstärktes Rauschen

Keine Limitation bekannt

xml (Evtl. über Konfigurationseinstellungen nachdenken, so dass auch Mindmaps etc. durchsuchbar sind.)

Voraussetzungen:

  • Im Schema ist für die Kategorien Dokument die Option Objekte in Index aufnehmen aktiviert.

  • Der alte Index (gleichnamiger Ordner im Datenbankverzeichnis) muss gelöscht werden, bevor Aeneis gestartet wird.

    Siehe auch: Index löschen

  • Im Portal-Bericht muss im Eintrag Durchsuchte Kategorien die Kategorie Dokument referenziert sein.

Limitationen:

  1. Es gibt keine Garantie für die Vollständigkeit der Indexierung von Inhalten von Dokumenten. (Dies ist auch von dem Funktionsumfang zugrundeliegender Bibliotheken abhängig.) Dies betrifft insbesondere nicht unterstützte Dokumenttypen, aber auch die unterstützten.

  2. Der Speicherbedarf für den Index kann stark ansteigen.

  3. Die Dauer der Abfragen kann durch die Inhalte der Dokumente evtl. stark verlangsamt werden. Dies hängt von der Performance der Suchmaschine "Lucene" ab.

  4. Besonders bei Dateien im Xml-basierten Format kann es zu einem ungewollten Indexieren von Dateiformat-Informationen kommen, die eigentlich nicht sinnvoll in der Suche sind (Werte wie 'true', 'false', Koordinaten etc.). → Oben 'Rauschen' genannt.

  5. Alle in diesen Zusammenhängen auftretenden Probleme, die nicht zu Ausnahmen führen, können in Support-Fällen generell als Verbesserung aber nicht als Fehler gehandhabt werden.