Search the FirstSpirit Knowledge Base
Hallo,
Folgendes Problem haben wir aktuell mit der Exalead-Suche:
Im Index befinden sich Seiten mit den Titeln der Form:
In einer speziellen Suche stellen wir automatisch Wildcards (*) an die Suchstrings an, so dass beispielsweise bei der Eingabe von "XY-1" nach "XY-1*" gesucht wird. Dabei ist uns aufgefallen, dass sowohl über das Suchservlet als auch über "Exalead CloudView Search" ein Titel im Index mit Hilfe von Wildcards immer nur dann gefunden wird, wenn wir den Teil des Worts bis zum Sonderzeichen eingeben oder das gesamte Wort. Teile des Worts führen zu einem leeren Suchergebnis, wenn das Sonderzeichen plus weitere Zeichen (aber noch nicht das ganze Wort) mit eingegeben wurden
Beispiele:
Suche nach "XY-*"
Ergebnis: "XY-123", "XY-1234"
Suche nach "XY-1*"
Ergebnis: leer
Suche nach "XY 1*"
Ergebnis: leer
Suche nach "XY-123*"
Ergebnis: "XY-123"
Erkenntnis:
Konfiguration
Hat Exalead Probleme, wenn Wörter im Index Sonderzeichen aufweisen?
Vielen Dank und viele Grüße
Reza Nazarian
Das Ergebnis liegt inzwischen vor (Vielen Dank!). Die Lösung liegt in der Anpassung der Datei linguistics.xml. Im Folgenden wird die Vorgehensweise dafür beschrieben. Zu bedenken ist, dass der gesamte Index gelöscht werden muss:
<charOverrides>
</charOverrides>
durch
<charOverrides>
<StandardTokenizerOverride type="token" toOverride="-" />
</charOverrides>
ersetzen.
Mit dem StandardTokenizerOverride-Tag können auch weitere Sonderzeichen auf diese Weise behandelt werden. Nachzulesen ist diese und weitere Konfigurationsmöglichkeiten in der linguistics.xml in der Online-Doku von exalead unter Semantic Guide : Linguistic Configuration Files : Linguistic.xml
Hallo Reza,
ich konnte das Problem hier nachstellen, allerdings habe ich auf Anhieb keine Exalead-Konfiguration gefunden, die das erwartete Verhalten liefert. Wir werden uns in dieser Sache direkt an Exalead wenden und melden uns nochmal, sobald wir eine Antwort erhalten haben.
Viele Grüße,
Donato
Hallo Donato,
Vielen Dank schon mal. Ich bin gespannt!
Viele Grüße
Reza
Das Ergebnis liegt inzwischen vor (Vielen Dank!). Die Lösung liegt in der Anpassung der Datei linguistics.xml. Im Folgenden wird die Vorgehensweise dafür beschrieben. Zu bedenken ist, dass der gesamte Index gelöscht werden muss:
<charOverrides>
</charOverrides>
durch
<charOverrides>
<StandardTokenizerOverride type="token" toOverride="-" />
</charOverrides>
ersetzen.
Mit dem StandardTokenizerOverride-Tag können auch weitere Sonderzeichen auf diese Weise behandelt werden. Nachzulesen ist diese und weitere Konfigurationsmöglichkeiten in der linguistics.xml in der Online-Doku von exalead unter Semantic Guide : Linguistic Configuration Files : Linguistic.xml