gator
I'm new here

Exalead publicurl anpassen

Hallo,

in unserem Projekt werden Seiten an die Exalead Suchmaschine per Push-API übergeben.

Dazu wird das Skript aus dem Enterprise Search Modul genutzt.

Das funktioniert soweit ganz prima.

Die Frage ist aber, ob es möglich ist, den indexierten URL-Pfad zu manipulieren.

Die Notwendigkeit besteht, da beim Generieren in Verzeichnisse wie /de_at/ geschrieben wird, in der Such-URL aber hiervon nur das /de/ zu sehen sein soll.

Ich habe einige Versuche mit dem Replace Regexp Document Processor von Exalead gemacht, das hat aber nicht funktionert.

Viele Grüße,

Christian

0 Kudos
9 Replies
marro
Crownpeak employee

Hallio Christian,

da Exalead die publicurl zur Verlinkung der Suchergebnisse verwendet, würde eine Manipulation des indexierten URL-Pfads dazu führen, dass bei einem Klick auf den Suchtreffer das entsprechende Dokument nicht gefunden würde, da es in ein anderes Verzeichnis als das durch die publicurl angegebene generiert wurde.

Grüße

Donato

0 Kudos

Hallo Donato,

das Problem ist leider umgedreht. Die Pfade werden vom Webserver durch eine Rewrite-Rule geändert und dass muss sich auch in den Links von Exalead widerspiegeln. Wenn die Pfade so bleiben wie sie generiert werden, führen die Links zu keinem Ergebnis.

Gruß,

Christian

0 Kudos
marro
Crownpeak employee

Hallo Christian,

mir fällt dazu leider keine Exalead-seitige Lösung ein. Eine Möglichkeit wäre, den Pfad bei der Ausgabe in der JSP selbst zu modifizieren. Innerhalb des loop_hits-Tags kann man auf das PageAttribut uri zugreifen, welches den Pfad zum Dokument beginnend mit dem Sprachkanal enthält (mit der Projekt-ID als zusätzlichen Prefix). Beispiel: 4598/de_at/abteilungen/entwicklung.jsp. Die Projekt-ID müsste man dann durch den Serverpfad bis zum Sprachkanal ersetzen und das Sprachverzeichnis entsprechend eurer Rewrite-Rules anpassen. Diesen Pfad würde man dann anstelle des hits_url-Tags für die Verlinkung des Suchtreffers verwenden.

Gruß,

Donato

aVogt
Returning Creator

Hallo Christian,

wir haben das Problem so gelöst, indem wir ein Textfeld für die URL in Exalead angelegt haben und auf dieses dann bei der Ausgabe auf der Such-Ergebnis-Seite zugreifen. Somit können wir die gewünschten Links verwenden.

Vieleicht ist das ja eine Alternative ...

Grüße

Andreas

Hallo Andreas & Donato,

ich denke eine von den beiden Lösungen werden wir implementieren. Sehr unschön dabei ist aber dennoch, dass die automatische Spracherkennung von Exalead nicht mehr funktioniert, weil die Sprachen/Länder im Generierungspfad vertauscht wurden.

Gruß,

Christian

0 Kudos
marro
Crownpeak employee

Hallo Christian,

wie habt ihr denn das Push-Skript konfiguriert? Habt ihr den Parameter meta_extract_language_from_path auf true oder false/leer gesetzt? Wenn der auf true gesetzt ist, sollte das Skript beim Pushen das erste Sprachkürzel als Sprache für das Dokument nehmen. Dokumente, deren Pfad mit de_at/ beginnt, sollten demnach die Sprache Deutsch zugeordnet bekommen. Wenn der Parameter auf false (Standard) gesetzt ist, dann übernimmt Exalead die Bestimmung der Sprache anhand des Inhalts des Dokuments. Dann sollte der Pfad aber keine Rolle spielen.

Gruß,

Donato

0 Kudos

Hallo Donato,

leider sind bei uns die Sprachkürzel und Länderkürzel andersrum, also at_de statt de_at. Damit funktioniert die automatische Spracherkennung nicht. Über ein Metadatum lässt sich das Problem aber lösen, bzw. so habe ich es gelöst.

Ich finde die Lösung bei der Ausgabe den Pfad anzupassen doch sehr unschön.

Gibt es mit dem Push-Skript denn nicht generell das Problem, dass der PDF bzw. XML-Kanal eine "hässliche" Url bekommt? Also z.B. http://www.site.com/de_1/document.pdf, hier möchte man doch eher http://www.site.com/de/document.pdf sehen? Das ist doch eigentlich das gleiche Grundproblem, dass die Url eines Dokumentes anhand der generierten Verzeichnisstruktur festgelegt ist. Etwaige Veränderungen dieser Struktur über rsynch-Skripte lassen sich wirklich nicht dem Indexer mitteilen?

Gruß,

Christian

0 Kudos
marro
Crownpeak employee

Hallo Christian,

sobald die Verzeichnisstrukur nachträglich (z.B. über rsynch-Skripte) verändert wird, tun sich immer potentielle Probleme auf, wenn bestimmte Features auf die von FirstSpirit erzeugte Verzeichnisstruktur aufbauen. Dies ist wie in eurem Fall bei der Suche der Fall, aber auch die Anbindung eines Analytics-Tools würde damit z.B. problematisch werden. Somit müssen leider aktuell diese Veränderungen an der Verzeichnisstruktur noch an den verschiedenen Stellen berücksichtigt und "abgefangen" werden, so wie Du es bei der Suche über ein Metadaum getan hast. Eine andere Möglichkeit fällt mir in eurem Szenario auch nicht ein, da dem Indexer die Verzeichnisstruktur nicht explizit mitgeteilt werden kann. Allerdings wird es mit FirstSpirit 5 möglich sein, die Verzeichnisstruktur bzw. die URLs der Seiten bereits bei ihrer Generierung in das benötigte Format zu bringen, so dass nachträgliche Änderungen an der Verzeichnisstruktur damit nicht mehr nötig sein sollten.

Viele Grüße

Donato

0 Kudos

Hallo Donato,

danke für die Antwort. Ich hatte mir das schon gedacht, wollte aber nochmal sicher gehen.

Gruß,

Christian

0 Kudos