- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Exalead publicurl anpassen
Hallo,
in unserem Projekt werden Seiten an die Exalead Suchmaschine per Push-API รผbergeben.
Dazu wird das Skript aus dem Enterprise Search Modul genutzt.
Das funktioniert soweit ganz prima.
Die Frage ist aber, ob es mรถglich ist, den indexierten URL-Pfad zu manipulieren.
Die Notwendigkeit besteht, da beim Generieren in Verzeichnisse wie /de_at/ geschrieben wird, in der Such-URL aber hiervon nur das /de/ zu sehen sein soll.
Ich habe einige Versuche mit dem Replace Regexp Document Processor von Exalead gemacht, das hat aber nicht funktionert.
Viele Grรผรe,
Christian
- Labels:
-
Developers
-
Knowledgebase
- Tags:
- exalead
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallio Christian,
da Exalead die publicurl zur Verlinkung der Suchergebnisse verwendet, wรผrde eine Manipulation des indexierten URL-Pfads dazu fรผhren, dass bei einem Klick auf den Suchtreffer das entsprechende Dokument nicht gefunden wรผrde, da es in ein anderes Verzeichnis als das durch die publicurl angegebene generiert wurde.
Grรผรe
Donato
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Donato,
das Problem ist leider umgedreht. Die Pfade werden vom Webserver durch eine Rewrite-Rule geรคndert und dass muss sich auch in den Links von Exalead widerspiegeln. Wenn die Pfade so bleiben wie sie generiert werden, fรผhren die Links zu keinem Ergebnis.
Gruร,
Christian
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Christian,
mir fรคllt dazu leider keine Exalead-seitige Lรถsung ein. Eine Mรถglichkeit wรคre, den Pfad bei der Ausgabe in der JSP selbst zu modifizieren. Innerhalb des loop_hits-Tags kann man auf das PageAttribut uri zugreifen, welches den Pfad zum Dokument beginnend mit dem Sprachkanal enthรคlt (mit der Projekt-ID als zusรคtzlichen Prefix). Beispiel: 4598/de_at/abteilungen/entwicklung.jsp. Die Projekt-ID mรผsste man dann durch den Serverpfad bis zum Sprachkanal ersetzen und das Sprachverzeichnis entsprechend eurer Rewrite-Rules anpassen. Diesen Pfad wรผrde man dann anstelle des hits_url-Tags fรผr die Verlinkung des Suchtreffers verwenden.
Gruร,
Donato
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Christian,
wir haben das Problem so gelรถst, indem wir ein Textfeld fรผr die URL in Exalead angelegt haben und auf dieses dann bei der Ausgabe auf der Such-Ergebnis-Seite zugreifen. Somit kรถnnen wir die gewรผnschten Links verwenden.
Vieleicht ist das ja eine Alternative ...
Grรผรe
Andreas
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Andreas & Donato,
ich denke eine von den beiden Lรถsungen werden wir implementieren. Sehr unschรถn dabei ist aber dennoch, dass die automatische Spracherkennung von Exalead nicht mehr funktioniert, weil die Sprachen/Lรคnder im Generierungspfad vertauscht wurden.
Gruร,
Christian
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Christian,
wie habt ihr denn das Push-Skript konfiguriert? Habt ihr den Parameter meta_extract_language_from_path auf true oder false/leer gesetzt? Wenn der auf true gesetzt ist, sollte das Skript beim Pushen das erste Sprachkรผrzel als Sprache fรผr das Dokument nehmen. Dokumente, deren Pfad mit de_at/ beginnt, sollten demnach die Sprache Deutsch zugeordnet bekommen. Wenn der Parameter auf false (Standard) gesetzt ist, dann รผbernimmt Exalead die Bestimmung der Sprache anhand des Inhalts des Dokuments. Dann sollte der Pfad aber keine Rolle spielen.
Gruร,
Donato
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Donato,
leider sind bei uns die Sprachkรผrzel und Lรคnderkรผrzel andersrum, also at_de statt de_at. Damit funktioniert die automatische Spracherkennung nicht. รber ein Metadatum lรคsst sich das Problem aber lรถsen, bzw. so habe ich es gelรถst.
Ich finde die Lรถsung bei der Ausgabe den Pfad anzupassen doch sehr unschรถn.
Gibt es mit dem Push-Skript denn nicht generell das Problem, dass der PDF bzw. XML-Kanal eine "hรคssliche" Url bekommt? Also z.B. http://www.site.com/de_1/document.pdf, hier mรถchte man doch eher http://www.site.com/de/document.pdf sehen? Das ist doch eigentlich das gleiche Grundproblem, dass die Url eines Dokumentes anhand der generierten Verzeichnisstruktur festgelegt ist. Etwaige Verรคnderungen dieser Struktur รผber rsynch-Skripte lassen sich wirklich nicht dem Indexer mitteilen?
Gruร,
Christian
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Christian,
sobald die Verzeichnisstrukur nachtrรคglich (z.B. รผber rsynch-Skripte) verรคndert wird, tun sich immer potentielle Probleme auf, wenn bestimmte Features auf die von FirstSpirit erzeugte Verzeichnisstruktur aufbauen. Dies ist wie in eurem Fall bei der Suche der Fall, aber auch die Anbindung eines Analytics-Tools wรผrde damit z.B. problematisch werden. Somit mรผssen leider aktuell diese Verรคnderungen an der Verzeichnisstruktur noch an den verschiedenen Stellen berรผcksichtigt und "abgefangen" werden, so wie Du es bei der Suche รผber ein Metadaum getan hast. Eine andere Mรถglichkeit fรคllt mir in eurem Szenario auch nicht ein, da dem Indexer die Verzeichnisstruktur nicht explizit mitgeteilt werden kann. Allerdings wird es mit FirstSpirit 5 mรถglich sein, die Verzeichnisstruktur bzw. die URLs der Seiten bereits bei ihrer Generierung in das benรถtigte Format zu bringen, so dass nachtrรคgliche รnderungen an der Verzeichnisstruktur damit nicht mehr nรถtig sein sollten.
Viele Grรผรe
Donato
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Donato,
danke fรผr die Antwort. Ich hatte mir das schon gedacht, wollte aber nochmal sicher gehen.
Gruร,
Christian

