Questions & Answers

JoSt
I'm new here

Basic Search - Lucene Suche auf mehreren Feldern

Hallo zusammen,

aktuell haben wir eine Suche in Betrieb, die auf dem Lucene-Index ausschlieรŸlich das Feld "content" beachtet (Default).  Derzeit werden zum Beispiel HTML-Keywords nicht berรผcksichtigt, da diese in das Feld "keywords" geschrieben werden. Eine Suche kann so entweder auf content oder keywords ausgefรผhrt werde, jedoch nicht in Kombination.

Ist es mรถglich auch auf mehreren Feldern gleichzeitig zu suchen und ein entsprechendes Suchergebnis zu erhalten?

Viele GrรผรŸe

Johannes Steck

0 Kudos
8 Replies
dheim
I'm new here

Ich glaube das ist mit der Basic Search nicht mรถglich. Wir haben das in einem aktuellen Projekt zweistufig umgesetzt. Zuerst wird nach dem content-Feld gesucht, gibt es hier keine Treffer werden die Keywords durchsucht, aber ein konsilidiertes Ergebnis ist wohl out-of-the-box nicht mรถglich.

0 Kudos

Hallo Herr Steck,

konnte Ihnen die Antwort von Herrn Heim weiterhelfen oder benรถtigen Sie noch weitere Antworten?

Viele GrรผรŸe

Michaela

0 Kudos

Wir haben nun zunรคchst versucht mit Hilfe des MultiEngineProxy zwei mal auf dem gleichen Index, aber auf verschiedenen Feldern zu suchen und das zusammengefรผhrte Ergebnis zu verwenden. Damit kann man die Suchanfrage mit einem Aufruf durchfรผhren.

Prinzipiell funktioniert das gut, jedoch kรถnnen Dubletten (verschiedene Ergebnisse mit gleicher URL) entstehen, wenn die gleiche Seite Treffer im Content und in den Keywords hat. Bei Ergebnissen, die auf mehrere Ergebnisseiten verteilt werden ist das Filtern der Dubletten leider nicht so trivial.

Gibt es eine Mรถglichkeit schon bei der automatischen Zusammenfรผhrung ein Entfernen der Dubletten zu erreichen? Oder hat jemand eine Idee, wie die Dubletten per JSP performant entfernt werden kรถnnen (in Anbetracht mehrerer Ergebnisseiten)?

0 Kudos

Hallo Johannes,

wรคre in deinem Fall nicht auch eine zweistufige Lรถsung mรถglich wie sie Dominik angerissen hat?

Das nachtrรคglich filtern von Dupletten ist meiner Meinung nicht praktikable, es muss zu viel beachtet werden. Gerade bei Ergebnissen, die รผber mehrere Seite wird es komplex.

Viele GrรผรŸe

Thorsten

0 Kudos

Hallo Thorsten,

leider ist das in unserem Fall nicht zielfรผhrend, da es aufgrund der groรŸen Anzahl der Seiten und Dokumente im Suchraum praktisch immer einen Treffer im Content gibt, sodass die Keywords dann nur in sehr seltenen Ausnahmefรคllen durchsucht wรผrden (in denen dann hรถchstwahrscheinlich auch kein Treffer vorliegt).

0 Kudos
marro
Crownpeak employee

Hallo Johannes,

mir ist Dein Einwand hier nicht ganz klar. Sobald Du einen Treffer im Content hast, mรผssen die Keywords ja gar nicht mehr durchsucht werden, weil die Seite bzw. das Dokument doch dann richtigerweise bereits in der Ergebnisliste landet. Oder sehe ich das falsch?

Viele GrรผรŸe

Donato

0 Kudos

Hallo Donato,

Ein Treffer kann ja auf vielen Seiten vorliegen, nicht nur auf der eigentlich gesuchten (auf der das entsprechende Keyword vergeben wรคre). Wenn nun ein Treffer im Content auf einer Seite vorliegt, und die Seite, die das gesuchte Wort nur in den Keywords hat, nicht dabei ist, wird dieses Seite natรผrlich auch nicht in den Ergebnissen aufgefรผhrt.

GruรŸ

Johannes

0 Kudos
marro
Crownpeak employee

Hallo Johannes,

ich denke, ihr braucht so etwas wie das hier: http://stackoverflow.com/questions/8844497/how-to-use-multifieldqueryparser-from-lucene

Da ich aber kein Experte auf dem Gebiet bin, kann ich Dir leider nicht sagen, wie man dies in Verbindung mit der Basic Search verwenden kann..

Viele GrรผรŸe

Donato

0 Kudos

Type a product name