jst
New Responder

Exalead // NOINDEX Tags

Hallo zusammen,

wir benutzen in einem Auftritt die Exalead-Suche und möchten gerne Bereich in der Seite definieren, welche nicht in den Index aufgenommen werden. So möchten wir einschränken, dass bestimmte Begriffe oder Phrasen in der zusammen Fassung angezeigt werden.

Gibt es dazu einen Standard HTML-Kommentar der verwendet werden kann wie z.B.

<div>Begriffe die in der Zusammenfassung auftauchen dürfen</div>

<!-- NOINDEX -->

<div>Soll nicht erscheinen!</div>

<!-- INDEX -->

<div>Begriffe die in der Zusammenfassung auftauchen dürfen</div>

Vielen Dank für die Hilfe und Grüße aus Bielefeld,

Jörn

Labels (1)
Tags (3)
0 Kudos
4 Replies
Andreas-Knoor
Crownpeak Employee
Crownpeak Employee

Re: Exalead // NOINDEX Tags

Ja, das geht mit der Enterprise Search.

Beschrieben ist das im Handbuch (Kapitel 5.2.3: Konfiguration)

http://www.e-spirit.com/odfs50/media/dokumentation/dokumentation_module/dokumentation_entwickler_1/E...

Einfach mal nach "NOINDEX" suchen.

jst
New Responder

Re: Exalead // NOINDEX Tags

Hallo,

ich hatte leider vergessen zu erwähnen, dass hier nicht die Push-API genutzt wird. Die Seite wird von der Exalead selbst gecrawled, da auch Bereich enthalten sind, die nicht aus einem FirstSpirit kommen. Muss bei der Crawler-Konfiguration dies bzgl. etwas beachtet werden?

Viele Grüße,

Jörn

0 Kudos
rrichter
Crownpeak employee
Crownpeak employee

Re: Exalead // NOINDEX Tags

Hallo,

Tobias und ich haben ein wenig recherchiert.

Beim Crawler geht das anders. Hier ist es m.W. auch nicht möglich einen HTML-Kommentar wie bei der Push-API zu nutzen, sondern es geht hier über das Ausschließen von CSS-Klassen und IDs.

Hierzu konfiguriert man den Analyzer (Process > Analysis) und fügt ihm einen html_relevant_content_extractor hinzu, den man beispielhaft wie folgt konfigurieren kann:

analysis_html_relevant_content_extractor.jpg

Dieses Beispiel ignoriert beim Indizieren den Content, der in HTML-Containern mit den Klassennamen oder IDs "menuRight", "header", "footer-container", "sidebar grid_3", "newsTeaser" und "newsTeaserText". Bei einer sinnvollen Kombination von "Ids and Classes to keep" und "Ids and Classes to ignore" sollte man das Gewünschte erreichen. Wichtig ist, dass das Feld "Irrelevant Chunks Annotation" gefüllt ist (wir haben hier einfach einmal NOINDEX eingetragen).

Und, nein, so richtig dokumentiert haben wir das nicht gefunden, sondern wir sind zufällig darauf gestoßen und haben so lange probiert, bis es ging.

Für eine Bestätigung, dass es nicht nur bei uns so funktioniert, wären wir sehr dankbar.

Viele Grüße,

Raphael.

1+1=3 for large values of 1.
jst
New Responder

Re: Exalead // NOINDEX Tags

Hey Raphael!

Super. Vielen Dank. Wir werden das mal prüfen. 🙂

Viele Grüße,

Jörn

0 Kudos