Search the FirstSpirit Knowledge Base
Hallo,
ich habe die Suche mit FS Basic Search am laufen, aber leider werden externe Inhalte mit indexiert obwohl ich expliziet ein noindex gesetzt habe..
Ich habe einen Test gemacht mit einer Absatzvorlage für externe Links :
$CMS_TRIM(level:2)$
$CMS_IF(!st_url.isEmpty())$
<!-- noindex -->
<div class="linkContainer">
<a href="$CMS_VALUE(st_url)$" target="_blank" class="buttonlink">$CMS_VALUE(_linktext)$</a>
</div>
<!-- index -->
$CMS_END_IF$
$CMS_END_TRIM$
Leider indexiert die Spider Engine von FS Basic Search trotzdem z.b www.google.de wenn dieser Link eingetragen wird.
Verwendet wird FS 5.1.106 sowie FS Basic Search 5.1.106
Hat jemand eine Idee?
Beste Grüße,
Rainer
Hallo Rainer,
der <!-- noindex --> Tag verhindert nicht, dass Links, die sich darin befinden, verfolgt werden, sondern nur, was als zu indizierender Inhalt im Index landet.
Um zu verhindern, dass bestimmte Links verfolgt werden, nutzt man die folgenden Attribute innerhalb des SpiderEngine-Tags der Search-Konfiguration. Z.B. so:
<attribute name="allowed" type="list">
<attribute class="de.espirit.firstspirit.opt.search.engine.spider.link.RegexWebLinkFilter">/www/content/</attribute>
</attribute>
<attribute name="forbidden" type="list">
<attribute class="de.espirit.firstspirit.opt.search.engine.spider.link.RegexWebLinkFilter">google.de</attribute>
</attribute>
Sonst hat man schwupps das ganze Internet im Index.
Viele Grüße,
Raphael.
Hallo Rainer,
der <!-- noindex --> Tag verhindert nicht, dass Links, die sich darin befinden, verfolgt werden, sondern nur, was als zu indizierender Inhalt im Index landet.
Um zu verhindern, dass bestimmte Links verfolgt werden, nutzt man die folgenden Attribute innerhalb des SpiderEngine-Tags der Search-Konfiguration. Z.B. so:
<attribute name="allowed" type="list">
<attribute class="de.espirit.firstspirit.opt.search.engine.spider.link.RegexWebLinkFilter">/www/content/</attribute>
</attribute>
<attribute name="forbidden" type="list">
<attribute class="de.espirit.firstspirit.opt.search.engine.spider.link.RegexWebLinkFilter">google.de</attribute>
</attribute>
Sonst hat man schwupps das ganze Internet im Index.
Viele Grüße,
Raphael.