nilsweber
I'm new here

Finales HTML aus DOM-Editor extrahieren (FS 4.2R4)

Hallo,

wir sind gerade dabei unseren Datenbestand in einer 4.2R4er Installation zu exportieren, um diese in aufbereiteter Form über die API in unser neues FS 5.0 zu importieren. Hierbei werden auch die HTML-Inhalte diverser DOM-Editoren extrahiert. Interessanter- und unpraktischerweise scheint es sich hierbei aber um den Vorgenerierungsstand zu handeln, denn wenn auf dem DomElement die toText(true) Methode ausführe, bekomme ich z.B. Pseudo-HTML-Code wie <css_b>Hallo</css_b>, welches zum Generierungs dann z.B. zu einem <span class="css_b">Hallo</span> umgemodelt wird (weil das einer Formatierungsvorlage basiert). Ebenso sind die Links auch noch nicht in ihrer finalen Form, sondern werden in einer Form

<a href=\"#\" linkid=\"cc0a714e-c887-43a3-9e14-45f78f67a437\">Bastelanleitung</a>

dargestellt. Meine Frage wäre nun: wie bekomme ich den finalen HTML-Code aus dem DOM-Editor? oder wenigstens das href-Sprungziel aus den Links???

Danke!

0 Kudos
3 Replies
tklein
I'm new here

Hallo,

wenn ich das richtig verstehe, lest ihr die inhalte aus dem 4.2 über die api aus und schreibt sie über die Api direkt nach 5?

Dann solltet ihr über das DomElement iterieren.Da bekommt ihr dann ja Dinge wie Link usw. als kinder zurück.

Solltet ihr über ein Zwischenformat arbeiten ist es das einfachste das zu generieren...

Viele Grüße

nein, wir arbeiten über ein Zwischenformat (Solr Index) und das komische ist, dass das obige HTML nun eben bei der Generierung eines Ausgabekanals so herausgegegen wird (aber eben über den programmatischen Zugriff per API und nicht als reine $CMS_VALUE-Ausgabe)

0 Kudos

Hallo Nils,

besteht an dieser Stelle noch der Bedarf nach weiteren Antworten oder hast du zwischenzeitlich eine eigene Lösung gefunden? In diesem Fall wäre es super, wenn du diese hier bereitstellst.

Viele Grüße

Michaela

0 Kudos