- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Encoding der von FS erzeugten Dateinamen?
Hallo zusammen,
ich habe eine Frage, denn wir haben in einem Projekt Probleme mit Umlauten in Dateinamen. Dabei verwenden wir die Einstellung "Advanced URLs" in der Generierung (kein URL-Creator Modul). Das sieht eigentlich auch alles erstmal gut aus, Umlaute kommen dabei lesbar heraus, z.B. "รber-uns.html". Bloร bei der Verarbeitung in hybris werden die dann irgendwann als "๏ฟฝ๏ฟฝber-uns.html" eingelesen und damit unbrauchbar.
Eigentlich ziemlich genau der Fehler, der in diesem Artikel beschrieben wird: Java and File Names With Invalid UTF-8 โ The Mindful Programmer
Aber ich denke eigentlich, dass FirstSpirit schon UTF-8 generiert. Das ist einerseits im Sprachkanal so eingestellt und ich habe in der fs-wrapper.conf diesen Eintrag gefunden:
wrapper.java.additional.4 -Dfile.encoding=UTF-8
Nur um sicher zu gehen. Interpretiere ich das richtig oder gibt es noch irgendwelche anderen Einstellungen, mit denen man das Encoding der erzeugten Dateinamen beeinflussen kann?
Viele Grรผรe
Matthias
- Labels:
-
Developers
-
Knowledgebase
-
Project Usage
Accepted Solutions
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Matthias,
ich glaube, dass das ein Betriebssystem Problem ist.
FirstSpirit muss [wenn entsprechende Dateien erzeugt werden sollen] mit einem locale gestartet werden, welches UTF-8 konform ist, z.B. LANG=en_US.UTF-8
Kannst Du bitte prรผfen, ob dies gegeben ist [also der User, der die Dateien an der defekten Stelle erzeugt, ein entsprechendes Locale zur Verfรผgung hat]?
Hinweis: Die betroffene Stelle ist die, an der es das erste Mal "kaputt" geht.
Reihenfolge, in der die Dateinamen zu prรผfen sind, wรคre somit:
fs5staging --> Verzeichnis, in das die Daten verรถffentlicht werden --> Verzeichnis, aus dem die Daten verwendet werden.
HInweis: Auch fรผr die Nutzung/Prรผfung muss die entsprechende User-Session รผber ein passendes Locale verfรผgen.
Viele Grรผรe aus Dortmund,
Holger
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Ergรคnzung:
inzwischen haben wir herausgefunden, dass die Datei-Inhalte UTF-8 kodiert sind, die Dateinamen aber nicht, die sind ISO-8859-1.
Kann man das auch noch irgendwo einstellen?
Gibt's da vielleicht ein -Dfilename.encoding=UTF-8 oder sowas?
Grรผรe
Matthias
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo zusammen,
da bislang nichts weiter kam, hier nochmal ein Update von mir. Inzwischen haben wir rausgefunden, dass die Dateinamen noch nicht einmal einheitlich mit ISO-8859-1 kodiert wurden, sondern wild durcheinander, da ist auch "ISO-8859-2" dabei, "ascii" und "windows-1252" - nur kein utf-8. Der Verdacht liegt nahe, dass das willkรผrlich vom Betriebsystem (Windows) festgelegt wird.
Gibt es wirklich keine Mรถglichkeit, das zu beeinflussen?
Danke fรผr nรผtzliche Tipps.
Grรผรe
Matthisa
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Matthias,
In dem Artikel wird einen Umgebungsvariable gesetzt, die es leider nur unter unixartigen Betriebssystemen gibt. Ich hab mal etwas gegoogelt und bin auf sun.jnu.encoding gestoรen. Inspired by Actual Events: Java May Use UTF-8 as Its Default Charset und http://mail.openjdk.java.net/pipermail/jdk8-dev/2012-November/001618.html
Erweitere mal deine wrapper config um: -Dsun.jnu.encoding=utf8
Ich sehe das selbst zum ersten mal! Wenn es klappt, wรผrde ich mich รผber eine positive Rรผckmeldung freuen.
Gruร Thorsten
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Matthias,
konnte dir das schon irgendwie weiterhelfen?
Gruร
Thorsten
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Matthias,
ich glaube, dass das ein Betriebssystem Problem ist.
FirstSpirit muss [wenn entsprechende Dateien erzeugt werden sollen] mit einem locale gestartet werden, welches UTF-8 konform ist, z.B. LANG=en_US.UTF-8
Kannst Du bitte prรผfen, ob dies gegeben ist [also der User, der die Dateien an der defekten Stelle erzeugt, ein entsprechendes Locale zur Verfรผgung hat]?
Hinweis: Die betroffene Stelle ist die, an der es das erste Mal "kaputt" geht.
Reihenfolge, in der die Dateinamen zu prรผfen sind, wรคre somit:
fs5staging --> Verzeichnis, in das die Daten verรถffentlicht werden --> Verzeichnis, aus dem die Daten verwendet werden.
HInweis: Auch fรผr die Nutzung/Prรผfung muss die entsprechende User-Session รผber ein passendes Locale verfรผgen.
Viele Grรผรe aus Dortmund,
Holger
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Matthias,
ist deine Frage noch offen oder konnte Holger dir weiterhelfen?
In diesem Fall wรคre es toll, wenn du seine "richtige Antwort" entsprechend markierst.
Viele Grรผรe
Michaela
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo zusammen,
ich hatte leider bislang noch nicht die Mรถglichkeit, die Vorschlรคge auszuprobieren. Wir haben das einfachste gemacht, nรคmlich auf Default-URLs umgestellt und somit werden keine Sonderzeichen mehr generiert. Aber ich werde das gegen Ende des Jahres sicher nochmal ausprobieren, wenn wieder etwas mehr Luft ist.
Vielen Dank fรผr die Hilfe!
Grรผรe
Matthias
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Hallo Forbi,
gib uns dann einfach Bescheid. Und viele Grรผรe an die alten Hasen
Viele Grรผรe
Elmar
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Permalink
- Report Inappropriate Content
Frohes neues Jahr Matthias,
ist das Thema hier noch offen? Konntest du das evtl. in einer freien Minute wรคhrend der Feiertage anschauen?
Viele Grรผรe
Martin

