atlanx
Anmeldungsdatum: 21. Mai 2007
Beiträge: 291
|
Ich habe heute meinen Javaquellcode von Windows auf Linux umgezogen. Leider zeigt mir Eclipse unter Linux aber statt den Umlauten nur Fragezeichen an. Was muss ich unter Ubuntu einstellen, damit der Text korrekt angezeigt wird? In der Shell und z.b. in Gedit sind üäö ja auch verfügbar.
|
atlanx
(Themenstarter)
Anmeldungsdatum: 21. Mai 2007
Beiträge: 291
|
Hm, seltsam. Hab mir gerade mit gedit sowohl die von Windows kopierten Dateien angesehen als auch die nun im workspace liegenden Dateien, die ich in Eclipse importiert habe. [Eclipse->Package Explorer->Rechte Maustaste->Import...]->General->Existing Projects into workspace] Nur die importierten Dateien im workspace sind so verstümmelt(auch in Gedit). Das heißt dann wohl, dass Eclipse was falsch macht beim Importieren. Wie kann man das vermeiden??? Ist das ein Eclipse-Bug? Wo muss/kann ich diesen Bug am besten melden?
|
Lunar
Anmeldungsdatum: 17. März 2006
Beiträge: 5792
|
Mmmh, Eclipse verwendet wohl das falsche Encoding beim Importieren. Überprüfe mal deine Einstellungen, ob das Encoding mit dem Encoding der Dateien übereinstimmt.
|
atlanx
(Themenstarter)
Anmeldungsdatum: 21. Mai 2007
Beiträge: 291
|
Habs gefunden. Unter Windows ist unter General->Workspace->Text file encoding: Cp1252 und Unter Ubuntu ist unter General->Workspace->Text file encoding: UTF-8 eingestellt. Mal schaun, obs daran gelegen hat......
|
Lunar
Anmeldungsdatum: 17. März 2006
Beiträge: 5792
|
atlanx hat geschrieben: Habs gefunden. Unter Windows ist unter General->Workspace->Text file encoding: Cp1252 und Unter Ubuntu ist unter General->Workspace->Text file encoding: UTF-8 eingestellt. Mal schaun, obs daran gelegen hat......
Ja, garantiert. Die Programme iconv oder recode helfen dir dabei, dass Encoding umzuwandeln. Alternativ können die meisten Texteditoren (iirc auch GEdit) beim Öffnen und Speichern ein angegebenes Encoding verwenden.
|
user_unknown
Anmeldungsdatum: 10. August 2005
Beiträge: 17604
Wohnort: Berlin
|
Ich würde in Zukunft unter Windows auch UTF-8 verwenden, sonst bist Du ständig am konvertieren.
|
muhammad
Anmeldungsdatum: 14. Juni 2007
Beiträge: 187
|
Hi, wie start ich recode und wo finde ich iconv?
|
Lunar
Anmeldungsdatum: 17. März 2006
Beiträge: 5792
|
muhammad hat geschrieben: wie start ich recode und wo finde ich iconv?
iconv ist auf deinem Rechner bereits installiert. Allerdings sind beides Konsolenprogramme. Wenn dir das nicht behagt, dann musst du die Datei mit einem Texteditor konvertieren.
|
kuni
Anmeldungsdatum: 23. Oktober 2006
Beiträge: 71
|
hallo, ich hab das gleiche problem. allerdings bringt ein
recode cp1252..UTF-8 < orignal.txt > konvertiert.txt recht wenig, da aus einem � ein � wird !?!?
hab auch schon latin1 und ISO-xxxx-2(5) versucht, mit dem gleichen ergebnis ☹
|
lilith2k3
Anmeldungsdatum: 14. Dezember 2006
Beiträge: 2999
Wohnort: OS
|
wie ist denn die windowsplatte in die /etc/fstab eingebunden? "defaults, locale=de_DE" ← damit hab ich keine probleme bisher.
|
Marc_BlackJack_Rintsch
Ehemalige
Anmeldungsdatum: 16. Juni 2006
Beiträge: 4673
Wohnort: Berlin
|
@kuni: Uns die Zeichen zu zeigen, die Du irgendwo angezeigt bekommst, nützt wenig bis gar nichts. Du musst herausfinden welche Bytewerte im Original vorliegen und welche Kodierung benutzt wurde. Wenn ich mal raten müsste gibt es den Bytewert, der im Original ein "Kästchen" ist nicht in cp1252 und Du hast den konvertierten Text nicht als UTF-8 interpretieren/anzeigen lassen, sondern als Latin-1 oder so ähnlich. Dann ist die Zeichenfolge � nämlich ein � (Codepoint: U+FFFD, Name: REPLACEMENT CHARACTER).
|
kuni
Anmeldungsdatum: 23. Oktober 2006
Beiträge: 71
|
@Marc ich weiß, ich wollte auch nur darauf hindeuten, dass ich aus wenig mehr salat viel salat machen kann 😉 Hab ich eine Chance sicher! festzustellen, welcher Zeichensatz dem zugrunde liegt?
|
phst
Anmeldungsdatum: 24. Juni 2007
Beiträge: 527
|
Marc 'BlackJack' Rintsch hat geschrieben: Wenn ich mal raten müsste gibt es den Bytewert, der im Original ein "Kästchen" ist nicht in cp1252 und Du hast den konvertierten Text nicht als UTF-8 interpretieren/anzeigen lassen, sondern als Latin-1 oder so ähnlich. Dann ist die Zeichenfolge � nämlich ein � (Codepoint: U+FFFD, Name: REPLACEMENT CHARACTER).
Es ist auch möglich, dass die Originaldatei bereits in einem Texteditor geöffnet wurde. Einige Texteditoren (z.B. Kile) ersetzen dann einfach die Codepunkte, die kein gültiges UTF-8 ergeben, durch U+FFFD. @kuni: Öffne mal die Originaldateien (die du noch nicht mit Eclipse oder einem anderen Programm geöffnet haben solltest) in GEdit. Wenn du dort mit der Maus über einen Reiter fährst, bekommst du die Kodierung angezeigt. Oder öffne die Originaldateien in einem Hexadezimaleditor und schaue, welche Bytewerte die Umlautzeichen haben.
|
audax
Anmeldungsdatum: 15. September 2006
Beiträge: 1253
|
kuni hat geschrieben: @Marc ich weiß, ich wollte auch nur darauf hindeuten, dass ich aus wenig mehr salat viel salat machen kann 😉 Hab ich eine Chance sicher! festzustellen, welcher Zeichensatz dem zugrunde liegt?
Auf die Ursprungsdateien ein
file -i $DATEI sollte Klarheit verschaffen.
|