ubuntuusers.de

Eclipse Umlaute(äüö) werden als � dargestellt

Status: Ungelöst | Ubuntu-Version: Ubuntu 7.04 (Feisty Fawn)
Antworten |

atlanx

Avatar von atlanx

Anmeldungsdatum:
21. Mai 2007

Beiträge: 291

Ich habe heute meinen Javaquellcode von Windows auf Linux umgezogen.

Leider zeigt mir Eclipse unter Linux aber statt den Umlauten nur Fragezeichen an.

Was muss ich unter Ubuntu einstellen, damit der Text korrekt angezeigt wird?

In der Shell und z.b. in Gedit sind üäö ja auch verfügbar.

atlanx

(Themenstarter)
Avatar von atlanx

Anmeldungsdatum:
21. Mai 2007

Beiträge: 291

Hm, seltsam. Hab mir gerade mit gedit sowohl die von Windows kopierten Dateien angesehen als auch die nun im workspace liegenden Dateien, die
ich in Eclipse importiert habe. [Eclipse->Package Explorer->Rechte Maustaste->Import...]->General->Existing Projects into workspace]

Nur die importierten Dateien im workspace sind so verstümmelt(auch in Gedit).

Das heißt dann wohl, dass Eclipse was falsch macht beim Importieren.

Wie kann man das vermeiden??? Ist das ein Eclipse-Bug? Wo muss/kann ich diesen Bug am besten melden?

Lunar

Anmeldungsdatum:
17. März 2006

Beiträge: 5792

Mmmh, Eclipse verwendet wohl das falsche Encoding beim Importieren. Überprüfe mal deine Einstellungen, ob das Encoding mit dem Encoding der Dateien übereinstimmt.

atlanx

(Themenstarter)
Avatar von atlanx

Anmeldungsdatum:
21. Mai 2007

Beiträge: 291

Habs gefunden.

Unter Windows ist unter General->Workspace->Text file encoding: Cp1252

und

Unter Ubuntu ist unter General->Workspace->Text file encoding: UTF-8

eingestellt.

Mal schaun, obs daran gelegen hat......

Lunar

Anmeldungsdatum:
17. März 2006

Beiträge: 5792

atlanx hat geschrieben:

Habs gefunden.

Unter Windows ist unter General->Workspace->Text file encoding: Cp1252

und

Unter Ubuntu ist unter General->Workspace->Text file encoding: UTF-8

eingestellt.

Mal schaun, obs daran gelegen hat......

Ja, garantiert. Die Programme iconv oder recode helfen dir dabei, dass Encoding umzuwandeln. Alternativ können die meisten Texteditoren (iirc auch GEdit) beim Öffnen und Speichern ein angegebenes Encoding verwenden.

user_unknown

Avatar von user_unknown

Anmeldungsdatum:
10. August 2005

Beiträge: 17604

Wohnort: Berlin

Ich würde in Zukunft unter Windows auch UTF-8 verwenden, sonst bist Du ständig am konvertieren.

muhammad

Anmeldungsdatum:
14. Juni 2007

Beiträge: 187

Hi,

wie start ich recode und wo finde ich iconv?

Lunar

Anmeldungsdatum:
17. März 2006

Beiträge: 5792

muhammad hat geschrieben:

wie start ich recode und wo finde ich iconv?

iconv ist auf deinem Rechner bereits installiert. Allerdings sind beides Konsolenprogramme. Wenn dir das nicht behagt, dann musst du die Datei mit einem Texteditor konvertieren.

kuni

Anmeldungsdatum:
23. Oktober 2006

Beiträge: 71

hallo, ich hab das gleiche problem. allerdings bringt ein

 recode cp1252..UTF-8 < orignal.txt > konvertiert.txt


recht wenig, da aus einem � ein � wird !?!?

hab auch schon latin1 und ISO-xxxx-2(5) versucht, mit dem gleichen ergebnis ☹

lilith2k3

Avatar von lilith2k3

Anmeldungsdatum:
14. Dezember 2006

Beiträge: 2999

Wohnort: OS

wie ist denn die windowsplatte in die /etc/fstab eingebunden?
"defaults, locale=de_DE" ← damit hab ich keine probleme bisher.

Marc_BlackJack_Rintsch Team-Icon

Ehemalige
Avatar von Marc_BlackJack_Rintsch

Anmeldungsdatum:
16. Juni 2006

Beiträge: 4673

Wohnort: Berlin

@kuni: Uns die Zeichen zu zeigen, die Du irgendwo angezeigt bekommst, nützt wenig bis gar nichts. Du musst herausfinden welche Bytewerte im Original vorliegen und welche Kodierung benutzt wurde. Wenn ich mal raten müsste gibt es den Bytewert, der im Original ein "Kästchen" ist nicht in cp1252 und Du hast den konvertierten Text nicht als UTF-8 interpretieren/anzeigen lassen, sondern als Latin-1 oder so ähnlich. Dann ist die Zeichenfolge � nämlich ein � (Codepoint: U+FFFD, Name: REPLACEMENT CHARACTER).

kuni

Anmeldungsdatum:
23. Oktober 2006

Beiträge: 71

@Marc
ich weiß, ich wollte auch nur darauf hindeuten, dass ich aus wenig mehr salat viel salat machen kann 😉 Hab ich eine Chance sicher! festzustellen, welcher Zeichensatz dem zugrunde liegt?

phst

Anmeldungsdatum:
24. Juni 2007

Beiträge: 527

Marc 'BlackJack' Rintsch hat geschrieben:

Wenn ich mal raten müsste gibt es den Bytewert, der im Original ein "Kästchen" ist nicht in cp1252 und Du hast den konvertierten Text nicht als UTF-8 interpretieren/anzeigen lassen, sondern als Latin-1 oder so ähnlich. Dann ist die Zeichenfolge � nämlich ein � (Codepoint: U+FFFD, Name: REPLACEMENT CHARACTER).

Es ist auch möglich, dass die Originaldatei bereits in einem Texteditor geöffnet wurde. Einige Texteditoren (z.B. Kile) ersetzen dann einfach die Codepunkte, die kein gültiges UTF-8 ergeben, durch U+FFFD.
@kuni: Öffne mal die Originaldateien (die du noch nicht mit Eclipse oder einem anderen Programm geöffnet haben solltest) in GEdit. Wenn du dort mit der Maus über einen Reiter fährst, bekommst du die Kodierung angezeigt. Oder öffne die Originaldateien in einem Hexadezimaleditor und schaue, welche Bytewerte die Umlautzeichen haben.

audax

Avatar von audax

Anmeldungsdatum:
15. September 2006

Beiträge: 1253

kuni hat geschrieben:

@Marc
ich weiß, ich wollte auch nur darauf hindeuten, dass ich aus wenig mehr salat viel salat machen kann 😉 Hab ich eine Chance sicher! festzustellen, welcher Zeichensatz dem zugrunde liegt?

Auf die Ursprungsdateien ein

file -i $DATEI


sollte Klarheit verschaffen.

Antworten |