- Registriert
- 7 Aug. 2008
- Beiträge
- 1.994
Hallo zusammen,
seit vielen Jahren verarbeite ich relativ regelmäßig von einem großen Dienstleister bereitgestellte CSV-Dateien. Da Excel beim Öffnen von CSV-Dateien direkt per Doppelklick im Windows Explorer den Import-Dialog einfach entfallen lässt und dadurch unerwünschte Nebenwirkungen auftreten (z.B. entfallende, führende Nullen bei Postleitzahlen oder Telefonnummern mit 0 am Anfang oder mit "E+..." gekürzte lange Zahlen), habe ich die CSV-Dateien bisher immer erst per Rechtsklick (Kontextmenü: "Öffnen mit..." bzw. "Im Editor bearbeiten") im Windows Editor geöffnet und von dort aus dann deren Inhalt per Copy&Paste zu Excel kopiert, um die Daten dort dann weiter zu verarbeiten.
Nun macht der Windows Editor plötzlich Probleme und erkennt die Codierung der CSV-Dateien, die stets ANSI ist, nicht immer, aber teilweise fälschlich als UTF-8, was dazu führt, dass sämtliche Umlaute dann fehlen oder falsch dargestellt werden. Das geschieht bei identischer Datei reproduzierbar und nicht zufällig. Auch ältere Dateien, die zuvor im im Editor korrekt als ANSI geöffnet wurden, werden nun plötzlich teilweise reproduzierbar fälschlich als UTF-8 geöffnet, was stark darauf hindeutet, dass sich diesbezüglich im Editor etwas geändert hat und dieser nun mit irgendeiner Logik automatisch anhand des Dateiinhalts die Codierung zu erkennen versucht bzw. dies vorher auch schon so machte, diese Logik aber nun plötzlich vermehrt ANSI fälschlich als UTF-8 missinterpretiert.
Zeitlich eingrenzen lässt sich dieser Bug insoweit, dass es bis zum 18.11.25 noch stets korrekt funktionierte. Danach fielen die Arbeiten bis zum 02.12.25 nicht an, ab diesem Datum tritt das Problem dann aber auf.
Mir fielen die im verarbeiteten Ergebnis fehlenden Umlaute am 02.12. nicht gleich auf, sondern erst heute, so dass die zwischenzeitlich bereits verarbeiteten Daten hinsichtlich der Umlaute mühsam nachträglich von Hand korrigiert werden mussten.
Ein möglicher Workaround ist, statt des Windows Editor z.B. Notepad++ zu verwenden, das die Dateien weiterhin korrekt als ANSI öffnet. Oder man öffnet die Datei in Excel nicht per Doppelklick im Windows Explorer, sondern über Datei/Öffnen in Excel, so dass dort der Import-Dialog erscheint, auch wenn das einige Klicks mehr bedeutet, wenn man die Datei zuvor eh schon im Explorer vor sich hat. Im Windows Editor gibt es dagegen scheinbar keine Einstellung, um das Verhalten zu beeinflussen.
Höchstwahrscheinlich betrifft das Verhalten nicht nur CSV-Dateien, sondern alle Dateiformate, die sich im Windows Editor öffnen lassen.
seit vielen Jahren verarbeite ich relativ regelmäßig von einem großen Dienstleister bereitgestellte CSV-Dateien. Da Excel beim Öffnen von CSV-Dateien direkt per Doppelklick im Windows Explorer den Import-Dialog einfach entfallen lässt und dadurch unerwünschte Nebenwirkungen auftreten (z.B. entfallende, führende Nullen bei Postleitzahlen oder Telefonnummern mit 0 am Anfang oder mit "E+..." gekürzte lange Zahlen), habe ich die CSV-Dateien bisher immer erst per Rechtsklick (Kontextmenü: "Öffnen mit..." bzw. "Im Editor bearbeiten") im Windows Editor geöffnet und von dort aus dann deren Inhalt per Copy&Paste zu Excel kopiert, um die Daten dort dann weiter zu verarbeiten.
Nun macht der Windows Editor plötzlich Probleme und erkennt die Codierung der CSV-Dateien, die stets ANSI ist, nicht immer, aber teilweise fälschlich als UTF-8, was dazu führt, dass sämtliche Umlaute dann fehlen oder falsch dargestellt werden. Das geschieht bei identischer Datei reproduzierbar und nicht zufällig. Auch ältere Dateien, die zuvor im im Editor korrekt als ANSI geöffnet wurden, werden nun plötzlich teilweise reproduzierbar fälschlich als UTF-8 geöffnet, was stark darauf hindeutet, dass sich diesbezüglich im Editor etwas geändert hat und dieser nun mit irgendeiner Logik automatisch anhand des Dateiinhalts die Codierung zu erkennen versucht bzw. dies vorher auch schon so machte, diese Logik aber nun plötzlich vermehrt ANSI fälschlich als UTF-8 missinterpretiert.
Zeitlich eingrenzen lässt sich dieser Bug insoweit, dass es bis zum 18.11.25 noch stets korrekt funktionierte. Danach fielen die Arbeiten bis zum 02.12.25 nicht an, ab diesem Datum tritt das Problem dann aber auf.
Mir fielen die im verarbeiteten Ergebnis fehlenden Umlaute am 02.12. nicht gleich auf, sondern erst heute, so dass die zwischenzeitlich bereits verarbeiteten Daten hinsichtlich der Umlaute mühsam nachträglich von Hand korrigiert werden mussten.
Ein möglicher Workaround ist, statt des Windows Editor z.B. Notepad++ zu verwenden, das die Dateien weiterhin korrekt als ANSI öffnet. Oder man öffnet die Datei in Excel nicht per Doppelklick im Windows Explorer, sondern über Datei/Öffnen in Excel, so dass dort der Import-Dialog erscheint, auch wenn das einige Klicks mehr bedeutet, wenn man die Datei zuvor eh schon im Explorer vor sich hat. Im Windows Editor gibt es dagegen scheinbar keine Einstellung, um das Verhalten zu beeinflussen.
Höchstwahrscheinlich betrifft das Verhalten nicht nur CSV-Dateien, sondern alle Dateiformate, die sich im Windows Editor öffnen lassen.








