<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Kommentare zu: utf-8 vs. cp 1252</title>
	<atom:link href="http://craplog.de/utf-8-vs-cp-1252/feed/" rel="self" type="application/rss+xml" />
	<link>http://craplog.de/utf-8-vs-cp-1252/</link>
	<description>Wir kommen, um uns zu beschweren</description>
	<lastBuildDate>Fri, 05 Mar 2010 01:53:57 +0100</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>Von: John</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7857</link>
		<dc:creator>John</dc:creator>
		<pubDate>Wed, 06 Jan 2010 20:44:49 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7857</guid>
		<description>.. ist ja schon wenig &#228;lter hier, aaaber der Artikel spricht mir aus der Seele, auch ich habe st&#228;ndig zerschossene Dateinamen. Von da her kann ich wirklich nur zustimmen.
Gru&#223;
John</description>
		<content:encoded><![CDATA[<p>.. ist ja schon wenig &#228;lter hier, aaaber der Artikel spricht mir aus der Seele, auch ich habe st&#228;ndig zerschossene Dateinamen. Von da her kann ich wirklich nur zustimmen.<br />
Gru&#223;<br />
John</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: cipha</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7437</link>
		<dc:creator>cipha</dc:creator>
		<pubDate>Tue, 11 Aug 2009 17:38:38 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7437</guid>
		<description>@chris: das mit dem &quot;quasi-standard&quot; stimmt schon und ich bin wahrlich kein freund dessen, wirklich nicht. 

im endeffekt wird es an den unterschiedlichen dateisystemen liegen: von fat32 auf ntfs auf reiserfs auf ext3, usw. irgendwas beisst sich hier jedesmal.

das mit wordpress kann ich mir trotzdem bis heute nicht erkl&#228;ren, es sei denn, es lag an der administration mit window$. aber sowas muss mal anf&#228;ngern passieren und dann gute nacht...

zur religion: logo, ist ja das selbe, nur eben ein &quot;spezielles men&#252;&quot; auf der gleichen speisekarte ;-)</description>
		<content:encoded><![CDATA[<p>@chris: das mit dem &#8220;quasi-standard&#8221; stimmt schon und ich bin wahrlich kein freund dessen, wirklich nicht. </p>
<p>im endeffekt wird es an den unterschiedlichen dateisystemen liegen: von fat32 auf ntfs auf reiserfs auf ext3, usw. irgendwas beisst sich hier jedesmal.</p>
<p>das mit wordpress kann ich mir trotzdem bis heute nicht erkl&#228;ren, es sei denn, es lag an der administration mit window$. aber sowas muss mal anf&#228;ngern passieren und dann gute nacht&#8230;</p>
<p>zur religion: logo, ist ja das selbe, nur eben ein &#8220;spezielles men&#252;&#8221; auf der gleichen speisekarte <img src='http://craplog.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Chris</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7435</link>
		<dc:creator>Chris</dc:creator>
		<pubDate>Mon, 10 Aug 2009 20:48:21 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7435</guid>
		<description>Das scheint mir aber kein Problem vom Unicode-Zeichensatz oder dessen Kodierung UTF-8 zu sein. Ich denke, dass liegt hier an Anwendungsprogrammen oder Dateisystemtreibern, denen egal ist, welcher Zeichensatz eigentlich verwendet werden soll.

Und Windows-1252 ist kein Standard wie Latin-1 oder UTF-8, sondern ein MS-eigener Zeichensatz und deshalb Quasi-Standard, weswegen es bei Wechseln mit einem Linux auf Latin-1 oder -15 eingestellt zu Windows ebenfalls zu Problemen kommen d&#252;rfte. Und Windows XP/Vista d&#252;rften bei NTFS-Laufwerken und VFAT bei Sticks UTF-16 f&#252;r Dateinamen verwenden.

Und wenn f&#252;r einen Programmierer Unicode die Religion ist, dann schlie&#223;t das doch UTF-8 mit ein, oder? ;-)

Ich w&#252;rde also auf den Dateisystemtreiber oder Filemanager beim Stick tippen und bei Wordpress auf Wordpress. ;-)</description>
		<content:encoded><![CDATA[<p>Das scheint mir aber kein Problem vom Unicode-Zeichensatz oder dessen Kodierung UTF-8 zu sein. Ich denke, dass liegt hier an Anwendungsprogrammen oder Dateisystemtreibern, denen egal ist, welcher Zeichensatz eigentlich verwendet werden soll.</p>
<p>Und Windows-1252 ist kein Standard wie Latin-1 oder UTF-8, sondern ein MS-eigener Zeichensatz und deshalb Quasi-Standard, weswegen es bei Wechseln mit einem Linux auf Latin-1 oder -15 eingestellt zu Windows ebenfalls zu Problemen kommen d&#252;rfte. Und Windows XP/Vista d&#252;rften bei NTFS-Laufwerken und VFAT bei Sticks UTF-16 f&#252;r Dateinamen verwenden.</p>
<p>Und wenn f&#252;r einen Programmierer Unicode die Religion ist, dann schlie&#223;t das doch UTF-8 mit ein, oder? <img src='http://craplog.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
<p>Ich w&#252;rde also auf den Dateisystemtreiber oder Filemanager beim Stick tippen und bei Wordpress auf Wordpress. <img src='http://craplog.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: cipha</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7389</link>
		<dc:creator>cipha</dc:creator>
		<pubDate>Sat, 01 Aug 2009 10:19:59 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7389</guid>
		<description>@nik: nein, nein, ist ja keine &quot;hasstirade&quot;, sondern einfach nur die erfahrung, die ich mit meinen dateien gemacht habe, wenn ich laufend mit windows und linux an verschiedenen rechnern arbeite. die zerschiesst es in sch&#246;ner regelm&#228;ssigkeit, sobald umlaute ins spiel kommen und ehrlich gesagt kann ich das im jahr 2009 nicht akzeptieren.

das mit &lt;em&gt;wordpress&lt;/em&gt; war ganz komisch: es gab da mal ein update, bei dem man anscheinend unbedingt bereits in der &lt;em&gt;wp-config&lt;/em&gt; den zeichensatz angeben musste. ich habe zwei blogs. beim ersten habe ich das utf-8 eingef&#252;gt, update eingespielt und in allen meinen beitr&#228;gen hat es mir umlaute, sonderzeichen ($,€) und ein paar andere dinge zerschossen, nachdem ich das datenbank-update gemacht habe. dann habe ich das bei dem anderen blog einfach gelassen, ihm explizit die utf-8-sache in wp-config mitzugeben und dort sind meine umlaute bis heute vorhanden. &#252;berlege dir mal den fall: h&#228;tte ich bei meinem ersten blog &lt;em&gt;nicht&lt;/em&gt; das plugin &lt;em&gt;search &amp; replace&lt;/em&gt; gehabt, h&#228;tte ich niemals herausfinden k&#246;nnen, wo die umlaute zerschossen worden w&#228;ren und mein archiv mit mehreren hundert beitr&#228;gen w&#228;re im eimer gewesen. erst vor kurzem musste ich &quot; &#039; &quot; wiederherstellen, weil ich es &#252;bersehen hatte und es auch verkr&#252;ppelt wurde. das gef&#228;llt mir nicht.

den beitrag habe ich gelesen. der knackpunkt ist: ich soll also manuell alle encodings durchgehen, bis ich eine gefunden habe, die zuf&#228;llig passt!? ganz toll! bei thunderbird kann man das zwar machen, aber hey: wenn ich den zeichensatz umstelle bei einer email, hat er sp&#228;ter schwierigkeiten bei anderen. das kann nicht sinn der sache sein, dass ich mich bei einem programm, das etwas einfacher machen soll, mich manuell jedesmal und mit gehirnschmalz hinsetzen muss, wenn es um bestimmte zeichen des texts in der email geht. die interoperalit&#228;t ist nicht gew&#228;hrleistet, sobald ich thunderbird unter linux nutze und ich eine email in der selben sprache(!) von einem windows-nutzer bekomme. tolle technik, echt der wahnsinn! mach&#039; das mal mit vielen emails am tag!

fakt ist: das mit zeichens&#228;tzen sieht jeder anders. f&#252;r manche programmierer ist unicode die religion, f&#252;r andere utf-8, usw. ich will lediglich, dass ich, wenn es schon die selbe sprache ist, auf &lt;em&gt;jedem system&lt;/em&gt; keine probleme mit irgendwelchen sonderzeichen bekomme. aber selbst das ist zuviel verlangt und zeigt mir nur, wie beschr&#228;nkt das ganze computer-ged&#246;ns eigentlich ist. deshalb brauchen wir uns um &quot;matrix&quot; keine sorgen machen: solange die overlords keine sonderzeichen k&#246;nnen, werden die maschinen diesen krieg niemals gewinnen k&#246;nnen. ;-) ist doch auch was sch&#246;nes.

greetz,
c1</description>
		<content:encoded><![CDATA[<p>@nik: nein, nein, ist ja keine &#8220;hasstirade&#8221;, sondern einfach nur die erfahrung, die ich mit meinen dateien gemacht habe, wenn ich laufend mit windows und linux an verschiedenen rechnern arbeite. die zerschiesst es in sch&#246;ner regelm&#228;ssigkeit, sobald umlaute ins spiel kommen und ehrlich gesagt kann ich das im jahr 2009 nicht akzeptieren.</p>
<p>das mit <em>wordpress</em> war ganz komisch: es gab da mal ein update, bei dem man anscheinend unbedingt bereits in der <em>wp-config</em> den zeichensatz angeben musste. ich habe zwei blogs. beim ersten habe ich das utf-8 eingef&#252;gt, update eingespielt und in allen meinen beitr&#228;gen hat es mir umlaute, sonderzeichen ($,€) und ein paar andere dinge zerschossen, nachdem ich das datenbank-update gemacht habe. dann habe ich das bei dem anderen blog einfach gelassen, ihm explizit die utf-8-sache in wp-config mitzugeben und dort sind meine umlaute bis heute vorhanden. &#252;berlege dir mal den fall: h&#228;tte ich bei meinem ersten blog <em>nicht</em> das plugin <em>search &amp; replace</em> gehabt, h&#228;tte ich niemals herausfinden k&#246;nnen, wo die umlaute zerschossen worden w&#228;ren und mein archiv mit mehreren hundert beitr&#228;gen w&#228;re im eimer gewesen. erst vor kurzem musste ich &#8221; &#8216; &#8221; wiederherstellen, weil ich es &#252;bersehen hatte und es auch verkr&#252;ppelt wurde. das gef&#228;llt mir nicht.</p>
<p>den beitrag habe ich gelesen. der knackpunkt ist: ich soll also manuell alle encodings durchgehen, bis ich eine gefunden habe, die zuf&#228;llig passt!? ganz toll! bei thunderbird kann man das zwar machen, aber hey: wenn ich den zeichensatz umstelle bei einer email, hat er sp&#228;ter schwierigkeiten bei anderen. das kann nicht sinn der sache sein, dass ich mich bei einem programm, das etwas einfacher machen soll, mich manuell jedesmal und mit gehirnschmalz hinsetzen muss, wenn es um bestimmte zeichen des texts in der email geht. die interoperalit&#228;t ist nicht gew&#228;hrleistet, sobald ich thunderbird unter linux nutze und ich eine email in der selben sprache(!) von einem windows-nutzer bekomme. tolle technik, echt der wahnsinn! mach&#8217; das mal mit vielen emails am tag!</p>
<p>fakt ist: das mit zeichens&#228;tzen sieht jeder anders. f&#252;r manche programmierer ist unicode die religion, f&#252;r andere utf-8, usw. ich will lediglich, dass ich, wenn es schon die selbe sprache ist, auf <em>jedem system</em> keine probleme mit irgendwelchen sonderzeichen bekomme. aber selbst das ist zuviel verlangt und zeigt mir nur, wie beschr&#228;nkt das ganze computer-ged&#246;ns eigentlich ist. deshalb brauchen wir uns um &#8220;matrix&#8221; keine sorgen machen: solange die overlords keine sonderzeichen k&#246;nnen, werden die maschinen diesen krieg niemals gewinnen k&#246;nnen. <img src='http://craplog.de/wp-includes/images/smilies/icon_wink.gif' alt=';-)' class='wp-smiley' />  ist doch auch was sch&#246;nes.</p>
<p>greetz,<br />
c1</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: nik</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7387</link>
		<dc:creator>nik</dc:creator>
		<pubDate>Fri, 31 Jul 2009 19:12:29 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7387</guid>
		<description>PS: Die Website hier ist in UTF-8 (Browser -&gt; Quelltext ansehen -&gt; 

meta http-equiv=&quot;Content-Type&quot; content=&quot;text/html; charset=UTF-8&quot;

bestaunen). Von daher frage ich mich, woher die Behauptung stammt, UTF-8 k&#246;nne keine &#220;ml&#228;&#252;te?

Hier mal ein super Artikel, da wird dann auch Dein Ascii-Problem behandelt ;)

http://www.joelonsoftware.com/articles/Unicode.html</description>
		<content:encoded><![CDATA[<p>PS: Die Website hier ist in UTF-8 (Browser -&gt; Quelltext ansehen -&gt; </p>
<p>meta http-equiv=&#8221;Content-Type&#8221; content=&#8221;text/html; charset=UTF-8&#8243;</p>
<p>bestaunen). Von daher frage ich mich, woher die Behauptung stammt, UTF-8 k&#246;nne keine &#220;ml&#228;&#252;te?</p>
<p>Hier mal ein super Artikel, da wird dann auch Dein Ascii-Problem behandelt <img src='http://craplog.de/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
<p><a href="http://www.joelonsoftware.com/articles/Unicode.html" rel="nofollow"></a><a href='http://www.joelonsoftware.com/articles/Unicode.html'></a><a href='http://www.joelonsoftware.com/articles/Unicode.html'>joelonsoftware.com/articles/Unicode.html</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: nik</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7386</link>
		<dc:creator>nik</dc:creator>
		<pubDate>Fri, 31 Jul 2009 19:06:56 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7386</guid>
		<description>Schlecht Nachrichten f&#252;r Deine Hasstirade - UTF-8 macht erst die umfassende Darstellung von landessprachspezifischen Zeichen m&#246;glich und das gleichzeitig auf einem Bildschirm in einer gemeinsamen Codepage. Latin-1 ist davon weit entfernt.
Was Du da oben gepostet hast ist ein Problem, wenn ein &#220;bergang zwischen verschiedenen charsets entsteht. Dann wird umgewandelt, egal ob der andere Zeichensatz &#252;berhaupt passende Zeichen beinhaltet. Von UTF-8 zu &#228;lteren Sets ists noch schlimmer, da UTF-8 multibytes, also aus mehreren Bytes bestehende Zeichen nutzt, um Sonderzeichen zu codieren.

Fazit: 
UTF-8 ist ein Segen, leider ist es noch nicht umfassend verbreitet, so dass System oft durch Konvertierung M&#252;ll proudzieren. In vielen Webtechnologien und -umsetzungen ist UTF-8 auch erst die letzten Jahre angekommen und tw. nicht konsequent umgesetzt. So fehlen vielleicht Browserheader, dann zeigt der Browser nicht nur die Seite als Latin an, sondern behandelt Eingaben (Stichwort CMS) unter Umst&#228;nden auch so. Ergebnis ist ein bunter Mix aus Zeichen der charsets der j&#252;ngsten Computergeschichte.</description>
		<content:encoded><![CDATA[<p>Schlecht Nachrichten f&#252;r Deine Hasstirade &#8211; UTF-8 macht erst die umfassende Darstellung von landessprachspezifischen Zeichen m&#246;glich und das gleichzeitig auf einem Bildschirm in einer gemeinsamen Codepage. Latin-1 ist davon weit entfernt.<br />
Was Du da oben gepostet hast ist ein Problem, wenn ein &#220;bergang zwischen verschiedenen charsets entsteht. Dann wird umgewandelt, egal ob der andere Zeichensatz &#252;berhaupt passende Zeichen beinhaltet. Von UTF-8 zu &#228;lteren Sets ists noch schlimmer, da UTF-8 multibytes, also aus mehreren Bytes bestehende Zeichen nutzt, um Sonderzeichen zu codieren.</p>
<p>Fazit:<br />
UTF-8 ist ein Segen, leider ist es noch nicht umfassend verbreitet, so dass System oft durch Konvertierung M&#252;ll proudzieren. In vielen Webtechnologien und -umsetzungen ist UTF-8 auch erst die letzten Jahre angekommen und tw. nicht konsequent umgesetzt. So fehlen vielleicht Browserheader, dann zeigt der Browser nicht nur die Seite als Latin an, sondern behandelt Eingaben (Stichwort CMS) unter Umst&#228;nden auch so. Ergebnis ist ein bunter Mix aus Zeichen der charsets der j&#252;ngsten Computergeschichte.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: cipha</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7237</link>
		<dc:creator>cipha</dc:creator>
		<pubDate>Sat, 04 Apr 2009 20:42:10 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7237</guid>
		<description>@harry: hattest recht, habe ich inzwischen ausgebessert.

@mike: oha! da kennt mich jemand gut! aber ich habe leider schon seit jahren nicht mehr mit dem absinth geflirtet; ist einfach zu teuer.

trotzdem muss ich dir sagen, dass das tats&#228;chlich berichte aus der praxis sind. ich meine, diese kryptischen zeichen ziehe ich mir ja nicht aus dem finger. 

btw: bei einem kleinen flamewar kann man auch mal auf die pauke hauen; meine meinung.

greetz,
c1</description>
		<content:encoded><![CDATA[<p>@harry: hattest recht, habe ich inzwischen ausgebessert.</p>
<p>@mike: oha! da kennt mich jemand gut! aber ich habe leider schon seit jahren nicht mehr mit dem absinth geflirtet; ist einfach zu teuer.</p>
<p>trotzdem muss ich dir sagen, dass das tats&#228;chlich berichte aus der praxis sind. ich meine, diese kryptischen zeichen ziehe ich mir ja nicht aus dem finger. </p>
<p>btw: bei einem kleinen flamewar kann man auch mal auf die pauke hauen; meine meinung.</p>
<p>greetz,<br />
c1</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: mike</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7236</link>
		<dc:creator>mike</dc:creator>
		<pubDate>Sat, 04 Apr 2009 13:05:19 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7236</guid>
		<description>Du solltest die Finger vom Absinth lassen. 
Wenn ich mir Deinen Beitrag hier so anschaue, welcher wirklich vorn und hinten keinen irgendwelchen der Realit&#228;t nahekommenden Sinn ergibt, dann isses mitm abben Ohr nicht mehr allzu weit. 
Ich hab Dich gewarnt!!11eins

Hier noch ein paar utf-8-&#220;ml&#228;&#252;tё gratis f&#252;r Deine Sammlung :)</description>
		<content:encoded><![CDATA[<p>Du solltest die Finger vom Absinth lassen.<br />
Wenn ich mir Deinen Beitrag hier so anschaue, welcher wirklich vorn und hinten keinen irgendwelchen der Realit&#228;t nahekommenden Sinn ergibt, dann isses mitm abben Ohr nicht mehr allzu weit.<br />
Ich hab Dich gewarnt!!11eins</p>
<p>Hier noch ein paar utf-8-&#220;ml&#228;&#252;tё gratis f&#252;r Deine Sammlung <img src='http://craplog.de/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Harry Kuntz</title>
		<link>http://craplog.de/utf-8-vs-cp-1252/#comment-7231</link>
		<dc:creator>Harry Kuntz</dc:creator>
		<pubDate>Fri, 03 Apr 2009 21:06:48 +0000</pubDate>
		<guid isPermaLink="false">http://craplog.de/?p=575#comment-7231</guid>
		<description>Auch Smilie-S&#228;tze k&#246;nnen viel kaputt machen, siehe Punkt 8)</description>
		<content:encoded><![CDATA[<p>Auch Smilie-S&#228;tze k&#246;nnen viel kaputt machen, siehe Punkt <img src='http://craplog.de/wp-includes/images/smilies/icon_cool.gif' alt='8)' class='wp-smiley' /> </p>
]]></content:encoded>
	</item>
</channel>
</rss>
