0 Daumen
552 Aufrufe

In der Praxis werden heutzutage Textdokumente meistens gemäß UTF-8-Code gespeichert. Beim Austausch mit älteren oder anders eingestellten Systemen kommt es dabei aber manchmal zu Problemen. In dieser Aufgabe wollen wir nachvollziehen, wie es zu diesen Problemen kommt.
(a) Gegeben sei die Bitfolge C3 A4 (eine Folge von 16 Bits in Hexadezimalschreibweise). Rechnen Sie diese Hexadezimalzahl in eine Binärzahl um.
(b) Gehen Sie davon aus, dass die Bitfolge C3 A4 aus einer mit UTF-8 codierten Textdatei stammt. Wie lautet die Nummer des Unicode-Zeichens, das codiert ist? Um welches Zeichen handelt es sich? Achten Sie auf einen nachvollziehbaren Lösungsweg.
(c) Einige Anwendungsprogramme erwarten standardmäfig auf deutschen Systemen, dass Text- dateien die Kodierung ISO \( 8859-1 \) (Latin 1) verwenden. Dieser Code ist eine ASCII-Erweite- rung, bei der jedes Byte für ein einzelnes Zeichen steht. Latin 1 deckt dabei die Sonderzeichen, die in Westeuropa verwendet werden, ab. Doshalb sind einige ältere Dokumente aus dieser Region vor der Etablierung von UTF-8 in Latin 1 gespeichert worden.

Gehen Sie nun davon aus, dass c3 A4 in Latin 1 codiert ist. Welche Zeichen entsprechen dieser Bytefolge?

Avatar von

1 Antwort

0 Daumen
 
Beste Antwort

blob.png


Was das in UTF-8 und Latin 1 repräsentiert, kannst Du in den entsprechenden Tabellen nachschauen.

Avatar von 45 k

Wenn ich richtig nachgeschaut habe, bedeutet es einmal

ä (wie in ärgerlich)

und dann

ä (A Tilde Schildkröte),

wobei "Schildkröte" meint https://de.wikipedia.org/wiki/Allgemeines_Währungssymbol

Ein anderes Problem?

Stell deine Frage

Ähnliche Fragen

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community