Zum Forum
Passwort vergessen?
Noch keinen Account?
lexikon
Hauptseite
Zufälliger Artikel
Diskussion
Diskussion : UTF-7
Links
Forum
Portale
Reisen
Versicherung
Inhaltsverzeichnis
Hauptmenü
Home
Editorial
Bildung
E-Learning
Fremdsprachen
Magazin
Wissen
Wörterbücher
Enzyklopädien
Expertendienste
Wissenswertes
Praktische Ratgeber
--------------------------
Biologie
Chemie
Computer
Film/ Theater
Geografie
Geschichte
Jura
Kunst
Literatur
Mathematik
Medizin
Musik
Philosophie
Physik/ Astronomie
Politik
Psychologie
Religionen
Sport
Umwelt
Wirtschaft
Reisen
Lexikon
Versicherung
Suchen
Schnellsuche
Suchmaschinen
Metasuchmaschinen
Webkataloge
News
Treffpunkt
Chat
Forum
Suche
Schnellsuche
Sitemap
Kontakt
Impressum
UTF-7
Stichpunkte
Allgemein
UTF-7 ist eine Kodierung des Unicode-Zeichensatzes
die in Request for Comments RFC 2152 definiert wird
UTF-7 erlaubt die Verwendung von Unicode in nicht 8-bit-festen Umgebungen
Viele Protokolle im Internet (etwa SMTP für E-Mail und NNTP für News) setzen die Verwendung von ASCII voraus
Diese Zeichenkodierung erlaubt nur 128 verschiedene Zeichen
die in 7 Bit gespeichert werden
Die Unicode-Zeichensatzkodierungen UTF-16 und UTF-32 (UCS-4) hingegen verwenden 16 oder 32 Bit
um ein Zeichen zu kodieren
UTF-8 verwendet alle acht Bit eines Zeichens
Eine Übermittlung von Unicode-Zeichen per E-Mail oder im Usenet erfordert aber eine Umwandlung in eine 7-bit-Kodierung
so z
Es existieren verschiedene Kodierungsverfahren (Siehe: MIME)
BB
die beliebige 8-Bit-Binärdaten in 7-bit-ASCII-Text umwandelnA
ase64 und Quoted-printable
bhängig vom Kodierungsverfahren und von den zu kodierenden Daten bläht sich die Datenmenge durch die Kodierung aufU
die nur wenige Unicode-Zeichen enthalten
um diesen Kodierungsoverhead bei der Verwendung von Texten
möglichst gering zu halten
die in 7-bit-ASCII darstellbar sind
lesbar zu lassenB
TF-7 wurde entworfen
und gleichzeitig Textpassagen
-./:? so übermittelt
ei UTF-7 werden die Zeichen A-Za-z0-9'()
wie sie sindD
ie ASCII-Zeichen !"#$%&*;<=>@[]^_`{|} können direkt übertragen werden
da sie eventuell nicht durch alle e-Mail-Gateways korrekt übertragen werdenA
sollten aber ebenfalls kodiert werden
lle anderen Zeichen werden speziell kodiertH
ierfür wird eine Folge von zu kodierenden Zeichen (Diese Zeichenfolge kann auch aus nur einem Zeichen bestehen) als Strom von 2-Byte-Zeichen (UTF-16
evtl. mit surrogates) nach einem modifizierten Base64-Verfahren (ohne abschließendes '=') in einen Strom von ASCII-Zeichen umgewandeltD
er Start einer solchen kodierten Zeichensequenz wird durch ein Pluszeichen ("+") angezeigt
das Ende durch ein Minuszeichen ("-") oder durch das erste ASCII-Zeichen
das nicht als Ergebnis der Base64-Kodierung auftreten kann. Überflüssige Bits bei dieser Kodierung sind auf 0 zu setzenB
da kodierte Sonderzeichen nur sehr selten auftretenD
ei englischem Text ist diese Kodierung von Menschen ohne weiteres zu lesen
was den Text bereits merklich entstelltT
ie Umlaute und Sonderzeichen anderer westeuropäischer Sprachen müssen jedoch kodiert werden
exte in Sprachen
sind vom Menschen nicht mehr ohne Weiteres lesbarU
die nicht das lateinische Alphabet verwenden
da andere Verfahren wie Quoted Printable und Base64 von nahezu jedem E-Mail- und News-Programm verstanden werden und der größere Kodierungsüberhang in der Praxis keine Rolle spielt. [Bearbeiten]
TF-7 hat sich trotz seiner höheren Kodierungseffizienz jedoch nicht durchsetzen können
Beispiele
Welt!" ist kodiert "Hallo
Welt!" "1 + 1 = 2" ist kodiert "1 +- 1 = 2" "£1" ist kodiert "+AKM-1"
"Hallo
in Bits: 0000 0000 1010 0011
Warum? £ ist U+00A3
Anders gruppiert: 000000 001010 0011xx
UTF-32
Unicode en:UTF-7 pl:UTF-7
weil die xx als 00 kodiert werden müssen. Siehe auch: UTF-8
UTF-16
Umgesetzt in Base64 ergibt das: AKM
Dieser Artikel basiert auf dem Artikel
UTF-7
aus der freien Enzyklopädie
wikipedia
und steht unter der
GNU Lizenz für freie Dokumentation
. In der wikipedia ist eine
Liste der Autoren
verfügbar.
Rotes Kliff
Zinfandel
Insiderhandel
Labrador (Kanada)
Mikuláš Dzurinda
UTF-16
266px-AlexanderPope.jpg
Unfreie
A35
UTF-32
[ Zurück ]
Inhalt Lexikon:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
1
2
3
4
5
6
7
8
9
Chat
|
Lexikon
|
Reisen
|
Versicherung
|
Forum
|
Kontakt