Passer du latin1 à l'unicode
Formation
En Ligne
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Description
-
Typologie
Formation
-
Méthodologie
En ligne
Grâce à cette formation vous pourrez acquérir les connaissances nécessaires qui vous permettrons d’ajouter des compétences à votre profil et obtenir de solides aptitude qui vous offriront de nombreuses opportunités professionnelles.
Les Avis
Le programme
Bienvenue à tous dans ce tutoriel. :)
Ici je vais vous expliquer comment migrer son site internet encodé en latin1 (ISO-8859-1) à l'unicode (UTF-8), ainsi que les avantages que ça présente, mais aussi les inconvénients.
Vous trouverez en annexes les principales erreurs que vous serez susceptibles de rencontrer.
Pourquoi passer à l'unicode ?Voici la question que vous devez sans doute vous poser. Pourquoi passer à l'unicode ? Si vous avez suivi vos cours de xHTML / CSS sur ce site même, on vous a toujours appris (ou plutôt, M@teo21) à utiliser la norme du latin1 (le fameux ISO-8859-1) que vous déclarez entre les balises <head> </head> :
<meta http-equiv="Content-type" content="text/html; charset=iso-8859-1" />L'inconvénient du latin1 est qu'il utilise un encodage de caractère basé sur 1 octet, soit 256 possibilités (1 caractère = 1 octet = 8 bits, dans chaque bit il peut y avoir soit 0 soit 1 ; 2 ^ 8 = 256, d'où les 256 possibilités). Ainsi, dans votre page, vous ne pourrez placer que 256 caractères différents. Avec cette norme, vous ne pourrez ainsi jamais placer des caractères accentués et des caractères chinois sur la même page par exemple. Si vous êtes sous Windows, vous pouvez regarder combien de caractères sont disponibles avec telle police et telle norme d'encodage (unicode, Windows Occidental, etc.). Pour cela, cliquez sur Démarrer > Exécuter et tapez charmap. Sélectionnez Unicode dans le jeu de caractère, regardez 5 secondes et passez à Windows Occidental (c'est plus ou moins l'équivalent de la norme ISO 8859-1 : notez l'absence du tiret car cette norme est celle utilisée sur votre système et non sur internet). Le nombre de caractères disponibles a légèrement baissé, n'est-ce pas ? :p
Si vous voulez la liste des caractères de la norme ISO-8859-1, la voici (les mots en italiques sont des caractères de contrôles ajoutés pour son utilisation sur Internet) :
-0
-1
-2
-3
-4
-5
-6
-7
-8
-9
-A
-B
-C
-D
-E
-F
0-
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
HT
LF
VT
FF
CR
SO
SI
1-
DLE
DC1
DC2
DC3
DC4
NAK
SYN
ETB
CAN
EM
SUB
ESC
FS
GS
RS
US
2-
SP
!
"
#
$
%
&
'
(
)
*
+
,
-
.
/
3-
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
4-
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
5-
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
6-
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
7-
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
DEL
8-
PAD
HOP
BPH
NBH
IND
NEL
SSA
ESA
HTS
HTJ
VTS
PLD
PLU
RI
SS2
SS3
9-
DCS
PU1
PU2
STS
CCH
MW
SPA
EPA
SOS
SGCI
SCI
CSI
ST
OSC
Avez-vous besoin d'un coach de formation?
Il vous aidera à comparer différents cours et à trouver la solution la plus abordable.
Passer du latin1 à l'unicode