11 Jeux de caractères et Unicode
Manuel de Référence MySQL 4.1 : Version Française
. Jeux de caractères et collation : généralités ->Jeux de caractères et collation dans MySQL . Déterminer le jeu de caractères et la collation par défaut . Opérations affectées par le support de jeux de caractères. . Support de Unicode . UTF8 pour les meta-données . Compatibilité avec d'autres bases de données . Nouveau format de fichier de configuration de jeux de caractères . Jeux de caractères national . Préparer le passage de version 4.0 en 4.1 . Les jeux de caractères et collation supportés par MySQL.
|
11.2 Jeux de caractères et collation dans MySQL Un jeu de caractères a toujours au moins une collation.
Pour lister les jeux de caractères disponibles, utilisez la commande
SHOW CHARACTER SET
:
mysql> SHOW CHARACTER SET; +----------+-----------------------------+---------------------+ | Charset | Description | Default collation | +----------+-----------------------------+---------------------+ | big5 | Big5 Traditional Chinese | big5_chinese_ci | | dec8 | DEC West European | dec8_swedish_ci | | cp850 | DOS West European | cp850_general_ci | | hp8 | HP West European | hp8_english_ci | | koi8r | KOI8-R Relcom Russian | koi8r_general_ci | | latin1 | ISO 8859-1 West European | latin1_swedish_ci | | latin2 | ISO 8859-2 Central European | latin2_general_ci | ...
|
Le résultat inclut en réalité une autre colonne, qui n'est pas présentée
dans cette page, à des fins de publication.Tout jeu de caractères a toujours au moins une collation. Il peut en avoir
plusieurs.
Pour lister les collations d'un jeu de caractères, utilisez la commande
SHOW COLLATION
. Par exemple, pour afficher les collations du jeu
de caractères
latin1
(``ISO-8859-1 West European''), utilisez cette commande,
et recherchez les noms de collation qui commencent par
latin1
:
mysql> SHOW COLLATION LIKE 'latin1%'; +-------------------+---------+----+---------+----------+---------+ | Collation | Charset | Id | Default | Compiled | Sortlen | +-------------------+---------+----+---------+----------+---------+ | latin1_german1_ci | latin1 | 5 | | | 0 | | latin1_swedish_ci | latin1 | 8 | Yes | Yes | 1 | | latin1_danish_ci | latin1 | 15 | | | 0 | | latin1_german2_ci | latin1 | 31 | | Yes | 2 | | latin1_bin | latin1 | 47 | | Yes | 1 | | latin1_general_ci | latin1 | 48 | | | 0 | | latin1_general_cs | latin1 | 49 | | | 0 | | latin1_spanish_ci | latin1 | 94 | | | 0 | +-------------------+---------+----+---------+----------+---------+
|
Les collations
latin1
ont les significations suivantes :
Collation
|
Signification
|
latin1_bin
|
Binaire, suivant l'encodage
latin1
|
latin1_danish_ci
|
Danois/Norvégien
|
latin1_general_ci
|
Multilingue
|
latin1_general_cs
|
Multilingue, sensible à la casse
|
latin1_german1_ci
|
Allemand DIN-1
|
latin1_german2_ci
|
Allemand DIN-2
|
latin1_spanish_ci
|
Espagnol moderne
|
latin1_swedish_ci
|
Suédois/Finlandais |
Les collations ont les caractéristiques suivantes :
-
Deux jeux de caractères différents ne peuvent pas avoir la même collation.
-
Chaque jeu de caractère a une collation qui est la
collation par défaut
. Par exemple, la collation par défaut de
latin1
est
latin1_swedish_ci
.
-
Il y a une convention pour les noms de collation : elles commencent par
le nom du jeu de caractères auquel elles sont associées; elles incluent généralement
un nom de langue, et finissent par
_ci
(
case insensitive
, insensible
à la casse),
_cs
(
case sensitive
, sensible
à la casse),
_bin
(binaire), ou
_uca
(Algorithme Unicode, Unicode Collation Algorithm ).
|