Jeux de caractères et collation : généralités
<<<
Jeux de caractères et collation dans MySQL Déterminer le jeu de caractères et la collation par défaut
>>>

11 Jeux de caractères et Unicode
 Manuel de Référence MySQL 4.1 : Version Française

Jeux de caractères et collation : généralités
->Jeux de caractères et collation dans MySQL
Déterminer le jeu de caractères et la collation par défaut
Opérations affectées par le support de jeux de caractères.
Support de Unicode
UTF8 pour les meta-données
Compatibilité avec d'autres bases de données
Nouveau format de fichier de configuration de jeux de caractères
Jeux de caractères national
Préparer le passage de version 4.0 en 4.1
Les jeux de caractères et collation supportés par MySQL.

11.2 Jeux de caractères et collation dans MySQL

Un jeu de caractères a toujours au moins une collation. Pour lister les jeux de caractères disponibles, utilisez la commande SHOW CHARACTER SET :

mysql> SHOW CHARACTER SET;
+----------+-----------------------------+---------------------+
| Charset  | Description                 | Default collation   |
+----------+-----------------------------+---------------------+
| big5     | Big5 Traditional Chinese    | big5_chinese_ci     |
| dec8     | DEC West European           | dec8_swedish_ci     |
| cp850    | DOS West European           | cp850_general_ci    |
| hp8      | HP West European            | hp8_english_ci      |
| koi8r    | KOI8-R Relcom Russian       | koi8r_general_ci    |
| latin1   | ISO 8859-1 West European    | latin1_swedish_ci   |
| latin2   | ISO 8859-2 Central European | latin2_general_ci   |
...
Le résultat inclut en réalité une autre colonne, qui n'est pas présentée dans cette page, à des fins de publication.Tout jeu de caractères a toujours au moins une collation. Il peut en avoir plusieurs.

Pour lister les collations d'un jeu de caractères, utilisez la commande SHOW COLLATION . Par exemple, pour afficher les collations du jeu de caractères latin1 (``ISO-8859-1 West European''), utilisez cette commande, et recherchez les noms de collation qui commencent par latin1 :


mysql> SHOW COLLATION LIKE 'latin1%';
+-------------------+---------+----+---------+----------+---------+
| Collation         | Charset | Id | Default | Compiled | Sortlen |
+-------------------+---------+----+---------+----------+---------+
| latin1_german1_ci | latin1  |  5 |         |          |       0 |
| latin1_swedish_ci | latin1  |  8 | Yes     | Yes      |       1 |
| latin1_danish_ci  | latin1  | 15 |         |          |       0 |
| latin1_german2_ci | latin1  | 31 |         | Yes      |       2 |
| latin1_bin        | latin1  | 47 |         | Yes      |       1 |
| latin1_general_ci | latin1  | 48 |         |          |       0 |
| latin1_general_cs | latin1  | 49 |         |          |       0 |
| latin1_spanish_ci | latin1  | 94 |         |          |       0 |
+-------------------+---------+----+---------+----------+---------+
Les collations latin1 ont les significations suivantes :
Collation Signification
latin1_bin Binaire, suivant l'encodage latin1
latin1_danish_ci Danois/Norvégien
latin1_general_ci Multilingue
latin1_general_cs Multilingue, sensible à la casse
latin1_german1_ci Allemand DIN-1
latin1_german2_ci Allemand DIN-2
latin1_spanish_ci Espagnol moderne
latin1_swedish_ci Suédois/Finlandais

Les collations ont les caractéristiques suivantes :

  • Deux jeux de caractères différents ne peuvent pas avoir la même collation.
  • Chaque jeu de caractère a une collation qui est la collation par défaut . Par exemple, la collation par défaut de latin1 est latin1_swedish_ci .
  • Il y a une convention pour les noms de collation : elles commencent par le nom du jeu de caractères auquel elles sont associées; elles incluent généralement un nom de langue, et finissent par _ci ( case insensitive , insensible à la casse), _cs ( case sensitive , sensible à la casse), _bin (binaire), ou _uca (Algorithme Unicode, Unicode Collation Algorithm ).

<< Jeux de caractères et collation dans MySQL >>
Jeux de caractères et collation : généralités Jeux de caractères et Unicode Déterminer le jeu de caractères et la collation par défaut