Installation
<<<
Configuration à l'exécution Types de ressources
>>>

6.19 Chaînes de caractères multi-octets
6 Référence des fonctions
 Manuel PHP

Introduction
Installation
->Configuration à l'exécution
Types de ressources
Constantes pré-définies
Entrées/Sorties HTTP
Jeux de caractères supportés
Exploitation des chaînes multi-octets en PHP
Cas des caractères japonais
Références
Jeux de caractères supportés
mb_convert_case
mb_convert_encoding
mb_convert_kana
mb_convert_variables
mb_decode_mimeheader
mb_decode_numericentity
mb_detect_encoding
mb_detect_order
mb_encode_mimeheader
mb_encode_numericentity
mb_ereg_match
mb_ereg_replace
mb_ereg_search_getpos
mb_ereg_search_getregs
mb_ereg_search_init
mb_ereg_search_pos
mb_ereg_search_regs
mb_ereg_search_setpos
mb_ereg_search
mb_ereg
mb_eregi_replace
mb_eregi
mb_get_info
mb_http_input
mb_http_output
mb_internal_encoding
mb_language
mb_list_encodings
mb_output_handler
mb_parse_str
mb_preferred_mime_name
mb_regex_encoding
mb_regex_set_options
mb_send_mail
mb_split
mb_strcut
mb_strimwidth
mb_strlen
mb_strpos
mb_strrpos
mb_strtolower
mb_strtoupper
mb_strwidth
mb_substitute_character
mb_substr_count
mb_substr

6.19.3 Configuration à l'exécution

Le comportement de ces fonctions est affecté par la configuration dans le fichier php.ini .

Nom Par défaut Modifiable Historique
mbstring.language "neutral" PHP_INI_PERDIR Disponible depuis PHP 4.3.0
mbstring.detect_order NULL PHP_INI_ALL Disponible depuis PHP 4.0.6
mbstring.http_input "pass" PHP_INI_ALL Disponible depuis PHP 4.0.6
mbstring.http_output "pass" PHP_INI_ALL Disponible depuis PHP 4.0.6
mbstring.internal_encoding NULL PHP_INI_ALL Disponible depuis PHP 4.0.6
mbstring.script_encoding NULL PHP_INI_ALL Disponible depuis PHP 4.3.0
mbstring.substitute_character NULL PHP_INI_ALL Disponible depuis PHP 4.0.6
mbstring.func_overload "0" PHP_INI_PERDIR PHP_INI_SYSTEM en PHP <= 4.2.3. Disponible depuis PHP 4.2.0
mbstring.encoding_translation "0" PHP_INI_PERDIR Disponible depuis PHP 4.3.0
Pour plus de détails sur les constantes PHP_INI_*, reportez-vous à  ini .

Voici un éclaircissement sur l'utilisation des directives de configuration.

    En accord avec HTML 4.01 specification , les navigateurs sont supposés utiliser le même jeu de caractères lorsqu'ils soumettent un formulaire. Mais, tous les navigateurs ne le font pas. Reportez-vous à la fonction mb_http_input pour détecter les jeux de caractères utilisés par les navigateurs.

    En général, les navigateurs sont suffisamment intelligents pour détecter les jeux de caractères dans le HTML. Si charset est activé dans les en-têtes, cela donnera de meilleurs résultats. Changez la valeur de default_charset avec la valeur appropriée dans le fichier ini.

    Configuration de php.ini pour mbstring
    
    ; Langage par défaut
    mbstring.language        = Neutral; (UTF-8) (par défaut)
    mbstring.language        = English; Anglais
    mbstring.language        = Japanese; Japonais

    ;; Jeu de caractère interne
    ;; Note : assurez-vous que ce jeu fonctionne avec PHP
    mbstring.internal_encoding    = UTF-8

    ;; Activation de la conversion automatique des entrées HTTP
    mbstring.encoding_translation = On

    ;; Jeu de caractères par défaut pour les données d'entrée HTTP
    ;; Note : le script ne peux pas changer cette configuration
    mbstring.http_input           = pass    ; Aucune conversion.
    mbstring.http_input           = auto    ; Utilise auto
                                    ; "auto" est remplacé par "ASCII,JIS,UTF-8,EUC-JP,SJIS"
    mbstring.http_input           = SJIS    ; Utilise SJIS
    mbstring.http_input           = UTF-8,SJIS,EUC-JP ; Spécifie l'ordre

    ;;Jeu de caractères par défaut pour les données de sortie HTTP
    mbstring.http_output          = pass    ; Aucune conversion
    mbstring.http_output          = UTF-8   ; Utilise UTF-8

    ;; Ordre de détection des jeux de caractères
    mbstring.detect_order         = auto    ; Utilise la détection automatique
    mbstring.detect_order         = ASCII,JIS,UTF-8,SJIS,EUC-JP ; Spécifie l'ordre

    ;; Déterminer le jeu de caractères de substitution par défaut
    mbstring.substitute_character = 12307   ; Spécifie une valeur Unicode
    mbstring.substitute_character = none    ; Ne pas afficher de caractères
    mbstring.substitute_character = long    ; Exemple complet : U+3000,JIS+7E7E

    Configuration de php.ini pour les utilisateurs de EUC-JP
    
    ;; Désactive la bufferisation de sortie
    output_buffering      = Off

    ;; Choisit le jeu de caractères
    default_charset       = EUC-JP

    ;; Le langage par défaut est le japonais
    mbstring.language = Japanese

    ;; Activation de la traduction automatique des données d'entrée HTTP
    mbstring.encoding_translation = On

    ;; Activation de la conversion automatique
    mbstring.http_input   = auto

    ;; Convertit les sorties en EUC-JP
    mbstring.http_output  = EUC-JP

    ;; Utilise le jeu de caractères interne EUC-JP
    mbstring.internal_encoding = EUC-JP

    ;; Ne pas afficher les caractères invalides
    mbstring.substitute_character = none

    Configuration de php.ini pour les utilisateurs de SJIS
    
    ;; Active la bufferisation de sortie
    output_buffering     = On

    ;; Utilise le gestionnaire mb_output_handler pour la conversion de sortie
    output_handler       = mb_output_handler

    ;; Choisit le jeu de caractères
    default_charset      = Shift_JIS

    ;; Le langage par défaut est le japonais
    mbstring.language = Japanese

    ;; Activation de la traduction automatique des données d'entrée HTTP
    mbstring.http_input  = auto

    ;; Convertit en SJIS
    mbstring.http_output = SJIS

    ;;Utilise le jeu de caractères interne EUC-JP
    mbstring.internal_encoding = EUC-JP

    ;; Ne pas afficher les caractères invalides
    mbstring.substitute_character = none

    << Configuration à l'exécution >>
    Installation Chaînes de caractères multi-octets Types de ressources