Table des caractères Unicode/U2000
Table des caractères Unicode U 2000 à U 206F.
Ponctuation générale (Unicode 1.1 à 6.3)
[modifier | modifier le code]Espaces et caractères de ponctuation d’usage général ou mathématique.
Les caractères U 2000 à U 200A et U 205F sont des espaces de chasse fixe et tous sécables ; le caractère U 200B est une espace normalement invisible car sans chasse, mais il reste justifiable (donc parfois visible) et sécable.
Le caractère U 202F est une espace de chasse fixe (et fine), similaire au caractère U 2009 mais insécable ; il correspond à l’espace fine insécable utilisée en typographie française traditionnelle autour de certaines ponctuations[1], et est normalement préférable à l’espace insécable U 00A0 qui est similaire, mais est souvent trop large.
Le caractère U 2011 est un trait d’union d’aspect normalement semblable au caractère U 2010 mais insécable.
Les caractères U 200B à U 200F, U 2028 à U 202E, U 2060 à U 2064 et U 206A à U 206F sont des caractères de contrôle de format, qui déterminent le rendu ou l’interprétation des caractères voisins, ou contrôlent leurs ligatures, ou facilitent la mise en page du texte. Parmi ces derniers :
- les caractères U 2061 à U 2064 sont des séparateurs ou opérateurs mathématiques significatifs entre deux opérandes, mais normalement invisibles et sans chasse : ils permettent de faire des distinctions sémantiques entre les quatre interprétations possibles de l’absence visible d’opérateur (des préférences typographiques permettent toutefois de parfois de les rendre visibles, sous la forme de l’opérateur auquel chacun d’eux est associé) ;
- l’utilisation des caractères U 206A à U 206F est à éviter : ils ne sont gardés que pour compatibilité avec d’anciennes technologies d’internationalisation qui nécessitaient des substitutions automatiques de certains caractères (tels que les chiffres décimaux ou certaines paires de signes de ponctuation) selon leur contexte, par d’autres caractères et que ces applications ne savaient pas prendre en charge ; il est vivement encouragé d’utiliser plutôt les caractères de substitution attendus.
Table des caractères
[modifier | modifier le code] en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2000 | 1⁄2 CAD |
CAD |
ESP 1⁄2 CAD |
ESP CAD |
ESP 1⁄3 CAD |
ESP 1⁄4 CAD |
ESP 1⁄6 CAD |
ESP TAB |
ESP PONC |
ESP FINE |
ESP ULTRA FINE |
ESP SC |
AL SC |
L SC |
M GàD |
M DàG |
U 2010 | ‐ | ‑ INSÉC |
‒ | – | — | ― | ‖ | ‗ | ‘ | ’ | ‚ | ‛ | “ | ” | „ | ‟ |
U 2020 | † | ‡ | • | ‣ | ․ | ‥ | … | ‧ | SÉP L |
SÉP P |
E GàD |
E DàG |
D FD |
F GàD |
F DàG |
ESP FINE INSÉC |
U 2030 | ‰ | ‱ | ′ | ″ | ‴ | ‵ | ‶ | ‷ | ‸ | ‹ | › | ※ | ‼ | ‽ | ‾ | ‿ |
U 2040 | ⁀ | ⁁ | ⁂ | ⁃ | ⁄ | ⁅ | ⁆ | ⁇ | ⁈ | ⁉ | ⁊ | ⁋ | ⁌ | ⁍ | ⁎ | ⁏ |
U 2050 | ⁐ | ⁑ | ⁒ | ⁓ | ⁔ | ⁕ | ⁖ | ⁗ | ⁘ | ⁙ | ⁚ | ⁛ | ⁜ | ⁝ | ⁞ | ESP MM |
U 2060 | GLU MOT |
f() |
× |
, |
|
I GàD |
I DàG |
I DI |
D ID |
I ES |
A ES |
I FA |
A FA |
SF NA |
SF NR |
Historique
[modifier | modifier le code]Version initiale Unicode 1.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2000 | 1⁄2 CAD |
CAD |
ESP 1⁄2 CAD |
ESP CAD |
ESP 1⁄3 CAD |
ESP 1⁄4 CAD |
ESP 1⁄6 CAD |
ESP TAB |
ESP PONC |
ESP FINE |
ESP ULTRA FINE |
ESP SC |
AL SC |
L SC |
M GàD |
M DàG |
U 2010 | ‐ | - INSÉC |
‒ | – | — | ― | ‖ | ‗ | ‘ | ’ | ‚ | ‛ | “ | ” | „ | ‟ |
U 2020 | † | ‡ | • | ‣ | ․ | ‥ | … | ‧ | SÉP L |
SÉP P |
E GàD |
E DàG |
D FD |
F GàD |
F DàG |
|
U 2030 | ‰ | ‱ | ′ | ″ | ‴ | ‵ | ‶ | ‷ | ‸ | ‹ | › | ※ | ‼ | ‽ | ‾ | ‿ |
U 2040 | ⁀ | ⁁ | ⁂ | ⁃ | ⁄ | ⁅ | ⁆ | |||||||||
U 2060 | I ES |
A ES |
I FA |
A FA |
SF NA |
SF NR |
Compléments Unicode 3.0
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2020 | ESP FINE INSÉC | |||||||||||||||
U 2040 | ⁈ | ⁉ | ⁊ | ⁋ | ⁌ | ⁍ |
Compléments Unicode 3.2
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2040 | ⁇ | |||||||||||||||
U 2050 | ⁐ | ⁑ | ⁒ | ⁗ | ESP MM | |||||||||||
U 2060 | GLU MOT |
f() |
× |
, |
Compléments Unicode 4.0
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2050 | ⁓ | ⁔ |
Compléments Unicode 4.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2050 | ⁕ | ⁖ | ⁘ | ⁙ | ⁚ | ⁛ | ⁜ | ⁝ | ⁞ |
Compléments Unicode 5.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2060 | |
Compléments Unicode 6.3
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U 2060 | I GàD |
I DàG |
I DI |
D ID |
Voir aussi
[modifier | modifier le code]Liens externes
[modifier | modifier le code]- (en) [PDF] General Punctuation, tableau sur le site Unicode.
- (fr) [PDF] Ponctuation générale, tableau sur le site Unicode.
Liens internes
[modifier | modifier le code]- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Télougou
- Singhalais
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Hanounóo
- Khmer
- Mongol (ou bitchig)
- Limbou
- Bougui (ou bouguinais, bugi, lontara)
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation – supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou (ou lisu, Fraser)
- Vaï
- Cyrillique étendu – B
- Bamoun (ou bamoum, shü-mom)
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Ougaritique
- Cunéiforme persépolitain (vieux perse)
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Yézidi
- Brâhmî
- Kaïthî (ou kayathi)
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Multanais (ou multanî)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Siddham
- Dévanagari étendu – A
- Cunéiforme – nombres et ponctuation
- Mrou
- Vah bassa
- Adlam
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Ponctuation générale
- Symboles de type lettre
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Symboles mathématiques divers – A
- Flèches – supplément A
- Flèches – supplément B
- Symboles mathématiques divers – B
- Opérateurs mathématiques – supplément
- Petites variantes de forme
- Formes de demie et pleine chasse
- Arabe – symboles mathématiques alphabétiques
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U 1000 à U 104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Nouveaux blocs ajoutés :
- Syriaque
- Thâna
- Birman
- Éthiopien
- Chérokie
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Singhalais
- Motifs Braille
- Sinogrammes unifiés CJC – caractères de description
- Symboles et ponctuation CJC
- Bopomofo étendu
- Sinogrammes unifiés CJC – supplément A :
1re partie, 2e partie - Yi – syllabaire des Monts frais
- Yi – clés
- ...
Nouveaux caractères dans des blocs existants :
Nouveaux blocs ajoutés :
- Cyrillique – supplément
- Tagalog (ou baybayin, alibata)
- Hanounóo
- Bouhide (ou bouhid)
- Tagbanoua (ou tagbanwa)
- Flèches – supplément – A
- Flèches – supplément – B
- Symboles mathématiques divers – B
- Symboles mathématiques – supplément
- Katakana – extensions phonétiques
- Sélecteurs de variantes
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Diacritiques
- Grec et copte
- Cyrillique
- Arabe
- Thâna
- Géorgien – assomtavrouli et mkhédrouli
- Ponctuation générale
- Exposants et indices
- Symboles monétaires
- Diacritiques pour symboles
- Symboles de type lettre
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Alphanumériques délimités
- Pavés
- Symboles divers
- Symboles mathématiques divers – A
- Formes géométriques
- Symboles et ponctuation CJC
- Hiragana
- Katakana
- Lettres et mois CJC délimités
- Yi – clés
- Sinogrammes de compatibilité CJC
- Arabe – formes de présentation – A (3e partie)
- Sinogrammes CJC – formes de compatibilité
- Arabe – formes de présentation – B
- Formes de demi et pleine chasse
Nouveaux blocs ajoutés :
- Limbou
- Latin étendu – extensions phonétiques
- Linéaire B – syllabaire
- Linéaire B – idéogrammes
- Grec – nombres égéens
- Ougaritique
- Shavien
- Osmanya
- Sélecteurs de variante – supplément
- ...
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Arabe
- Syriaque
- Dévanagârî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Kannara (ou kannada)
- Khmer (ou cambodgien)
- Ponctuation générale
- Signes techniques divers
- Lettres et mois CJC délimités
Nouveaux blocs ajoutés :
- Arabe – supplément
- Éthiopien – supplément
- Nouveau taï lü
- Bougui (ou bouguinais, bugi, lontara)
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Géorgien – supplément (nouskhouri)
- Éthiopien étendu
- Sinogrammes unifiés CJC – traits
- Lettres modificatives de ton
- Grec – nombres antiques
- Cunéiforme persépolitain (vieux perse)
- ...
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Diacritiques
- Grec et copte
- Cyrillique
- Hébreu
- Arabe
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Tamoul
- Tibétain
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Latin étendu – extensions phonétiques
- Symboles monétaires
- Signes techniques divers
- Lettres et mois unifiés CJC délimités
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- ...
Nouveaux blocs ajoutés :
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Vaï
- Cyrillique étendu – A
- Cyrillique étendu – B
- Saurachtra
- Kayah-li
- Redjang (ou rejang)
- Cham
- Symboles antiques
- Disque de Phaïstos
- Lycien
- Carien
- Lydien
- Tuiles de mah-jong
- Dominos
Nouveaux caractères dans des blocs existants :
- Grec et copte
- Cyrillique
- Cyrillique – supplément
- Arabe
- Arabe – supplément
- Dévanâgarî
- Gourmoukhî
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Malayâlam
- Tibétain
- Birman
- Mongol (ou bitchig)
- Latin étendu – supplément phonétique
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Diacritiques pour symboles
- Symboles de type lettres
- Formes numérales
- Symboles divers
- Symboles mathématiques divers – A
- Symboles divers et flèches
- Latin étendu – C
- Ponctuation – supplément
- Bopomofo
- Sinogrammes unifiés CJC – traits
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Lettres modificatives de ton
- Latin étendu – D
- Demi-signes diacritiques
- Symboles musicaux byzantins
- Symboles musicaux occidentaux
Notes et références
[modifier | modifier le code]- (en) « UDHR In Unicode - Notes on French », sur unicode.org (consulté le ).
- DerivedAge.txt, base de données sur le site Unicode.