数字符号(又称Unicode数字)表示一个数字的字符和字符序列。相同的阿拉伯文数字广泛用于全球多种书写系统,它们使用相同的表数语义,但是在不同的书写系统之间,表示这些数字的字母存在较大差异。为了支持这些字母的差异,Unicode将这些数字编码包含在许多書寫系統區塊之中。小数在23个独立的块中重复:在阿拉伯مرات باللغة العربية中出现2次。六个附加的块还以富文本形式包含了数字,其主要是作为一个专门的数字使用的字母面板。除了各种阿拉伯语数字外,Unicode还包含了一下不常见的数字,例如:爱琴海数字、罗马数字、计数杆数字、楔形文字数字和古希腊数字。

数字符号总是会涉及字形的合成,有限数量的字符组合成为其他的数字符号。例如在阿拉伯语数字中9-9-0序列组成了数字九百九十(990)。在罗马数字中,相同的数字表示为数字符号Ⅹↀ或ⅩⅯ。它们是表示相同抽象数字的不同数字符号。数字符号的语义在其特定的组合中是不同的。阿拉伯语小数是位置-值的组合,而罗马数字是符号-值的组合并且根据其组合增减。

数字符号的数字属性

编辑

按照在文本使用的数字属性分组,Unicode有四个数值类型值。首先是“非数字(not a number)”类型。其次是十进制底数数字符号,通常用于西式数字(普通0-9),也可以是非十进制系统的数字,如罗马数字,和经过排版的十进制数,如环绕数字。

数字类型(Unicode字符属性)
数字类型 代码 有数字值 示例 备注
非数字 None
  • A X(拉丁与) α ! [ § À Д μ に 曉 와
数字值="NaN"
十进制数字 De
  • 0 1 9 ६(梵文字母6) ೬(坎那达语6) 𝟨(数学符号,无衬线字体)
直接数字(十进制底数)。对应两种方式,通用类型=Nd
十进制表意文字 Di
    • ¹(上标) ① ⒈(有句号的数字)
十进制,但经过排版
数字 Nu
    • ¾ ௰(泰米尔语数字十) Ⅹ(罗马数字符号) 六(汉数字6) 壹(汉语,用于会计时的值1)
数字值,但并非十进制底数

十六进制数

编辑

Unicode的十六进制数并非单独字符,而是使用现有的字母和数字。这些字符的字符属性标为Hex_digit=Yes,某些字符还标记了ASCII_Hex_digit=Yes。

标记了Hex_Digit=Yes的Unicode字符
0123456789ABCDEF 基本拉丁文、大写 同时ASCII_Hex_Digit=Yes
0123456789abcdef 基本拉丁文、小写 同时ASCII_Hex_Digit=Yes
0123456789ABCDEF 全角形式、大写
0123456789abcdef 全角形式、小写

不同文字的数字符号

编辑

阿拉伯数字

编辑

小数

编辑

十进制小数

编辑

无理数、集合和其他常量的字符

编辑

富文本和其他兼容数字符号

编辑

中日韩花码数字符号numerals

编辑

Unicode中的花码数字符号

编辑

日语和韩语数字符号

编辑

古希腊数字

编辑

罗马数字

编辑

算籌

编辑

Unicode 5.0 開始,在多文種補充平面中增加了一個區塊用於算籌數字。其包含九個「水平向」數字(U 1D360 到 U 1D368)和九個「垂直向」數字(U 1D369 到 U 1D371),水平向數字用於奇數次冪的位置,而垂直向數字用於偶數次幂的位置。而零則用 U 3007 (〇, ideographic number zero) 來表示,負數符號則使用 U 20E5 (combining reverse solidus overlay)。[1]

算籌數字
Counting Rod Numerals[1][2]
Unicode Consortium 官方碼表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U 1D36x 𝍠 𝍡 𝍢 𝍣 𝍤 𝍥 𝍦 𝍧 𝍨 𝍩 𝍪 𝍫 𝍬 𝍭 𝍮 𝍯
U 1D37x 𝍰 𝍱 𝍲 𝍳 𝍴 𝍵 𝍶 𝍷 𝍸
註釋
1.^ 依据 Unicode 14.0
2.^ 灰色區域表示未分配的碼位

引用

编辑
  1. ^ The Unicode Standard, Version 5.0 – Electronic edition (PDF), Unicode, Inc.: 499–500, 2006 [2013-02-18], (原始内容存档 (PDF)于2023-08-03)