admin 管理员组文章数量: 887021
2024年1月23日发(作者:sql语句的核心功能)
Unicode汉字和英文编码范围
2008年10月26日 星期日 20:38
中文的unicode码的范围4e00-9fa5
如果是英文asc,高自己是0x00
1)标准CJK文字
/Public/UNIDATA/
Code point range Block name Release
U+3400..U+4DB5 CJK Unified Ideographs Extension A 3.0
U+4E00..U+9FA5 CJK Unified Ideographs 1.1
U+9FA6..U+9FBB CJK Unified Ideographs 4.1
U+F900..U+FA2D CJK Compatibility Ideographs 1.1
U+FA30..U+FA6A CJK Compatibility Ideographs 3.2
U+FA70..U+FAD9 CJK Compatibility Ideographs 4.1
U+20000..U+2A6D6 CJK Unified Ideographs Extension B 3.1
U+2F800..U+2FA1D CJK Compatibility Supplement 3.1
2)全角ASCII、全角中英文标点、半宽片假名、半宽平假名、半宽韩文字母:FF00-FFEF
/charts/PDF/
3)CJK部首补充:2E80-2EFF
/charts/PDF/
4)CJK笔划:31C0-31EF
/charts/PDF/
5)康熙部首:2F00-2FDF
/charts/PDF/
6)汉字结构描述字符:2FF0-2FFF
/charts/PDF/
7)注音符号:3100-312F
/charts/PDF/
8)注音符号(闽南语、客家语扩展):31A0-31BF
/charts/PDF/
9)日文平假名:3040-309F
/charts/PDF/
10)日文片假名:30A0-30FF
/charts/PDF/
11)日文片假名拼音扩展:31F0-31FF
/charts/PDF/
12)韩文拼音:AC00-D7AF
/charts/PDF/
13)韩文字母:1100-11FF
/charts/PDF/
14)韩文兼容字母:3130-318F
/charts/PDF/
15)太玄经符号:1D300-1D35F
/charts/PDF/
16)易经六十四卦象:4DC0-4DFF
/charts/PDF/
17)彝文音节:A000-A48F
/charts/PDF/
18)彝文部首:A490-A4CF
/charts/PDF/
19)盲文符号:2800-28FF
/charts/PDF/
20)CJK字母及月份:3200-32FF
/charts/PDF/
21)CJK特殊符号(日期合并):3300-33FF
/charts/PDF/
22)装饰符号(非CJK专用):2700-27BF
/charts/PDF/
23)杂项符号(非CJK专用):2600-26FF
/charts/PDF/
Unicode字符编码分布表――语言文字类
欧洲字母
(查阅组合·标记字符)
非洲文字 印度文字
孟加拉字符东亚文字 中亚文字
Kharoshihi(U+10A00 –
U+10A5F)
中日韩统一汉字(U+4E00 –
蒙古字符(U+1800 –
埃塞俄比亚文字 (U+0980 –
U+09FF)
埃塞俄比亚字符梵文字符(U+0900 –
U+097F)
古吉拉特字符U+0AFF)
(U+1200 –
U+137F)
增补埃塞俄比亚U+139F)
汉字
亚美尼亚文字
亚美尼亚字符(U+0530 –
U+058F)
U+9FBF,5MB) U+18AF)
中日韩统一汉字扩八思巴字符展集A(U+3400 – (U+A840 –
U+4DBF,2MB) U+A87F)
中日韩统一汉字扩藏语字符展集B(U+20000 – (U+0F00 –
U+2A6DF,13MB) U+0FFF)
中日韩相容汉字(U+F900 –
U+FAFF,0.5MB)
增补中日韩相容汉字(U+2F800 –
汉字注释标记
U+319F)
(查阅中日韩统一汉字数据库)
古文字
U+2FA1F,0.5MB)
字符(U+1380 – (U+0A80 –
亚美尼亚文字相关埃塞俄比亚字符果鲁穆奇字符(字母表达形式字扩展集(U+2D80 (U+0A00 –
符:U+FB00 –
– U+2DDF) U+0A7F)
U+FB4F)
埃纳德字符科普特文字
科普特字符(U+2C80 –
U+2CFF)
其他非洲文字 (U+0C80 –
U+0CFF)
林布字符(U+1900 –
U+194F)
马拉亚拉姆字U+0D7F)
奥里亚字符(U+0B00 –
U+0B7F)
僧伽罗字符N’Ko(U+07C0 –
U+07FF)
希腊文字中的科普提非纳字符特字符(U+0370 – (U+2D30 –
U+03FF) U+2D7F)
西里尔文字
西里尔字符(U+0400 –
U+04FF)
增补西里尔字符(U+0500 –
U+052F)
阿拉伯字符(U+0600 –
U+06FF)
增补阿拉伯字符(U+0750 –
U+077F)
乔治亚风格字母(U+10A0 –
U+10FF)
阿拉伯表达形式字符集A(U+FB50 –
U+FDFF)
中东文字
符(U+0D00 – (U+3190 –
阿拉伯文 (U+0D80 -
U+0DFF)
部首和笔画
古希腊
Syloti Nagri字增补中日韩汉字部古希腊数字符(U+A800 – 首(U+2E80 –
U+A82F)
泰米尔字符(U+0B80 –
U+0BFF)
泰卢固字符(U+0C00 –
U+0C7F)
U+2EFF)
康熙部首(U+2F00
– U+2FDF)
中日韩汉字笔画(U+31C0 –
U+31EF)
(U+10140 –
U+1018F)
古希腊音乐符号(U+1D200 –
U+1D24F)
乔治亚风格文字
楔形文字
增补乔治亚风格字母(U+2D00 –
U+2D2F)
阿拉伯表达形式字符集B(U+FE70 –
U+FEFF)
表意文字描述符(U+2FF0 –
U+2FFF)
楔形文字(U+12000 –
U+123FF)
楔形文字数字和希腊文字
希伯来文 菲律宾文字
中文专用符号
标点符号(U+12400 –
U+1247F)
古波斯字符(U+103A0 –
U+103DF)
希腊字符(U+037
– U+03FF)
希腊字符扩展集(U+1F00 –
U+1FFF)
(查阅古希腊分区)
希伯来字符(U+0590 –
U+059F)
Buhid字符(U+1740 –
U+175F)
哈鲁喏字符(U+1720 –
U+173F)
塔加路字符汉语拼音字母(U+3100 –
U+312F)
希伯来字母表达形式字符(U+FB00 –
U+FB4F)
叙利亚文
叙利亚字符汉语拼音字母扩展乌加里特字符集(U+31A0 –
U+31BF)
(U+10380 –
U+1039F)
(U+1700 –
U+171F)
泰格班瓦字符(U+1760 –
U+177F)
日文专用符号
线状B
线状B表音字符(U+10000 –
U+1007F)
线状B表意字符(U+10080 –
U+100FF)
拉丁文
基本拉丁字符(U+0000 –
U+007F)
(U+0700 –
U+074F)
平假名(U+3040 –
U+309F)
片假名(U+30A0 –
U+30FF)
片假名音标扩展集塔纳文
增补拉丁字符集1塔纳字符(U+0080 –
U+00FF)
拉丁字符扩展集A(U+0100 –
U+017F)
拉丁字符扩展集B加拿大语字符(U+0180 –
U+024F)
(U+2C60 –
U+2C7F)
(U+A720 –
U+A7FF)
附加拉丁字符扩展集(U+1E00 –
U+1EFF)
其他文字
(U+1400 –
U+167F)
(U+13A0 –
U+13FF)
(U+10400 –
U+1044F)
美洲文字
(U+0780 –
U+07BF)
布吉字符(U+1A00 –
U+1A1F)
巴厘字符(U+1B00 –
U+1B7F)
高棉字符(U+1780 –
U+17FF)
高棉符号(U+19E0 –
U+19FF)
老挝语字符(U+0E80 –
U+0EFF)
东南亚文字 (U+31F0 –
U+31FF)
其他古文字
爱琴海数字(U+10100 –
U+1013F)
筹算数字半角片假名(U+FF00 –
U+FFEF)
朝鲜文字专用符号 (U+1D360 –
U+1D37F)
谚文音节字符(U+AC00 –
塞浦路斯表音字符(U+10800 –
哥特字符(U+10330 –
U+1034F)
古意大利语字符(U+10300 –
U+1032F)
拉丁字符扩展集C切罗基字符U+D7AF,4MB) U+1083F)
谚文字母(U+1100
– U+11FF)
谚文相容字母(U+3130 –
U+318F)
拉丁字符扩展集D犹他字符
拉丁文相关(字母萧伯纳风格字符表达形式字符:U+FB00 –
U+FB4F)
(U+10450 –
U+1047F)
奥斯曼字符(U+10480 –
U+104AF)
格拉哥里字符(U+2C00 –
U+2C5F)
缅甸语字符(U+1000 –
U+109F)
新Tai Lue字符(U+1980 –
U+19DF)
Tai Le字符(U+1950 –
U+197F)
泰语字符(U+0E00 –
U+0E7F)
半角谚文字母(U+FF00 –
U+FFEF)
欧甘字符(U+1680 –
U+169F)
Runic字符全角拉丁字母(U+FF00 –
U+FFEF)
小形式(U+FE50 –
U+FE6F)
Yi
Yi音节符号(U+A000 –
Yi字元符号(U+A490 –
U+A4CF)
(U+16A0 –
U+16FF)
腓尼基字符(U+10900 –
U+A48F,0.6MB) U+1091F)
(参考音标符号)
编码分布表――标点符号类
标点符号 数学符号 符号 私用
私用区(U+E000 – U+F8FF)
通用标点符号
ASCII标点符号数字和数字符号
综合符号
(查阅专用文字)
(U+0000 –
U+007F)
印刷符号(U+2700 - 增补私用A区(U+F0000 –
U+27BF) U+FFFFD)
增补拉丁字符集1ASCII数字标点符号(U+0000 –
(U+0080 –
U+007F)
U+00FF)
通用标点符号(U+2000 –
U+206F)
增补标点符号(U+2E00 –
U+2E7F)
综合符号(U+2600 增补私用B区(U+100000 –
– U+26FF) U+10FFFD)
全角ASCII数字《太玄经》符号(U+FF00 – (U+1D300 –
U+FFEF) U+1D35F)
数字形式字符(U+2150 –
U+218F)
《易经》六爻符号(U+4DC0 –
U+4DFF)
(U+2800 –
U+28FF)
代理区
高位代理区(U+D800 – U+DBFF)
上标和下标字符盲人点字图符中日韩标点符号 (U+2070 –
U+209F)
中日韩标点符号(U+3000 –
U+303F)
私用高位代理区
字母类符号
音乐符号
古希腊音乐符号低位代理区(U+DC00 – U+DFFF)
非字符编码分布表
全角ASCII标点字母类符号
符号(U+FF00 – (U+2100 –
U+FFEF) U+214F)
(U+1D200 –
U+1D24F)
竖排标点符号(U+FE10 –
U+FE1F)
数学文字符号(U+1D400 –
U+1D4FF)
拜占庭音乐符号(U+1D000 –
U+1D0FF)
保留区(分配给每种文字或符号的编码区域里面或多或少都预留有一些未分配的码位,所有这些未分配的码位统称为“保留区”。本链接所示的只是整个Unicode编码布局的所有保留区中的一个)
基本多语言平面的尾段(U+FFF0 –
U+FFFF)
第一增补平面的尾段(U+1FF80 –
U+1FFFF)
西方音乐符号带圈和带框符号
箭头和运算符
带圈字母和数字(U+2460 –
U+24FF)
带圈中日韩相容表音文字字母和月份符号(U+3200 –
U+32FF)
中日韩相容符号(U+3300 –
U+33FF)
(查阅字母类符号)
增补数学运算符美元、欧元符号(U+2A00 –
U+2AFF)
数学运算符(U+2200 –
U+22FF)
(查阅专用文字)
箭头符号(U+2190 –
U+21FF)
(U+1D000 –
U+1D0FF)
货币符号
第二增补平面的尾段(U+2FF80 –
U+2FFFF)
(U+0000 –
U+007F)
第三增补平面的尾段(U+3FF80 –
U+3FFFF)
第四增补平面的尾段(U+4FF80 –
U+4FFFF)
综合数学符号集日元、英镑和分币合A(U+27C0 –
(U+0080 –
U+27EF)
综合数学符号集合B(U+2980 –
U+29FF)
U+00FF)
组合区分标记
组合区分标记(U+0300 –
U+036F)
符号组合区分标记(U+20D0 –
U+20FF)
增补组合区分标记(U+1DC0 –
U+1DFF)
半角组合标记(U+FE20 –
U+FE2F)
音标符号
货币符号(U+20A0
第五增补平面的尾段(U+5FF80 –
– U+20CF) U+5FFFF)
增补箭头符号集全角货币符号合A(U+27F0 –
(U+FF00 –
U+27FF)
增补箭头符号集U+FFEF)
第六增补平面的尾段(U+6FF80 –
U+6FFFF)
马克(U+2100 –
U+214F)和
芬尼第七增补平面的尾段(U+7FF80 –
合B(U+2900 –
(U+20A0 – U+7FFFF)
U+297F)
U+20CF,历史符号)
综合符号和箭头里亚尔符号(U+2B00 –
U+2BFF)
(U+FB50 –
U+FDFF)
专用符号
第八增补平面的尾段(U+8FF80 –
U+8FFFF)
第九增补平面的尾段(U+9FF80 –
U+9FFFF)
第十增补平面的尾段(U+AFF80 –
几何图形符号
几何图形控制符:C0
(U+25A0 –
U+25FF)
(U+0000 –
U+007F)、C1(U+0080 –
U+00FF)
排版控制符(U+2000 –
U+206F)
不可见操作符(U+2000 –
U+206F)
U+AFFFF)
国际音标扩展集(U+0250 –
U+02AF)
音标扩展集(U+1D00 –
U+1D7F)
增补音标扩展集(U+1D80 –
U+1DBF)
改进的音标字母(U+A700 –
U+A71F)
间隔修饰符(U+02B0 –
U+02FF)
(查阅上标和下标)
框线绘制符号(U+2500 –
U+257F)
方形组块图符(U+2580 –
U+259F)
第十一增补平面的尾段(U+BFF80 –
U+BFFFF)
第十二增补平面的尾段(U+CFF80 –
U+CFFFF)
技术符号
控制符图示(U+2400 –
U+243F)
综合技术符号(U+2300 –
U+23FF)
专用符号(U+FFF0
第十三增补平面的尾段(U+DFF80 –
– U+FFFF) U+DFFFF)
标记符号(U+E0000
第十四增补平面的尾段(U+EFF80 –
– U+E007F)
变体选择符(U+FE00 –
U+FE0F)
U+EFFFF)
第十五增补平面的尾段(U+FFF80 –
U+FFFFF)
第十六增补平面的尾段(U+10FF80
– U+10FFFF)
光学字符识别符增补变体选择符号(U+2440 – (U+E0100 –
U+245F) U+E01EF)
版权声明:本文标题:Unicode汉字和英文编码范围 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/free/1705965098h495960.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论