添加的内容 删除的内容
Zhang Ju-wei(留言 | 贡献) (调整排版) |
|||
(未显示2个用户的13个中间版本) | |||
第5行: | 第5行: | ||
{{操作指南|H:UNIHAN}} |
{{操作指南|H:UNIHAN}} |
||
2023年8月1日实施的中华人民共和国国家标准《信息技术 中文编码字符集》(GB 18030-2022)一方面是Unicode的完全对应编码,另一方面也对包括求闻百科(网站及基础设施)及阅读、编辑求闻百科所使用的软件、浏览器等的汉字支持程度提出了新的要求。 |
|||
Unicode 1.0版提供了20,916個漢字(包括繁體中文、簡體中文、日語及韓語所用的漢字),一般來說能滿足日常使用。而对于其后Unicode 3.0版引進的「[[中日韓統一表意文字擴展區A|擴展A區漢字]]」、「康熙部首」和「中日韓部首」;Unicode 3.1版引進的「[[中日韓統一表意文字擴展區B|擴展B區漢字]]」;Unicode 4.1版引進的「[[GB 18030]]與[[香港增補字符集|HKSCS增補漢字]]」;Unicode 5.1版引進的8個漢字(參看[[中日韓統一表意文字]]條目);Unicode 5.2版引進的「[[中日韓統一表意文字擴展區C|擴展C區漢字]]」;Unicode 6.0版引進的「[[中日韓統一表意文字擴展區D|擴展D區漢字]]」;Unicode 8.0版引进的「[[中日韓統一表意文字擴展區E|擴展E區漢字]]」;Unicode 10.0版引进的「[[中日韓統一表意文字擴展區F|擴展F區漢字]]」;Unicode 13.0版引進的「[[中日韓統一表意文字擴展區G|擴展G區漢字]]」;Unicode 15.0版引进的“[[中日韩统一表意文字扩展区H|扩展H区汉字]]”和Unicode 15.1版引进的“[[中日韩统一表意文字扩展区I|扩展I区汉字]]”,缺乏相關特殊字體或瀏覽器支援性較差的電腦有可能會產生缺字的情形,導致字符顯示為方格、[[亂碼]]或問號等。在iPhone 5s或更舊款的智慧型手機上無法顯示,會使用戶以為有關字元消失或遺漏了。 |
|||
求闻百科所使用的共笔软件系统、数据库等不是汉字敏感的,亦即,其能接受并传输任何Unicode字符,包括GB 18030-2022、其第1号修改单(预计于2024年内发布)、后续修改单以及Unicode目前及今后规定的全部汉字、少数民族文字和全世界其他各民族使用的文字。求闻百科所使用的数据库表为“MariaDB utf8mb4”格式,支持存储整个Unicode编码空间内的全部字符。求闻百科唯一的汉字敏感的组件是提供“分类内按拼音排序”功能的扩展,其将按Unicode修订计划定期更新。因此,读者、编者所使用的操作系统、浏览器、字体字库等对GB 18030-2022及Unicode的支持对能否正常显示汉字至关重要。然而非常令人遗憾的是,由于Unicode的更新速度非常快,市面上的绝大多数设备和浏览器都有机会出现缺字的情形,导致字符显示为方格、乱码、内码方块、问号或空格等,影响用户使用体验。 |
|||
除此之外,Unicode將大部分在來源編碼中分開編碼,但按漢字統一標準同屬一字的漢字分入「兼容漢字」區,以便達成無損來回轉換。除了專門處理某來源編碼「一字多形」的字型之外,大部分字型都將兼容區的漢字按其對應的普通字形呈現。因此,若想要分開顯示JIS X 0213:2004中「{{lang|ja|賓}}」(U+8CD3)的舊字形「{{lang|ja|賓}}」(U+FA64),就需要安裝特殊字型。<ref>從Unicode的本身角度說,新舊字形不應使用「相容功能」表示,而應該通過[http://unicode.org/ivd/ 表意文字變種資料庫]中的后缀序列指定。要表示舊字形的「{{lang|ja|賓}}」,可以在[http://www.unicode.org/ivd/data/2016-08-15/IVD_Charts_Adobe-Japan1.pdf Adobe-Japan1對照表]查到8CD3的E0101號變體,使用(U+8CD3 U+E0101)序列表示。</ref> |
除此之外,Unicode將大部分在來源編碼中分開編碼,但按漢字統一標準同屬一字的漢字分入「兼容漢字」區,以便達成無損來回轉換。除了專門處理某來源編碼「一字多形」的字型之外,大部分字型都將兼容區的漢字按其對應的普通字形呈現。因此,若想要分開顯示JIS X 0213:2004中「{{lang|ja|賓}}」(U+8CD3)的舊字形「{{lang|ja|賓}}」(U+FA64),就需要安裝特殊字型。<ref>從Unicode的本身角度說,新舊字形不應使用「相容功能」表示,而應該通過[http://unicode.org/ivd/ 表意文字變種資料庫]中的后缀序列指定。要表示舊字形的「{{lang|ja|賓}}」,可以在[http://www.unicode.org/ivd/data/2016-08-15/IVD_Charts_Adobe-Japan1.pdf Adobe-Japan1對照表]查到8CD3的E0101號變體,使用(U+8CD3 U+E0101)序列表示。</ref> |
||
第33行: | 第35行: | ||
* [http://www.unicode.org/charts/PDF/U4DC0.pdf 六十四卦]、[http://www.unicode.org/charts/PDF/U1D30.pdf 太玄经符号] |
* [http://www.unicode.org/charts/PDF/U4DC0.pdf 六十四卦]、[http://www.unicode.org/charts/PDF/U1D30.pdf 太玄经符号] |
||
{{col-end}} |
{{col-end}} |
||
== 测试 == |
|||
本章节用于Unicode汉字显示情况相关的展示。如果您的设备缺少相关的字型,会显示为方框。 |
|||
=== GB 18030-2022 实现级别1 === |
|||
合计27 570个汉字及14个汉字部首,外加9个在GB 18030-2005中存在,但在GB 18030-2022中删去的汉字位置。 |
|||
* 中日韩统一表意文字(Unicode 1.0.1)(20 902个):北(U+5317)、晈(U+6648)、藐(U+85D0)、針(U+91DD) |
|||
* 位于GB 18030-2022双字节区的中日韩统一表意文字(Unicode 4.1追补)(8个):龵(U+9FB5) |
|||
* 位于GB 18030-2022双字节区的中日韩统一表意文字扩展区A(Unicode 3.0)(52个):㘎(U+360E) |
|||
* 位于GB 18030-2022双字节区的中日韩汉字部首补充(Unicode 3.0)(14个):⺈(U+2E88) |
|||
* 位于GB 18030-2022双字节区的中日韩兼容表意文字(Unicode 1.0.1)(12个):﨔(U+FA14) |
|||
* 位于GB 18030-2022双字节区的中日韩兼容表意文字(Unicode 1.0.1)(9个——为保证与GB 18030-2005兼容而留空):凉(U+F979) |
|||
* 位于GB 18030-2022四字节区的中日韩统一表意文字(Unicode 4.1追补)(14个):龯(U+9FAF) |
|||
* 中日韩统一表意文字(Unicode 5.1追补)(8个):鿁(U+9FC1) |
|||
* 中日韩统一表意文字(Unicode 5.2追补)(8个):鿈(U+9FC8) |
|||
* 中日韩统一表意文字(Unicode 6.1追补)(1个):鿌(U+9FCC) |
|||
* 中日韩统一表意文字(Unicode 8.0追补,通称“急用汉字”)(3个):鿎(U+9FCE) |
|||
* 中日韩统一表意文字(Unicode 8.0追补)(6个):鿔(U+9FD4) |
|||
* 中日韩统一表意文字(Unicode 10.0追补)(21个):鿦(U+9FE6) |
|||
* 中日韩统一表意文字(Unicode 11.0追补)(5个):鿬(U+9FEC)、鿮(U+9FEE) |
|||
* 位于GB 18030-2022四字节区的中日韩统一表意文字扩展区A(Unicode 3.0)(6 530个):㐀(U+3400)、䏌(U+43CC) |
|||
=== GB 18030-2022 实现级别2 === |
|||
通称“BMP外196字”,见《[[通用规范汉字表]]》。实现级别1与实现级别2总计27 766个汉字及14个汉字部首。 |
|||
* 位于中日韩统一表意文字扩展区B(Unicode 3.1)的通用规范汉字(36个):𠳐(U+20CD0)、𥻗(U+25ED7)、𩾌(U+29F8C) |
|||
* 位于中日韩统一表意文字扩展区C(Unicode 5.2)的通用规范汉字(44个):𪨶(U+2AA36)、𫚕(U+2B695) |
|||
* 位于中日韩统一表意文字扩展区D(Unicode 6.0)的通用规范汉字(8个):𫠆(U+2B806) |
|||
* 位于中日韩统一表意文字扩展区E(Unicode 8.0)的通用规范汉字(108个):𫰛(U+2BC1B)、𬉼(U+2C27C)、𬬿(U+2CB3F)、𬶠(U+2CDA0) |
|||
=== GB 18030-2022 实现级别3 === |
|||
实现级别1、实现级别2与实现级别3总计87 887个汉字及228个汉字部首。由于这一数字超过了OpenType单个字体字符数的上限(65 535个),因此您需要使用同一字体组的多个字体,或者使用OpenType字体集。 |
|||
* 康熙部首(Unicode 3.0)(214个):⼳(U+2F33)、⾔(U+2F94) |
|||
* 位于中日韩统一表意文字扩展区B(Unicode 3.1)的非通用规范汉字(42 675个):𡈈(U+21208)、𤁾(U+2407E)、𦿅(U+26FC5)、𩻭(U+29EED) |
|||
* 位于中日韩统一表意文字扩展区C(Unicode 5.2)的非通用规范汉字(4 105个):𪠅(U+2A805)、𪿾(U+2AFFE)、𫐕(U+2B415) |
|||
* 位于中日韩统一表意文字扩展区D(Unicode 6.0)的非通用规范汉字(214个):𫝾(U+2B77E) |
|||
* 位于中日韩统一表意文字扩展区E(Unicode 8.0)的非通用规范汉字(5 654个):𫤖(U+2B916)、𬄀(U+2C100)、𬫿(U+2CAFF) |
|||
* 中日韩统一表意文字扩展区F(Unicode 10.0)(7 473个):𬼳(U+2CF33)、𭤯(U+2D92F)、𮜀(U+2E700) |
|||
=== GB 18030-2022 第1号修改单对实现级别3的补充 === |
|||
总计97 680个汉字及228个部首。 |
|||
* 中日韩统一表意文字(Unicode 13.0追补)(13个):鿴(U+9FF4) |
|||
* 中日韩统一表意文字扩展区A(Unicode 13.0追补)(10个):䶹(U+4DB9) |
|||
* 中日韩统一表意文字扩展区B(Unicode 13.0追补)(7个):𪛘(U+2A6D8) |
|||
* 中日韩统一表意文字扩展区G(Unicode 13.0)(4 939个):𰝵(U+30775)、𰳾(U+30CFE) |
|||
* 中日韩统一表意文字(Unicode 14.0追补)(3个):鿾(U+9FFE) |
|||
* 中日韩统一表意文字扩展区B(Unicode 14.0追补)(2个):𪛞(U+2A6DE) |
|||
* 中日韩统一表意文字扩展区C(Unicode 14.0追补)(4个):𫜶(U+2B736) |
|||
* 中日韩统一表意文字扩展区H(Unicode 15.0)(4 192个):𱗯(U+315EF)、𱶐(U+31D90) |
|||
* 中日韩统一表意文字扩展区C(Unicode 15.0追补)(1个):𫜹(U+2B739) |
|||
* 中日韩统一表意文字扩展区I(Unicode 15.1,通称“公安人口信息专用字库补充汉字”)(622个):𮴅(U+2ED05) |
|||
== 模板 == |
== 模板 == |
||
{{seealso|Template:CJK-New-Char}} |
{{seealso|Template:CJK-New-Char}} |
||
如果條目的標題或正文使用了Unicode |
如果條目的標題或正文使用了Unicode 1.0.1版规定的20 902个汉字以外的任何其他汉字,請加入以下模板: |
||
:{{tlx|CJK-New-Char}}會顯示{{CJK-New-Char}} |
:{{tlx|CJK-New-Char}}會顯示{{CJK-New-Char}} |
||
第91行: | 第143行: | ||
| [http://cheonhyeong.com/Simplified/download.html 天珩字库] |
| [http://cheonhyeong.com/Simplified/download.html 天珩字库] |
||
| 中国大陆、中国台湾、中国香港、日本、韩国 |
| 中国大陆、中国台湾、中国香港、日本、韩国 |
||
| 与[[Unicode]]同步更新,《TH-Tshyn》已支持显示全部Unicode15.1字符,包括14余万汉字〔基本区及扩展A、B、C、D、E、F、G、H、I区(含增补)〕。<br>字库以《[https://www.unicode.org/charts/PDF/ Unicode Charts]》为准修正了大量汉字字形,-{如“{{僻字|膥|⿱⿰未成肉}}”、“{{僻字|槩|陆港 |
| 与[[Unicode]]同步更新,《TH-Tshyn》已支持显示全部Unicode15.1字符,包括14余万汉字〔基本区及扩展A、B、C、D、E、F、G、H、I区(含增补)〕。<br>字库以《[https://www.unicode.org/charts/PDF/ Unicode Charts]》为准修正了大量汉字字形,-{如“{{僻字|膥|⿱⿰未成肉}}”、“{{僻字|槩|陆港:⿱既木、台:⿱旣木}}”、“{{僻字|肞|陆:⿰月叉、台:⿰月义}}”、“{{僻字|褝|中:⿰衤单、日:⿰衤単}}”等。}- |
||
| 以[[中易宋体]]、[[思源黑体]]、[http://fonts.jp/hanazono/ 花園明朝]等字形风格为基础制作,《TH-Tshyn》中的TH-Times.ttc支持复杂文种<small>(如[[传统蒙古文]])</small>的正确显示。 |
| 以[[中易宋体]]、[[思源黑体]]、[http://fonts.jp/hanazono/ 花園明朝]等字形风格为基础制作,《TH-Tshyn》中的TH-Times.ttc支持复杂文种<small>(如[[传统蒙古文]])</small>的正确显示。 |
||
|- |
|- |
||
第164行: | 第216行: | ||
| [https://github.com/Fitzgerald-Porthmouth-Koenigsegg/Plangothic 遍黑体] |
| [https://github.com/Fitzgerald-Porthmouth-Koenigsegg/Plangothic 遍黑体] |
||
| 中国大陆 |
| 中国大陆 |
||
| {{Check mark|15}} |
|rowspan=3| {{Check mark|15}} |
||
| 完整扩展C区、D区、G区、H区,基本区、扩展A区增补部分,少量其他扩展区汉字和非汉字字符 |
| 完整扩展C区、D区、G区、H区,基本区、扩展A区增补部分,少量其他扩展区汉字和非汉字字符 |
||
| 基于[[思源黑体]]修改而成。 |
| 基于[[思源黑体]]修改而成。 |
||
|- |
|||
| [http://users.teilar.gr/~g1951d/ Symbola字符支持包:Symbola] |
|||
| |
|||
| {{Check mark|15}} |
|||
| 支持Unicode標準:基本拉丁語,國際音標擴展,間距修飾字母,一般標點符號,結合變音符號,希臘和科普特字母,西里爾字母,西里爾字母增補,上標和下標,貨幣符號,組合變音標記符號,字母符號,數字形式,箭頭,數學運算符號,雜項技術符號,控製圖片,光學識別符,組件圖,方塊元素,幾何圖形,雜項符號,裝飾符號,雜項數學符號A區,增補箭頭A區,增補箭頭B區,雜項數學符號B區,增補數學運算符號,雜項符號和箭頭,增補標點,易經六十四卦符號,結合半月痕,特價符號,音樂符號,拜占庭音樂符號,古希臘音樂符號,太玄經符號,算籌數字,數學字母數字符號,麻將牌,多米諾骨牌,撲克牌,雜項符號和繪圖文字,表情符號,交通和地圖符號,煉金術符號,阿拉伯語數字(U+06F0–U+06F9),平假名“の”(U+306E),中日韓統一表意文字“中”(U+4E2D),標準化數學變種等 |
|||
|主要用來顯示各種符號,不是漢字。 |
|||
|- |
|- |
||
| [https://github.com/ButTaiwan/genyog-font 源樣黑體] |
| [https://github.com/ButTaiwan/genyog-font 源樣黑體] |
||
| [[舊字形]]<small>(非任何现实地区标准)</small> |
| [[舊字形]]<small>(非任何现实地区标准)</small> |
||
| {{Check mark|15}} |
|||
| 完整基本区、擴展A區,擴展B區、C區、D區、E區、F區中的部份常用字,特製臺灣閩客字、適應繁體中文的本地化改進 |
| 完整基本区、擴展A區,擴展B區、C區、D區、E區、F區中的部份常用字,特製臺灣閩客字、適應繁體中文的本地化改進 |
||
| 基於韓文版本的漢字傳承字形修改而成。 |
| 基於韓文版本的漢字傳承字形修改而成。 |
||
第182行: | 第227行: | ||
| [https://github.com/ichitenfont/I.Ming 一點明體] |
| [https://github.com/ichitenfont/I.Ming 一點明體] |
||
| [[傳承字形]]<small>(非任何现实地区标准)</small> |
| [[傳承字形]]<small>(非任何现实地区标准)</small> |
||
| {{Check mark|15}} |
|||
| 基本区、擴展A區、B區、C區、D區、E區、F區、G區中的中、日文常用字,香港字、臺灣閩客字,假名和擴展假名,粵語和臺灣方音注音符號,部首、漢字筆畫,麻雀牌、中國象棋、中國算籌、中式「正」字計數符號、八卦符號、易經六十四卦符號、太玄經符號等字符 |
| 基本区、擴展A區、B區、C區、D區、E區、F區、G區中的中、日文常用字,香港字、臺灣閩客字,假名和擴展假名,粵語和臺灣方音注音符號,部首、漢字筆畫,麻雀牌、中國象棋、中國算籌、中式「正」字計數符號、八卦符號、易經六十四卦符號、太玄經符號等字符 |
||
| 完全覆蓋《通用規範漢字表》所有漢字及對應繁體字。 |
| 完全覆蓋《通用規範漢字表》所有漢字及對應繁體字。 |
||
第199行: | 第243行: | ||
*: 可以使用[http://www.zisea.com/zslf.htm 两分]查询生僻字,支持使用释义[http://www.zisea.com/zsFan.asp 反查]汉字;收录汉字14.1万(14.0万释义),囊括《中华字海》《康熙字典》《汉语大字典》《现代汉语词典》,与Unicode同步更新汉字集,并提供标准码位。 |
*: 可以使用[http://www.zisea.com/zslf.htm 两分]查询生僻字,支持使用释义[http://www.zisea.com/zsFan.asp 反查]汉字;收录汉字14.1万(14.0万释义),囊括《中华字海》《康熙字典》《汉语大字典》《现代汉语词典》,与Unicode同步更新汉字集,并提供标准码位。 |
||
* [https://zi.tools/ 字統网] {{zh-cn}} |
* [https://zi.tools/ 字統网] {{zh-cn}} |
||
*: 漢字源、形、音、義、碼数据库整合站點。收錄字形19.7萬、字義15.6萬<small>(《説文解字》《康熙字典》等)</small>、字理字源14.4萬<small>(《字源》《汉语多功能字库》等)</small>、超227萬筆音韻數據〔5地標准音、18本韻書<small>(《广韵》《集韵》《蒙古字韵》《洪武正韻》等)</small>、10種上古音方案、450餘方言點〕。同时还提供历代书法资源和[https://zi.tools/ |
*: 漢字源、形、音、義、碼数据库整合站點。收錄字形19.7萬、字義15.6萬<small>(《説文解字》《康熙字典》等)</small>、字理字源14.4萬<small>(《字源》《汉语多功能字库》等)</small>、超227萬筆音韻數據〔5地標准音、18本韻書<small>(《广韵》《集韵》《蒙古字韵》《洪武正韻》等)</small>、10種上古音方案、450餘方言點〕。同时还提供历代书法资源和[https://zi.tools/?secondary=ids 动态组字]工具。 |
||
* [http://ccamc.org/ 古今文字集成]{{zh-cn}}及[http://ccamc.org/cjkv_oaccgd.php 開放古文字字形字庫] {{zh-hant}} |
* [http://ccamc.org/ 古今文字集成]{{zh-cn}}及[http://ccamc.org/cjkv_oaccgd.php 開放古文字字形字庫] {{zh-hant}} |
||
*: 可以通过多种检索方式查询大量古、今漢字以及類漢字<small>(如西夏文、契丹文、女真文)</small>释義、字形更革、音韻演變的大型在線辭書。 |
*: 可以通过多种检索方式查询大量古、今漢字以及類漢字<small>(如西夏文、契丹文、女真文)</small>释義、字形更革、音韻演變的大型在線辭書。 |