Help:Unicode扩展汉字:修订间差异

帮助页面
添加的内容 删除的内容
无编辑摘要
无编辑摘要
第5行: 第5行:
{{操作指南|H:UNIHAN}}
{{操作指南|H:UNIHAN}}


2023年8月1日实施的中华人民共和国国家标准《信息技术 中文编码字符集》(GB 18030-2022)一方面是Unicode的完全对应编码,另一方面也对包括求闻百科(网站及基础设施)及阅读、编辑求闻百科所使用的软件、浏览器等的汉字支持程度提出了新的要求。求闻百科所使用的共笔软件系统、数据库等不是汉字敏感的,亦即,其能接受并传输任何Unicode字符,包括GB 18030-2022、其修改单1(预计于2024年内发布)、后续修改单以及Unicode目前及今后规定的全部汉字和少数民族文字。求闻百科所使用的数据库表为“MariaDB utf8mb4”格式,支持整个Unicode编码空间内的全部字符。求闻百科唯一的汉字敏感的组件是提供“分类内按拼音排序”功能的扩展,其将按Unicode修订计划定期更新。因此,读者、编者所使用的操作系统、浏览器、字体字库等对GB 18030-2022及Unicode的支持对能否正常显示汉字至关重要
2023年8月1日实施的中华人民共和国国家标准《信息技术 中文编码字符集》(GB 18030-2022)一方面是Unicode的完全对应编码,另一方面也对包括求闻百科(网站及基础设施)及阅读、编辑求闻百科所使用的软件、浏览器等的汉字支持程度提出了新的要求。


求闻百科所使用的共笔软件系统、数据库等不是汉字敏感的,亦即,其能接受并传输任何Unicode字符,包括GB 18030-2022、其第1号修改单(预计于2024年内发布)、后续修改单以及Unicode目前及今后规定的全部汉字和少数民族文字。求闻百科所使用的数据库表为“MariaDB utf8mb4”格式,支持存储整个Unicode编码空间内的全部字符。求闻百科唯一的汉字敏感的组件是提供“分类内按拼音排序”功能的扩展,其将按Unicode修订计划定期更新。因此,读者、编者所使用的操作系统、浏览器、字体字库等对GB 18030-2022及Unicode的支持对能否正常显示汉字至关重要。然而非常令人遗憾的是,由于Unicode的更新速度非常快,市面上的绝大多数设备和浏览器都有机会出现缺字的情形,导致字符显示为方格、乱码、内码方块、问号或空格等,影响用户使用体验。
Unicode 1.0版提供了20,916個漢字(包括繁體中文、簡體中文、日語及韓語所用的漢字),一般來說能滿足日常使用。而对于其后Unicode 3.0版引進的「[[中日韓統一表意文字擴展區A|擴展A區漢字]]」、「康熙部首」和「中日韓部首」;Unicode 3.1版引進的「[[中日韓統一表意文字擴展區B|擴展B區漢字]]」;Unicode 4.1版引進的「[[GB 18030]]與[[香港增補字符集|HKSCS增補漢字]]」;Unicode 5.1版引進的8個漢字(參看[[中日韓統一表意文字]]條目);Unicode 5.2版引進的「[[中日韓統一表意文字擴展區C|擴展C區漢字]]」;Unicode 6.0版引進的「[[中日韓統一表意文字擴展區D|擴展D區漢字]]」;Unicode 8.0版引进的「[[中日韓統一表意文字擴展區E|擴展E區漢字]]」;Unicode 10.0版引进的「[[中日韓統一表意文字擴展區F|擴展F區漢字]]」;Unicode 13.0版引進的「[[中日韓統一表意文字擴展區G|擴展G區漢字]]」;Unicode 15.0版引进的“[[中日韩统一表意文字扩展区H|扩展H区汉字]]”和Unicode 15.1版引进的“[[中日韩统一表意文字扩展区I|扩展I区汉字]]”,缺乏相關特殊字體或瀏覽器支援性較差的電腦有可能會產生缺字的情形,導致字符顯示為方格、[[亂碼]]或問號等。在iPhone 5s或更舊款的智慧型手機上無法顯示,會使用戶以為有關字元消失或遺漏了。


除此之外,Unicode將大部分在來源編碼中分開編碼,但按漢字統一標準同屬一字的漢字分入「兼容漢字」區,以便達成無損來回轉換。除了專門處理某來源編碼「一字多形」的字型之外,大部分字型都將兼容區的漢字按其對應的普通字形呈現。因此,若想要分開顯示JIS X 0213:2004中「{{lang|ja|賓}}」(U+8CD3)的舊字形「{{lang|ja|賓}}」(U+FA64),就需要安裝特殊字型。<ref>從Unicode的本身角度說,新舊字形不應使用「相容功能」表示,而應該通過[http://unicode.org/ivd/ 表意文字變種資料庫]中的后缀序列指定。要表示舊字形的「{{lang|ja|賓}}」,可以在[http://www.unicode.org/ivd/data/2016-08-15/IVD_Charts_Adobe-Japan1.pdf Adobe-Japan1對照表]查到8CD3的E0101號變體,使用(U+8CD3 U+E0101)序列表示。</ref>
除此之外,Unicode將大部分在來源編碼中分開編碼,但按漢字統一標準同屬一字的漢字分入「兼容漢字」區,以便達成無損來回轉換。除了專門處理某來源編碼「一字多形」的字型之外,大部分字型都將兼容區的漢字按其對應的普通字形呈現。因此,若想要分開顯示JIS X 0213:2004中「{{lang|ja|賓}}」(U+8CD3)的舊字形「{{lang|ja|賓}}」(U+FA64),就需要安裝特殊字型。<ref>從Unicode的本身角度說,新舊字形不應使用「相容功能」表示,而應該通過[http://unicode.org/ivd/ 表意文字變種資料庫]中的后缀序列指定。要表示舊字形的「{{lang|ja|賓}}」,可以在[http://www.unicode.org/ivd/data/2016-08-15/IVD_Charts_Adobe-Japan1.pdf Adobe-Japan1對照表]查到8CD3的E0101號變體,使用(U+8CD3 U+E0101)序列表示。</ref>
第86行: 第86行:
{{seealso|Template:CJK-New-Char}}
{{seealso|Template:CJK-New-Char}}


如果條目的標題或正文使用了Unicode擴展漢字,請加入以下模板:
如果條目的標題或正文使用了Unicode 1.0.1版规定的20 902个汉字以外的任何其他汉字,請加入以下模板:


:{{tlx|CJK-New-Char}}會顯示{{CJK-New-Char}}
:{{tlx|CJK-New-Char}}會顯示{{CJK-New-Char}}