ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Unicode等价性

2021-09-12 16:02:01  阅读:221  来源: 互联网

标签:字符 等价 正规化 相容 Unicode 序列


Unicode等价性(Unicode equivalence)是为和许多现存的标准能够相容,Unicode(统一码)包含了许多特殊字符。在这些字符中,有些在功能上会和其它字符或字符序列等价。因此,Unicode将一些码位序列定义成相等的。Unicode提供了两种等价概念:标准等价和相容等价。前者是后者的一个子集。例如,字符n后接著组合字符~会(标准和相容)等价于Unicode字符ñ。而合字ff则只有相容等价于两个f字符。

Unicode正规化是文字正规化的一种形式,是指将彼此等价的序列转成同一列序。此序列在Unicode标准中称作正规形式。对于每种等价概念,Unicode又定义两种形式,一种是完全合成的,一种是完全分解的。因此,最后会有四种形式,其缩写分别为:NFC、NFD、NFKC、NFKD。对于Unicode的文字处理程式而言,正规化是很重要的。因为它影响了比较、搜寻和排序的意义。

标签:字符,等价,正规化,相容,Unicode,序列
来源: https://www.cnblogs.com/cdaniu/p/15258328.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有