这是Unicode中精选的字符列表,这些字符具有有趣的(也许尚未广为人知)功能或在其他方面很棒。
Unicode块BoxDrawing(U + 2500至U + 257F)和BlockElements(U + 2580至U + 259F)的代码点涵盖了大部分等宽命令行可视化需求。
╮────────╮│Unicode││规则! │╰┬─────┬╯
U + 2E2E反向问号-表示讽刺/讽刺的“讽刺标记”。有用的角色⸮
U + FEFF零宽度无间断空间-顾名思义,它可以像U + 2060 WORD JOINER一样使用。实际上,引入后者是为了继承其语义。这是因为U + FEFF变成了一个称为字节顺序标记的特殊信标,该信标放置在某些UTF-8文件的开头。在兼容软件(包括许多文本编辑器)中,此字符从文件开头被剥离并作为元数据处理。在非兼容软件(例如PHP解释器)中,这会导致各种有趣的行为。
U + FFFD替换字符-无法显示字符(例如,解码错误的UTF-8序列)时,此代码点会进入破坏行为。
U + 1D455丢失。这将是一个斜体小“ h”。它未被编码,因为它与Planckconstantℎ(U + 210E)相同。
U + FE0E VARIATION SELECTOR-15-黑白的表情符号。如果此代码点跟随表情符号,则请求表情符号的显式单色渲染(如果客户端支持)。
U + FE0F VARIATION SELECTOR-16-逼真的表情符号。如果此代码点跟随表情符号,则请求表情符号的显式彩色渲染(如果客户端支持)。
变音符号和组合标记:有很多字符,以前添加到字符中。那些被称为组合标记。 Unicode在细节上提供了一个方便的FAQ,但简而言之:如果在字符后添加一个,它将放在前一个字符的顶部。因此,a +̊=å。这可能会导致各种有趣的问题,因为对于某些组合,存在预先组合的字符。我们这里的小å也可以编码为U + 00E5。您可能会注意到,虽然它的长度为一个字符,但a和组合环的组合长度为两个字符。
当然,也可以像在StackOverflow上这样回答这些字符,使事情变得有趣。
区域指示器符号U + 1F1E6至U + 1F1FF与26个拉丁字母相似。它们用于创建标志表情符号。由于Unicode联盟不想加入国际政治,因此解决标志的方法是将这26个字符组合为一个国家/地区的相应ISO代码。例子:
表情符号的皮肤颜色:有五个代码点,可控制表情符号的皮肤颜色,从U + 1F3FB到U + 1F3FF。它们被称为“表情符号修饰符Fitzpatrick类型”(从1到6),其中1个浅台架6最暗。如果这些字符中的一个跟随表情符号,则该表情符号应以Fitzpatrickscale的适当皮肤颜色进行渲染。如果未添加此类修饰剂,则肤色应不自然,例如有趣的事实:由于Fitzpatrick修饰符是正常的代码点,具有此类肤色的表情符号的长度为2,这是Twitter用户首先注意到的。这是直接来自规格的比较表:
U + 00A0 NO-BREAK SPACE-迫使相邻字符粘在一起。众所周知的& nbsp;在HTML中。
U + 00AD SOFT HYPHEN-(在HTML中:& shy;)类似于ZERO WIDTH SPACE,但在(且仅当)出现中断时才显示连字符。 U + 200B零宽度空间-U + 00A0的反数:不创建空格,但允许断字。 U + 200D ZERO WIDTH JOINER-强制将相邻字符连接在一起(例如,阿拉伯字符或支持的表情符号)。 苹果使用它来组成一些像不同家族的表情符号。 U + 2060 WORD JOINER-与U + 00A0相同,但完全不可见。 非常适合在Twitter上编写@ font-face。 U + 10FFFF(非字符)-最后一个代码点。 除U + 10FFFE之外,其平面的其余所有部分(0x10000-0x10FFFD范围内的代码点)均为私人使用的字符,保证将来的Unicode标准永远不会填充它。 U + FBF9阿拉伯连接带UIGHUR KIRGHIZ YEHWITH HAMZA上面有ALEF MAKSURA隔离形式-最长的名称:83个字符。 U + 5146和U + 16B61-代表最高“个位数”数字的代码点。 在这两种情况下,总收入都是1,000,000,000,000。
U + 0F33西藏数字半零-代码点表示最低的“个位数”数字,同时唯一的负数字-½。
大多数无用代码点的奖杯分别为U + 0080,U + 0081和U + 0099。这些所谓的C1控制字符或多或少没有被指定。他们加入了Unicode,因为它们存在于后来成为ISO10646(ISO标准化版本的Unicode)的第一个版本中。它们原本应该成为ISO2022升级的一部分,但从未实现。
U + 006F拉丁文小写字母O-引导形状混乱的字符列表。在容易混淆的字符列表中,所有可能的映射中,小“ o”开头的都是73个相似外观的字形,其后是U + 006C拉丁小写字母L,具有70个条目。
U + 1680 OGHAM SPACE MARK-一个看起来像破折号的空间。极大地使程序员接近疯狂:1 + 2 === 3。
U + 037E希腊问号-类似于分号。这也是使开发人员恼火的一种有趣方式。
U + F8FF专用代码点-在许多Apple设备上,此专用代码点均作为Apple徽标呈现。
U + 1F574从事商务活动的人-一个相当奇怪的字符,由于Webdings字体中的出现(出于向后兼容性的原因),它才变成Unicode。
U + 1F596举起的手,中间和环指之间-火神致敬。 健康长寿·繁荣昌盛! 🖖 U + 2800盲文图案空白-一种盲文图案,其中填充了六个或八个点中的零。根据标准:“ *虽然此字符在许多字体中均以固定宽度的空白形式成像,但不能用作 空格”,本质上将其呈现为空白,但由于它被指定为非空白,因此它与验证空白的正则表达式不匹配。 这可以用来绕过各种不允许或修剪空白的验证。 在法律允许的范围内,贡献者放弃了该作品的所有版权以及相关或邻近的权利。 有关详细信息,请参见许可证文件。