BMP之外的JavaScript字符串
BMP是基本的多语言平面
根据JavaScript:好的部分:
JavaScript是在16位字符集的时候构建的,因此JavaScript中的所有字符都是16位宽。
这让我相信JavaScript使用UCS-2(不是UTF-16!)并且只能处理U + FFFF以前的字符。
进一步调查证实了这一点:
> String.fromCharCode(0x20001);
返回Unicode字符时,fromCharCode
方法似乎只使用最低16位。试图获得U + 20001(CJK统一表意文字20001)而不是返回U + 0001。
问题:是否可以在JavaScript中处理后BMP字符?
2011-07-31:来自Unicode支持枪战的第12个幻灯片:The Good,The Bad,& (大多数)Ugly很好地涵盖了与此相关的问题:
没有找到相关结果
已邀请:
4 个回复
苏髓骗撩
,
,
等)都处理代码单元而不是字符,因此很乐意拆分代理对或保留无效的代理序列。 如果你想要代理意识的方法,我担心你必须自己开始写它们!例如:
邵酮
春驹晴陪
。
也是一个代码点迭代器,它可以获得代码点长度。
勘掸府迫路