ASCII编码UTF-8的有效方法
我正在寻找一种简单有效的方法来存储ASCII-7中的UTF-8字符串。有效率我的意思是:
输入中的所有ASCII字母数字字符应在输出中保持相同的ASCII字母数字字符
结果字符串应尽可能短
操作需要可以反转而不会丢失任何数据
生成的ASCII字符串应不区分大小写
输入长度应该没有限制
应该允许整个UTF-8范围
我的第一个想法是使用Punycode(IDNA),因为它符合前四个要求,但在最后两个要求失败。
任何人都可以推荐替代编码方案吗?如果有一些代码可以查看,那就更好了。
没有找到相关结果
已邀请:
6 个回复
街茬
孝铜差
铰齐插
蹄渭信妥扳
庞协腿宛炯
刷骸码
(对于idna,python提供另一个同名编码) 很明显,如果你没有对输入进行nameprep,那么编码后的字符串就不再是严格区分大小写了...但是如果你只提供小写(或者如果你不关心解码的情况)你应该好好去