压缩具有已知概率分布的符号的最佳熵编码方案是什么?
|
我正在寻找在很长的通话记录列表中对user_ids进行编码的方法。这些记录中占用最多空间的部分是呼叫者和接收者的符号。我将创建一个映射,为最活跃的调用者分配较短的符号-这将有助于减小文件的整体大小(以及I / O时间)。
我预先知道每个符号将使用多少次-换句话说,我知道相对概率分布。此外,所产生的代码是“无前缀的”(例如霍夫曼代码)并不重要。那么最佳的编码方案是什么,即能提供最大压缩率并且可以快速实现的编码方案?
答案不仅应指向压缩方案,还应指向该编码方案的实现。
没有找到相关结果
已邀请:
2 个回复
梆晨灸碾
抽法