命名dict键,以便在python中快速查找

| 我将拥有1个小词典(5到20个键之间),对于python 2.5中的一页加载,该词典最多可以引用一百次左右。 我开始命名将要查找的键,我想知道是否可以遵循键命名约定来帮助确定查询时间。     
已邀请:
        我不得不测试;-) 使用 f1,整数键
1
f2短弦,
\"one\"
f3长弦
\"aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa\"
作为长度为4的字典的键之一。迭代10,000,000次并测量该时间。我得到这个结果:
<function f1 at 0xb779187c>
f1 3.64
<function f2 at 0xb7791bfc>
f2 3.48
<function f3 at 0xb7791bc4>
f3 3.65
即没有区别... 我的密码     
        对于他们来说,可能有一些明智的名称,恰好会产生其哈希没有冲突的名称。但是,CPython字典已经是已知Universe中最优化的数据结构之一,对于大多数输入几乎不产生冲突,可以与其他内置类型的哈希方案配合使用,非常快地解决冲突等。您极不可能即使您找到了任何东西,也不会发现任何好处,尤其是因为一百次查找的次数并不多。 例如,这个timeit基准运行在我使用了4年的台式机上(运行3.1 GHz的低预算双核CPU,可笑):
...>python -mtimeit --setup=\"d = {chr(i)*100: i for i in range(15)};\\
k = chr(7)*100\" \"d[k]\"

1000000 loops, best of 3: 0.222 usec per loop
这些字符串比手动将其作为变量名手动键入的所有内容大十二倍。将长度从100减少到10导致每次查找为0.0778微秒。现在,测量页面的加载速度并进行比较(或者,只需考虑构建页面时实际要花多长时间);并考虑缓存,框架开销以及所有这些因素。 在这方面,您所做的任何事情都不会影响性能,周期和句号。     
        因为Python字符串哈希函数会遍历字符(至少在仍然适用时),所以我会选择短字符串。     
        要添加另一个方面: 对于很小的字典和沉重的时序约束,计算散列的时间可能占整个时间的大部分。因此,对于(比如说)5个元素,使用数组和顺序搜索(当然,包含在某些MiniDictionary对象中)可能更快,甚至可以通过二进制搜索来增强。这可能会发现具有2-3个比较的元素,这可能会或可能不会比哈希算术加一个比较快。 收支平衡取决于哈希速度,元素的平均数量和预期的哈希冲突次数,因此需要进行一些测量,并且没有“一刀切”的答案。     
        Python字典为字符串键提供了快速路径,因此请使用它们(而不是元组)。字符串的哈希值将缓存在该字符串中,因此,字符串保持相同的值比其实际值更为重要。字符串常量(即在程序中逐字出现而不是计算结果的字符串)始终保持完全相同,因此只要您使用它们,就不必担心。     

要回复问题请先登录注册