在具有相同域的大量集合上执行子集测试操作的最快方法
假设我们在某处存储了数万亿个集合。每个集合的域都是相同的。它也是有限的和离散的。因此,每个集合可以存储为相对较短长度的比特字段(例如:0000100111 ...)(例如:1024)。也就是说,位域中的位X指示项目X(1024个可能的项目)是否包括在给定集合中。
现在,我想设计一个存储结构和算法来有效地回答查询:数据存储中的哪些集合将Y设置为子集。集合Y本身不存在于数据存储中,并在运行时指定。
现在解决这个问题的最简单方法是将数据存储器中每组的位字段与集合Y的位字段逐一进行AND运算,选择其AND结果与Y的位域匹配的位。
我怎样才能加快速度呢?是否有树结构(索引)或一些智能算法,允许我执行此查询而无需AND每个存储集的位域?
是否有数据库已经支持大型集合上的此类操作?
没有找到相关结果
已邀请:
6 个回复
爆山
谷靛
抬澈帅沮
门锑腺潮
骚瓤
哭木算