优化布尔逻辑树评估

我有很多真/假结果保存为long[]数组中的位。我确实拥有大量的这些（数百万和数百万的长）。例如，假设我只有五个结果，我会：

+----- condition 5 is true
|
|+---- condition 4 is false
||
||+--- condition 3 is true
|||
|||+-- condition 2 is true
||||
||||+- condition 1 is false
10110

我也有一些树代表如下的语句：

condition1 AND (condition2 OR (condition3 AND condition 4))

树很简单但很长。它们基本上看起来像这样（下面是过于简单化，只是为了展示我所拥有的）：

class Node {    
    int operator();
    List<Node> nodes;
    int conditionNumber();    
}

基本上，Node是一个叶子，然后有一个条件号（匹配long []数组中的一个位）或者Node不是叶子，因此引用了几个子节点。它们很简单，但它们允许表达复杂的布尔表达式。它很棒。到目前为止一切都很好，一切都很好。但是我确实有一个问题：我需要评估很多表达式，确定它们是真还是假。基本上我需要对一个问题进行一些暴力计算，而这个问题除了暴力破解之外还没有比这更好的解决方案。所以我需要走树然后回答true或false，具体取决于树的内容和long[]的内容。我需要优化的方法如下所示：

boolean solve( Node node, long[] trueorfalse ) {
   ...
}

在第一次调用时，node是根节点，然后显然是子节点（递归，solve方法调用自身）。知道我只会有几棵树（可能高达一百只左右），但要检查数百万甚至数百万ѭ，我可以采取哪些步骤来优化它？明显的递归解决方案传递参数（（子）树和long []，我可以通过不将它作为参数传递来摆脱long[]）并且对于所有递归调用等都很慢。我需要检查哪个运算符使用（AND或OR或NOT等）并且涉及很多if / else或switch语句。我不是在寻找另一种算法（没有）所以我不是在寻找从O（x）到O（y）的地方，其中y小于x。我正在寻找的是“倍x”加速：如果我能编写速度提高5倍的代码，那么我将获得5倍的加速，就是这样，我会非常满意它。我现在看到的唯一增强 - 我认为与现在相比，它将是一个巨大的“倍x”加速 - 将为每个树生成字节码并将每个树的逻辑硬编码到一个类中。它应该工作得很好，因为我只会有一百棵左右的树（但是树木没有修复：我事先无法知道树木会是什么样子，否则简单地手动硬编码每棵树都是微不足道的）。除了为每棵树生成字节码之外还有什么想法？现在，如果我想尝试字节码生成路由，我应该怎么做呢？

已邀请:

3 个回复

耐钨徒

为了最大化快捷方式评估的机会，您需要进行自己的分支预测。您可能想要对其进行分析，计算 AND分支评估为false OR分支结果为真然后，您可以相对于在分析步骤中找到的权重对树重新排序。如果您希望/需要特别漂亮，您可以设计一种机制，在运行时检测某个数据集的权重，以便您可以动态地重新排序分支。请注意，在后一种情况下，建议不对实际树重新排序（关于存储效率和仍然执行时结果的正确性），而是设计一个能够在本地排序的树节点访问者（遍历算法）分支根据“实时”权重。我希望所有这一切都有道理，因为我意识到散文版是密集的。但是，就像费马说的那样，代码示例太大了，无法适应这个边界:)

淑灯

有一种简单快速的方法来评估C中的布尔运算。假设您要评估z =（x op y），您可以这样做：

 z = result[op+x+(y<<1)];

因此，op将是4的倍数来选择您的操作AND，OR，XOR等，您可以为所有可能的答案创建查找表。如果此表足够小，您可以将其编码为单个值，并使用右移和掩码来选择输出位：

z = (MAGIC_NUMBER >> (op+x+(y<<1))) & 1;

这将是评估大量这些的最快方法。当然，您必须将多个输入的操作拆分为树，其中每个节点只有2个输入。然而，没有简单的方法可以将其短路。您可以将树转换为一个列表，其中每个项目包含操作编号和指向2个输入和输出的指针。一旦进入列表形式，您可以使用单个循环非常快速地吹过一行一百万次。对于小树，这是一个胜利。对于较短的短路树，它可能不是一个胜利，因为需要评估的分支平均数从2到1.5，这对于大树来说是一个巨大的胜利。因人而异。编辑：再想一想，你可以使用类似跳过列表的东西来实现短路。每个操作（节点）将包括比较值和跳过计数。如果结果与比较值匹配，则可以绕过下一个跳过计数值。因此，列表将从树的深度优先遍历创建，并且第一个子项将包括等于另一个子的大小的跳过计数。这为每个节点评估带来了更多的复杂性，但允许短路。仔细实施可以在没有任何条件检查的情况下进行（想想跳过计数的1或0倍）。

桔马牛

我认为你的字节编码理念是正确的方向。不管语言如何，我会做的是写一个预编译器。它将遍历每个树，并使用print语句将其转换为源代码，例如。

((word&1) && ((word&2) || ((word&4) && (word&8))))

每当树木发生变化时，都可以动态编译，并且加载得到的字节代码/ dll，所有这些都需要不到一秒钟。问题是，目前你正在解释树木的内容。将它们转换为编译代码应该使它们运行速度提高10-100倍。添加以回应您对没有JDK的评论。然后，如果你不能生成Java字节代码，我会尝试编写自己的字节码解释器，而不是尽可能快地运行。它可能看起来像这样：

while(iop < nop){
  switch(code[iop++]){
    case BIT1: // check the 1 bit and stack a boolean
      stack[nstack++] = ((word & 1) != 0);
      break;
    case BIT2: // check the 2 bit and stack a boolean
      stack[nstack++] = ((word & 2) != 0);
      break;
    case BIT4: // check the 4 bit and stack a boolean
      stack[nstack++] = ((word & 4) != 0);
      break;
    // etc. etc.
    case AND: // pop 2 booleans and push their AND
      nstack--;
      stack[nstack-1] = (stack[nstack-1] && stack[nstack]);
      break;
    case OR: // pop 2 booleans and push their OR
      nstack--;
      stack[nstack-1] = (stack[nstack-1] || stack[nstack]);
      break;
  }
}

我们的想法是让编译器将开关转换为跳转表，因此它以最小的周期数执行每个操作。要生成操作码，您只需执行树的后缀遍历即可。最重要的是，您可以通过对De Morgan法则的一些操纵来简化它，因此您可以一次检查多个位。

要回复问题请先登录或注册

优化布尔逻辑树评估

3 个回复

发起人

bytecode_manipulation

optimization

boolean_logic

问题状态

优化布尔逻辑树评估

与内容相关的链接

3 个回复

发起人

bytecode_manipulation

optimization

boolean_logic

问题状态