出于缓存原因规范化布尔表达式。有没有比真值表更有效的方法？-解网

问：

我目前的项目是一个具有布尔检索功能的高级标签数据库。使用布尔表达式查询记录，如下所示（例如，在音乐数据库中）：

funky-music and not (live or cover)

这应该在音乐数据库中产生所有时髦的音乐，但不能产生歌曲的现场或翻唱版本。

当涉及到缓存时，问题在于存在等效但结构不同的查询。例如，应用 de Morgan 规则，上面的查询可以这样写：

funky-music and not live and not cover

这将产生完全相同的记录，但当缓存通过对查询字符串进行哈希处理来实现时，会导致中断缓存。

因此，我的第一个意图是创建一个查询的真值表，然后可以将其用作缓存键，因为等效表达式构成了同一个真值表。不幸的是，这是不切实际的，因为真值表随着输入（标签）的数量呈指数增长，我不想限制一个查询中使用的标签数量。

另一种方法是遍历语法树，应用布尔代数定义的规则来形成（最小）规范化表示，这似乎也很棘手。

因此，总体问题是：有没有一种可行的方法可以实现对等效查询的识别，而不需要电路最小化或真值表（编辑：或任何其他NP硬算法）？

ne plus ultra 将识别已经缓存的子查询，但这不是主要目标。

算法规范化遍历布尔逻辑

创建您提到的那些形式还涉及创建真值表。因此，我可以简单地使用真值表的规范化形式（输入和组合排序）的哈希值作为缓存键。似乎最好的方法是为涵盖少于 10 个标签左右的查询创建一个“最佳”哈希值，而对于包含更多标签的查询，则创建一个更简单但不是最佳算法的哈希值。

0赞 mcdowella 5/2/2011

您应该能够纯粹象征性地获得这些形式中的任何一种。给定任何两种形式的表达式，您可以通过 AND 或 OR 计算出组合这些表达式的结果，结果将采用相同的形式。你可以用 NOT 做同样的事情。在某些情况下，结果会很复杂，但这是可能的。对于 BDD，应该有库来做到这一点 - 例如参见 javabdd.sourceforge.net/apidocs/net/sf/javabdd/BDD.html。因此，您可以通过组合各个变量的表示来构建表示。

0赞 user733321 5/2/2011

但我看不出这将如何规避对 NP 完备算法的需求。

1赞 Antti Huima 5/2/2011 #2

您可以将查询转换为连词范式（CNF）。它是布尔公式的规范、简单表示，通常是 SAT 求解器的基础。

最有可能的是，“大型”查询将有很多连词（而不是很多不连词），因此 CNF 应该可以很好地工作。

出于缓存原因规范化布尔表达式。有没有比真值表更有效的方法？

normalize boolean expression for caching reasons. is there a more efficient way than truth tables?

评论

评论

评论

评论