🎩 一场关于布尔矩阵分解的「委托—降级」魔术秀

引言：布尔矩阵的迷雾

在数学的舞台上，布尔矩阵分解（BMF）就像是一场复杂的魔术表演。我们试图将一个 $n \times m$ 的布尔矩阵 $X$ 表现为两个小秩矩阵 $A$ 和 $B$ 的布尔乘积 $A \circ B$，其中「乘法」是通过逻辑「与」操作完成，而「加法」则通过逻辑「或」来实现。然而，寻找一个最小秩的 BMF 是一个众所周知的 NP-hard 问题，这就像在马戏团里寻找失踪的小丑，挑战重重！

在我们的研究中，我们提出了一种新方法，通过减少矩阵中 1 的数量来简化待分解矩阵，这样就可以直接从其简化版本中恢复出原始矩阵的布尔分解。我们引入了两种简化类型：一种进行大量简化但不保留原始秩，另一种则进行较少的简化，但保证在简化矩阵上得到的最优 BMF 能够反映在原始矩阵上。

🧩 理论基础：布尔矩阵分解的构建模块

为了更好地理解我们的简化过程，我们需要明白布尔乘积的定义。给定两个完整的矩阵 $A$ 和 $B$，它们的布尔乘积 $(A \circ B. {i,j}$ ✅定义为：

$(A \circ B){i,j} = \bigvee_{k=1}^{r} (A_{i,k} \land B_{k,j})$

这里的 $r$ 是矩阵的秩。这个定义与经典的矩阵乘法相似，只是乘法和加法被逻辑操作取代了。

在 BMF 问题中，我们需要找到一组块来覆盖矩阵的所有 1，并且不覆盖任何 0。为了完成这个目标，我们的研究从行和列的包含性出发，重新审视了矩阵简化的概念。

🔍 委托—降级操作：简化的艺术

我们引入了「委托」（delegation）和「降级」（relegation）两个操作，以简化矩阵的结构。具体来说，假设有两行 $v$ 和 $w$，如果行 $v$ 存在于行 $w$ 中，则可以将行 $w$ 中的某些 1 替换为缺失值（用「∅」表示），从而简化矩阵的结构。这种方法不仅能减少计算复杂度，还能在后续的 BMF 处理中提供更快的运行时间。

委托与降级的定义

委托：行 $v$ 委托给行 $w$，表示为 $X_{v \downarrow w}$，其定义为：
$X_{v \downarrow w, i,j} =\begin{cases}0 & \text{if } i = v \text{ and } X_{w,j} = 0 \\emptyset & \text{if } i = w \text{ and } X_{v,j} = 1 \X_{i,j} & \text{otherwise}\end{cases}$
降级：行 $w$ 从行 $v$ 中降级，表示为 $A_{v \uparrow w}$，其定义为：
$A_{v \uparrow w, i,j} =\begin{cases}1 & \text{if } i = w \text{ and } A_{v,j} = 1 \A_{i,j} & \text{otherwise}\end{cases}$

通过这些定义，我们能够从简化矩阵得到原始矩阵的 BMF，从而在计算上实现显著的加速。

📊 实验结果：简化的力量

我们在 C++ 中实现了上述算法，并在经典和合成数据集上进行了大量实验。实验结果显示，通过我们的简化算法，矩阵中的 1 数量显著减少，计算时间也得到了显著提升。

经典数据集的表现

在经典数据集的实验中，我们与现有的简化算法 Iteress 进行了比较。结果显示，我们的算法 Simpli∃ 和 Simpli∀ 在减少 1 的数量上表现优异。例如，在「Breast Cancer」数据集中，原始矩阵中的 6516 个 1 经简化后减少至 4153 个，而 Iteress 的结果则不尽如人意，无法达到同样的效果。

合成数据集的表现

在合成数据集的实验中，我们的简化算法在不同的密度和秩条件下均表现良好。对于 $1000 \times 500$ 的矩阵，当秩为 20 时，经过简化后，1 的数量从 3218 减少至 20，计算时间也从 3 小时减少至几秒。这一结果充分证明了我们的方法在大规模数据集上的有效性。

🎉 结论：简化带来的革命

综上所述，我们的研究表明，布尔矩阵的简化不仅在计算上提供了便利，更在实际应用中展示了其重要性。通过引入「委托—降级」操作，我们成功地将复杂的 BMF 问题转化为更易处理的形式。我们期待未来在这一领域的进一步探索和应用，或许下一次的魔术秀将会更加精彩！

参考文献

Avellaneda, F. , & Villemaire, R. (2024). Delegation-Relegation for Boolean Matrix Factorization. AAAI Conference on Artificial Intelligence.✅
Ganter, B. , & Wille, R. (2012). Formal Concept Analysis: Mathematical Foundations.✅
Miettinen, P. , & Neumann, M. (2020). Boolean Matrix Factorization: Algorithms and Applications.✅
Kovacs, G. , Gunluk, O., & Hauser, D. (2021). Optimal Boolean Matrix Factorization via Constraint Programming.✅
Belohlavek, R. , & Trnecka, J. (2015). GreEss: A New Algorithm for Boolean Matrix Factorization.✅