Data Structures Algorithms 简明教程

Set Cover Problem

*集合覆盖算法为许多现实世界的资源分配问题提供了解决方案。举例来说,考虑一下航空公司为每一架飞机分配机组人员,以确保他们有足够的人员来满足旅程的要求。他们考虑的是飞行时间、持续时间、短途停留以及机组人员的可用性,以便将他们分配到航班上。集合覆盖算法就是这样产生的。

给定一个包含一些元素的全集 U,这些元素都被划分为子集。考虑到这些子集的集合为 S = {S1、S2、S3、S4…​Sn},集合覆盖算法找到最少的子集数,以便它们覆盖全集中的所有元素。

universal set

如上图所示,点表示存在于全集 U 中的元素,这些元素被划分为不同的集合,S = {S1、S2、S3、S4、S5、S6}。需要选择以覆盖所有元素的最少数目集合将是最佳输出 = {S1、S2、S3}。

Set Cover Algorithm

集合覆盖将集合的集合作为输入,并返回包含所有全集元素所需的最小集合数量。

*集合覆盖算法是一个 NP-Hard 问题和一个 2-逼近贪心算法。

Algorithm

步骤 1- 初始化 Output = {},其中 Output 表示元素的输出集合。

步骤 2− 虽然输出集未包括泛型集合中的所有元素,但请执行以下操作 −

  1. 使用公式计算泛型集合中每个子集的成本效益,$\frac{花费\left ( S_{i} \right )}{S_{i}-输出}$

  2. 为每次执行的迭代找到具有最低成本效益的子集。将该子集添加到输出集中。

步骤 3− 重复步骤 2,直到泛型集中没有剩余元素。获得的输出为最终的输出集。

Pseudocode

APPROX-GREEDY-SET_COVER(X, S)
   U = X
   OUTPUT = ф
   while U ≠ ф
      select Si Є S which has maximum |Si∩U|
   U = U – S
   OUTPUT = OUTPUT∪ {Si}
return OUTPUT

Analysis

假设元素的总体数量等于集合的总体数量(| X | = | S |),则代码运行时间为 O(| X | 3)

Example

set cover algorithm 2

让我们详细了解一个示例,该示例描述了集合覆盖问题的近似算法

S1 = {1, 2, 3, 4}                cost(S1) = 5
S2 = {2, 4, 5, 8, 10}            cost(S2) = 10
S3 = {1, 3, 5, 7, 9, 11, 13}     cost(S3) = 20
S4 = {4, 8, 12, 16, 20}          cost(S4) = 12
S5 = {5, 6, 7, 8, 9}             cost(S5) = 15

Step 1

输出集,输出 = ∅

为输出集中不存在元素的每个集合找到成本效益,

S1 = cost(S1) / (S1 – Output) = 5 / (4 – 0)
S2 = cost(S2) / (S2 – Output) = 10 / (5 – 0)
S3 = cost(S3) / (S3 – Output) = 20 / (7 – 0)
S4 = cost(S4) / (S4 – Output) = 12 / (5 – 0)
S5 = cost(S5) / (S5 – Output) = 15 / (5 – 0)

此迭代中的最低成本效益在 S1 上实现,因此,添加到输出集的子集,输出 = {S1},包含元素 {1、2、3、4}

Step 2

为输出集中新元素找到每个集合的成本效益,

S2 = cost(S2) / (S2 – Output) = 10 / (5 – 4)
S3 = cost(S3) / (S3 – Output) = 20 / (7 – 4)
S4 = cost(S4) / (S4 – Output) = 12 / (5 – 4)
S5 = cost(S5) / (S5 – Output) = 15 / (5 – 4)

此迭代中的最低成本效益在 S3 上实现,因此,添加到输出集的子集,输出 = {S1、S3},包含元素 {1、2、3、4、5、7、9、11、13}。

Step 3

为输出集中新元素找到每个集合的成本效益,

S2 = cost(S2) / (S2 – Output) = 10 / |(5 – 9)|
S4 = cost(S4) / (S4 – Output) = 12 / |(5 – 9)|
S5 = cost(S5) / (S5 – Output) = 15 / |(5 – 9)|

此迭代中的最低成本效益在 S2 上实现,因此,添加到输出集的子集,输出 = {S1、S3、S2},包含元素 {1、2、3、4、5、7、8、9、10、11、13}

Step 4

为输出集中新元素找到每个集合的成本效益,

S4 = cost(S4) / (S4 – Output) = 12 / |(5 – 11)|
S5 = cost(S5) / (S5 – Output) = 15 / |(5 – 11)|

此迭代中的最低成本效益在 S4 上实现,因此,添加到输出集的子集,输出 = {S1、S3、S2、S4},包含元素 {1、2、3、4、5、7、8、9、10、11、12、13、16、20}

Step 5

为输出集中新元素找到每个集合的成本效益,

S5 = cost(S5) / (S5 – Output) = 15 / |(5 – 14)|

此迭代中的最低成本效益在 S5 上实现,因此,添加到输出集的子集,输出 = {S1、S3、S2、S4、S5},包含元素 {1、2、3、4、5、6、7、8、9、10、11、12、13、16、20}

覆盖泛有限集合中所有元素的最终输出为,输出 = {S1、S3、S2、S4、S5}。

Implementation

以下是以上方法在各种编程语言中的实现 −