从集列表中删除重复项

Removing Duplicates from a list of sets

提问人:Tring Vu 提问时间:12/21/2012 最后编辑:David GTring Vu 更新时间:12/21/2012 访问量:1092

问:

我正在实现著名的“集合的子集”问题。我想我得到了一个很好的工作解决方案,但它包含重复项。我希望 list.unique() 能够解决这种情况,但由于对于集合,== 运算符未定义,因此它不起作用。一组集合也不能解决这种情况(现在使用集合列表)。

有了 80% 的完整解决方案,我意识到有一种比我提供的算法更好的算法。但是我想知道是否有一种聪明的方法可以在不完全重写算法的情况下删除重复项?

这是我的代码:

主要。CPP:

#include "random.hpp"

using namespace std;

int main(void) {

    subsets2();

    getchar();
    return 0;
}

随机.Cpp:

void getSubsets2(set<int> myset, list<set<int> > * ptr, int length) {

    if (length == 1) {
        ptr->push_back(myset);
    }

    else {
        set<int> second(myset);
        set<int>::iterator it;
        ptr->push_back(myset);

        it = myset.begin();
        myset.erase(it);
        it = second.begin();
        ++it;
        second.erase(it);

        getSubsets2(myset, ptr, length - 1);
        getSubsets2(second, ptr, length - 1);
    }
}

void subsets2(void) {
    const int N = 4;
    int myints[N] = {
        88, 33, 23, 22
    };
    set<int> myset(myints, myints + N);
    set<int> set2;

    list<set<int> > mylist;

    list<set<int> > * ptr;
    ptr = & mylist;

    list<set<int> > ::iterator it;
    set<int>::iterator it2;

    getSubsets2(myset, ptr, N);
    mylist.unique();


    for (it = mylist.begin(); it != mylist.end(); ++it) {
        set2 = * it;
        for (it2 = set2.begin(); it2 != set2.end(); ++it2) {
            cout << * it2 << " ";
        }
        cout << "\n";
    }

}

输出:

        22 23 33 88
        23 33 88
        33 88
        88
        33
        23 88
        88
        23
        22 33 88 
        33 88
        88
        33
        22 88
        88
        22
C++ 算法 std

评论

0赞 Yuushi 12/21/2012
还有一个定义的列表。当然,unique 只会删除列表中彼此“相邻”的元素。template <class BinaryPredicate> void unique (BinaryPredicate binary_pred);
0赞 Code-Apprentice 12/21/2012
删除重复项听起来像是解决更严重问题的创可贴。为什么您的代码首先要创建重复项?针对此问题的良好算法应避免完全创建重复项。

答:

3赞 billz 12/21/2012 #1

Unique() 从容器中删除所有重复的元素。因此,在运行 unique() 之前,需要先对 mylist 进行排序。consecutive

   mylist.sort();
   mylist.unique();
1赞 Yuushi 12/21/2012 #2

就像为所有标准容器定义了另一种执行此操作的方法一样。因此,我们可以定义如下:std::less<T>

std::set<std::set<int>, std::less<std::set<int>>> set_of_sets;

这将自动过滤掉重复的集。一个完整的例子:

#include <set>
#include <vector>
#include <iostream>
#include <functional>

int main()
{
    std::vector<std::vector<int>> x = {{1,2,3}, {1,2}, {1,2,3}, {4,5,6},
                                       {4,5}, {5,6}, {4,5,6}};
    std::set<std::set<int>, std::less<std::set<int>>> set_of_sets;

    for(auto it = x.begin(); it != x.end(); ++it) {
        std::set<int> s;
        s.insert(it->begin(), it->end());
        set_of_sets.insert(s);
    }

    for(auto it = set_of_sets.begin(); it != set_of_sets.end(); ++it) {
        std::cout << "{";
        for(auto it2 = it->begin(); it2 != it->end(); ++it2) {
            std::cout << *it2 << ", ";
        }
        std::cout << "}\n";
    }

    return 0;
}
1赞 perreal 12/21/2012 #3

使用字符串列表存储最终结果:

    list<string> uniq_list;
    for (it = mylist.begin(); it != mylist.end(); ++it) {
        set2 = * it; 
        stringstream ss; 
        for (it2 = set2.begin(); it2 != set2.end(); ++it2) {
            ss << * it2 << " ";
        }
        uniq_list.push_back(ss.str());
    }   
    uniq_list.sort();
    uniq_list.unique();
    for (list<string>::iterator it=uniq_list.begin(); it != uniq_list.end(); it++){
      cout << *it << endl;
    }