在 Python 上过滤重复序列 [duplicate]-解网

问：

获取文件中的重复行（3 个答案）

上个月关闭。

我有一个这样的 txt 文件：

GAACACGAAGGACGC
GAACACGAAGGACGC
GAACACGAAGGACGC
GAACACGAAGGACGC
GAACACGAAGGACGC
TCTAAGTAGTCAAAA
TCTAAGTAGTCAAAA
TCTAAGTAGTCAAAA
TCTAAGTAGTCAAAA
TCTAAGTAGTCAAAA
TCTAAGTAGTCAAAA
ACGGTGGGAATAAGA
ACGGTGGGAATAAGA
ACGGTGGGAATAAGA
ACGGTGGGAATAAGA
ACGGTGGGAATAAGA
GGGGCGATAATTTGC
GGGGCGATAATTTGC
GGGGCGATAATTTGC
GGGGCGATAATTTGC
GGGGCGATAATTTGC
GGGGCGATAATTTGC

我想过滤掉重复六次的序列并将它们保存在 txt 文件中。我怎样才能在 Python 上做到这一点？对不起，如果这是一个愚蠢的问题。

先谢谢你

我试过了：

ids = open('IDs.txt', 'r')

for id in ids:
    if id is ...

最大的问题是 txt 文件有超过 100k 个唯一序列。我不能一个接一个地去。这就是我被困在这里的原因

python 筛选器序列

在 Python 上过滤重复序列 [duplicate]

Filter repetitive sequences on Python [duplicate]

评论

评论