提问人:Andrea 提问时间:9/6/2019 最后编辑:blhsingAndrea 更新时间:9/6/2019 访问量:721
计算列表中的连续出现次数和
Counting sequential occurrences in a list and
问:
我有 3 个列表如下:
L1 = ['H', 'H', 'T', 'T', 'T', 'H', 'H', 'H', 'H', 'T']
L2 = ['H', 'H', 'T', 'T', 'T', 'H', 'H', 'H', 'H', 'T' , 'T', 'H, 'T', 'T', 'T', 'H', 'H', 'H', 'T']
L3 = ['H', 'T', 'H', 'H']
我想计算每个列表中“H”的连续出现次数,并生成下表,显示这些“H”序列的频率:
Length | L1 | L2 | L3
----------------------
1 0 1 1
2 1 1 1
3 0 1 0
4 1 1 0
5 0 0 0
我知道执行以下操作可以让我获得列表中序列的频率:
from itertools import groupby
[len(list(g[1])) for g in groupby(L1) if g[0]=='H']
[2, 4]
但是我需要一种优雅的方式来进一步超越其余列表,并确保为未观察到的长度放置“0”。
答:
3赞
blhsing
9/6/2019
#1
您可以使用从生成器表达式创建一个频率字典,该表达式输出由 生成的序列的长度,然后遍历可能长度的 a 以输出该字典的频率,如果没有频率,则将 0 作为默认值。collections.Counter
itertools.groupby
range
举个例子:L1
from itertools import groupby
from collections import Counter
counts = Counter(sum(1 for _ in g) for k, g in groupby(L1) if k == 'H')
print([counts[length] for length in range(1, 6)])
这将输出:
[0, 1, 0, 1, 0]
0赞
Arkistarvh Kltzuonstev
9/6/2019
#2
这可能会起作用:
from itertools import groupby
a = [len(list(v)) if k=='H' and v else 0 for k,v in groupby(''.join(L1))]
对于列表中没有项的示例,它将返回 。
因为它返回 .
因为它返回 .
因为它返回 .L4 = ['T', 'T']
'H'
[0]
L1
[2, 0, 4, 0]
L2
[2, 0, 4, 0, 1, 0, 3, 0]
L3
[1, 0, 2]
0赞
Mike DeLong
9/6/2019
#3
请试试你的清单在哪里。max([len(x) for x in ''.join(y).split('T')])
y
2赞
Ajax1234
9/6/2019
#4
您可以与以下功能一起使用:itertools.groupby
collections.Counter
import itertools as it, collections as _col
def scores(l):
return _col.Counter([len(list(b)) for a, b in it.groupby(l, key=lambda x:x == 'H') if a])
L1 = ['H', 'H', 'T', 'T', 'T', 'H', 'H', 'H', 'H', 'T']
L2 = ['H', 'H', 'T', 'T', 'T', 'H', 'H', 'H', 'H', 'T' , 'T', 'H', 'T', 'T', 'T', 'H', 'H', 'H', 'T']
L3 = ['H', 'T', 'H', 'H']
d = {'L1':scores(L1), 'L2':scores(L2), 'L3':scores(L3)}
r = '\n'.join([f'Length | {" | ".join(d.keys())} ', '-'*20]+[f'{i} {" ".join(str(b.get(i, 0)) for b in d.values())}' for i in range(1, 6)])
print(r)
输出:
Length | L1 | L2 | L3
--------------------
1 0 1 1
2 1 1 1
3 0 1 0
4 1 1 0
5 0 0 0
评论