在 Python 中找到一些文本后如何阅读某些行？-解网

问：

我正在阅读一个巨大的文件，其中包含包含我需要的信息的文本块。查找该信息的唯一方法是搜索该信息的“标题”。这是一个简单的解决方案："text"

line1 = f.readline()
if "text" in line1:
  print(":)")

但是，我需要接下来的 14 行文本中的信息（具体来说，我需要找到的行之后的第 3、12、14 和 15 行）。目前我正在使用"text"

line2 = f.readline()
line3 = f.readline()
...
line15 = f.readline()

但这似乎效率极低。有没有更简洁的方法？我还需要能够遍历它，找到的每个实例，以及后面的信息。非常感谢"text"

蟒蛇读取线

rl = []
with opne("your_file") as fd:
  cnt = 25 #let's start outside required line number after text
  for l in fd.readlines():
     cnt += 1
     if "text" in l: # "text" in your line
       cnt = 0       # reset counter
     elif cnt in [3,12,13,14,15]: # if counter is one of lines you want
       rl.append(l)               # record them
print rl

1赞 0xsx 7/14/2018 #2

我通常使用一个循环来做这样的事情，里面嵌套了一个循环：whilefor

with open(filename) as f_in:
  while True:
    line = f_in.readline().strip()
    if not line:
      break
    if line == "text":
      data = [f_in.readline().strip() for i in range(15) if i in [2, 11, 13, 14]]

这样可以避免在处理文件之前加载整个文件，如果数据段之间可能有不需要加载的额外行，但只有在没有重叠段的情况下才能正常工作，则此功能尤其有用。

请注意，此代码将从行中去除前导和尾随空格。如果只想删除尾随空格，则可以改用。如果您想完全避免更改行，您可以尝试使用前缀匹配或简单地在您的条件中包含换行符。rstrip()startswith()

lineno = 0
needed = [3, 12, 14, 15] # This may need adjusting to allow for lineno running from 1
found_at = None
for line in open('filename.txt').readlines():  # This will read blocks of lines for speed
    lineno += 1  # Human readable line numbers
    if found_at:
        if (lineno - found_at) in needed:
            print(lineno, line)
        elif (lineno - found_at) > max(needed):
            found_at = None
    elif text in line:
        found_at = lineno

您也可以使用复杂的正则表达式，但可能不值得花时间构建一个正则表达式，而且不太清楚。

上一个：interpolate.splev 错误：“前三个参数（x，y，w）的长度必须相等”

下一个：如何在NetworkX中找到有向路径？

在 Python 中找到一些文本后如何阅读某些行？

How to read certain lines after you find some text in Python?

评论

评论