从输入流中提取最后 n 个字节的良好通用技术有哪些-解网

问：

假设我有一个长度未知的输入字节的二进制流，以可识别的类似 EOF 的条件结尾，那么有哪些算法可以提取最后一个字节，比如 8 个字节，并以与其余输入不同的方式处理它们？假设没有任何很好的实现特定功能，例如寻找到最后，或倒带流或调用tac。假设输入可能大于 RAM，因此完全缓冲将失败。

对于文件或字段的第一个字节，这非常简单：消耗那么多字节并根据需要处理它们。但对于最后一个字节，算法似乎更容易出错。

我过去通过构建一个 2 段循环缓冲区并在确认未达到 EOF 后才处理最旧的段来做到这一点。

while not end of STREAM
    read n bytes from STREAM and place in open segment
        set m to number of bytes actually read
    if end of STREAM
        o = n - m
        process first m bytes normally from older segment
        process last o bytes from older segment specially
        process first m bytes from newer segment specially
    else
        process n bytes from older segment normally
        declare older segment open

这不仅仅是由极端情况组成，它是由极端情况组成的。有没有其他算法可以更安全地避免实现错误？或者有没有更好的方法来做这个算法？

算法 IO 流语言无关

是的，没错。需要注意的一点是，缓冲区需要足够大，以便副本不会占处理时间的很大一部分。我将这种技术用于嵌入式系统上的 HTTP 服务器。HTTP 标头由文本行组成，其中既不知道行的长度，也不知道行数。我使用了 1KB 的缓冲区，同时假设平均行约为 40 字节。这样，代码可以处理大约 25 行，然后复制大约 40 个字节并重新填充缓冲区。因此，平均一行大约有 2 个字节的复制开销。

答： 暂无答案

上一个：在 c++ 中读取文件时打印两次最后一个值 [duplicate]

下一个：如何将 python IO 流合并到单个迭代器中，但维护哪个项目来自哪个流？

从输入流中提取最后 n 个字节的良好通用技术有哪些

What are good general techniques to extract the last n bytes from a stream of input

评论