在 Python 中读取 EBCDIC 文件

Read EBCDIC file in Python

提问人:Veronica Guzman 提问时间:9/19/2023 最后编辑:Veronica Guzman 更新时间:9/19/2023 访问量:77

问:

我一直在尝试读取 .ebc 文件,但无法读取。我想将其保存为 .csv 或 txt 文件。(我是这种文件格式的新手,所以不确定如何前进)

这是该文件的描述,数据可在此处公开获得(在地下注入控制数据下)

我已经尝试了这些线程,但没有任何效果: 读取大型机EBCDIC文件,如何通过python在笔记本电脑上打开.ebc(ebcdic)文件? 转换 EBCDIC 文件 到 ASCII 使用 Python 2

1、不打印任何东西:

import codecs

with open("uif700a.txt", "rb") as ebcdic:
    ascii_txt = codecs.decode(ebcdic.read(), "cp500")
    print(ascii_txt)

2、不打印任何东西

with open("uif700.ebc", encoding='cp500') as f:
    print(f.read())

3,文件也可以作为ASCII使用,所以我尝试了:

data = pd.read_csv('uif700a.txt', on_bad_lines='skip', encoding = "cp037",header=None)

EmptyDataError:没有要从文件中分析的列

python 文件 解码 ebcdic

评论

0赞 jasonharper 9/19/2023
“unable to” 是什么意思?在尝试使用这些不同的解决方案时,您遇到了什么确切的问题?
0赞 anatolyg 9/19/2023
如果那里没有任何工作,你认为为什么这里有什么工作?您应该提供其他信息,以便有机会使其正常工作。我不知道是哪些信息;有关提示,请参阅最小可重现示例
0赞 Veronica Guzman 9/19/2023
@jasonharper 我添加了几个示例。谢谢!
0赞 jasonharper 9/19/2023
该数据集有 EBCDIC 和 ASCII 版本 - 为什么不使用 ASCII 版本?
0赞 Veronica Guzman 9/19/2023
@jasonharper我还尝试使用编码“cp500”和“cp037”通过熊猫读取 ASCII。我收到错误:“EmptyDataError:没有要从文件中解析的列”,

答: 暂无答案