通过python读取hadoop序列文件
作者:vot3tada 提问时间:11/4/2023
我需要使用 python 3.8 读取序列文件。我该怎么做?我正在使用 pyarrow 库连接到 hdfs。 我也刚刚尝试解码文件,但它解码时出错了。它不能被 utf-8 解码。CP1251 无法全...
pyarrow 问答列表
作者:vot3tada 提问时间:11/4/2023
我需要使用 python 3.8 读取序列文件。我该怎么做?我正在使用 pyarrow 库连接到 hdfs。 我也刚刚尝试解码文件,但它解码时出错了。它不能被 utf-8 解码。CP1251 无法全...
作者:Chris Wood 提问时间:9/6/2021
我是 Python 和 Pandas 的新手 - 请温柔一点! 我正在将 SqlAlchemy 与 pymssql 一起使用,以对 SQL Server 数据库执行 SQL 查询,然后将结果集转换为...
作者:MKG 提问时间:11/6/2022
我正在尝试开发一个 c# 客户端代码,以使用基本身份验证使用 Apache Arrow Flight 查询数据,但到目前为止还没有成功。 如果有人可以分享工作样本,我将不胜感激。 谢谢 马诺伊·乔...
作者:Phani Varanasi 提问时间:6/11/2023
我可以创建一个可以公开客户端可以调用的自定义端点的 pyarrow 飞行服务器吗? 我只看到do_get方法返回pyarrow表的代码。 客户端可以传递可用于在服务器端过滤数据并返回过滤后的箭头表的参...
作者:Adrien Pacifico 提问时间:8/21/2023
在 pandas 中,我可以通过以下方式使用 pyarrow dtype 创建一个系列: >>> import pandas as pd >>> s = pd.Series([1,2,3]).as...
作者:dom159 提问时间:10/28/2023
我有这段代码,我用来在 Dremio 中使用 pyarrow flight 执行查询: class DremioConnector: env: str auth_token: str def...
作者:altabq 提问时间:10/27/2023
我正在使用 PyArrow Flight 在 Exasol 上阅读和编写表格。我注意到一个问题,即空字符串在飞行过程中被转换为 NULL。当我写一个pa。包含 “” 列的表到 Exasol,生成的表包...
作者:conradlee 提问时间:11/14/2023
我想编写一个存储在类似 dataframe 的对象(例如 pandas dataframe、duckdb 表、pyarrow 表)中的表,该表采用 proom 分区和集群格式。这就是我的意思 Hiv...
作者:theakson 提问时间:11/16/2023
刚开始使用 pandas 2 并想使用箭头后端,但它没有从 csv 转换日期字段。在 csv 中,date2 的格式为“10/18/2006”,称为 date2。为什么会发生这种情况,我怎样才能将da...