pyarrow 问答列表

通过python读取hadoop序列文件

作者:vot3tada 提问时间:11/4/2023

我需要使用 python 3.8 读取序列文件。我该怎么做?我正在使用 pyarrow 库连接到 hdfs。 我也刚刚尝试解码文件,但它解码时出错了。它不能被 utf-8 解码。CP1251 无法全...

使用 Parquet 文件处理 Arrow 中的 UUID 值

作者:Chris Wood 提问时间:9/6/2021

我是 Python 和 Pandas 的新手 - 请温柔一点! 我正在将 SqlAlchemy 与 pymssql 一起使用,以对 SQL Server 数据库执行 SQL 查询,然后将结果集转换为...

来自 C# 客户端的 Apache Arrow 飞行 SQL

作者:MKG 提问时间:11/6/2022

我正在尝试开发一个 c# 客户端代码,以使用基本身份验证使用 Apache Arrow Flight 查询数据,但到目前为止还没有成功。 如果有人可以分享工作样本,我将不胜感激。 谢谢 马诺伊·乔...

Pyarrow 飞行服务器,用于公开自定义终结点

作者:Phani Varanasi 提问时间:6/11/2023

我可以创建一个可以公开客户端可以调用的自定义端点的 pyarrow 飞行服务器吗? 我只看到do_get方法返回pyarrow表的代码。 客户端可以传递可用于在服务器端过滤数据并返回过滤后的箭头表的参...

使用 pyarrow dtype 创建 dask 数组

作者:Adrien Pacifico 提问时间:8/21/2023

在 pandas 中,我可以通过以下方式使用 pyarrow dtype 创建一个系列: >>> import pandas as pd >>> s = pd.Series([1,2,3]).as...

pyarrow 飞行错误:关闭前无法完成写入

作者:dom159 提问时间:10/28/2023

我有这段代码,我用来在 Dremio 中使用 pyarrow flight 执行查询: class DremioConnector: env: str auth_token: str def...

PyArrow Flight:pa中的空字符串。读取/写入 Exasol 时将表转换为 NULL

作者:altabq 提问时间:10/27/2023

我正在使用 PyArrow Flight 在 Exasol 上阅读和编写表格。我注意到一个问题,即空字符串在飞行过程中被转换为 NULL。当我写一个pa。包含 “” 列的表到 Exasol,生成的表包...

Python:将数据集写入为蜂巢分区和集群 parquet 文件(无 JVM)

作者:conradlee 提问时间:11/14/2023

我想编写一个存储在类似 dataframe 的对象(例如 pandas dataframe、duckdb 表、pyarrow 表)中的表,该表采用 proom 分区和集群格式。这就是我的意思 Hiv...

Pandas 2 Pyarrow 未转换日期“2006 年 10 月 18 日”

作者:theakson 提问时间:11/16/2023

刚开始使用 pandas 2 并想使用箭头后端,但它没有从 csv 转换日期字段。在 csv 中,date2 的格式为“10/18/2006”,称为 date2。为什么会发生这种情况,我怎样才能将da...


共9条 当前第1页