Vaex 问答列表

有效地将 numpy 矩阵转换为 Vaex DataFrame

作者:Dave Liu 提问时间:3/10/2023

我正在尝试将我的宽(100K+ 列)2D numpy 数据转换为 Vaex Dataframe。我正在阅读文档,看到两个相关功能: from_items from_arrays 但两者都给了我一...

vx.from_pandas(df).export_hdf5(path) 在将 pandas df 写入 HDF5 文件时给出 KeyError

作者:ConfusedBlackBox 提问时间:8/1/2023

软件信息 Vaex 版本 : 4.1.0 Vaex 是通过以下方式安装的:来自源代码的 pip 操作系统: Windows Server 2016 Python 版本:Python 3.9.7...

大型数据帧头部期间出现 VAEX 错误

作者:euh 提问时间:2/3/2023

我正在尝试使用 vaex 作为 pandas 的替代品来合并字符串列上的超大数据帧(100k 行 + 176m 行)。 似乎没有任何错误,我什至可以检查结果数据框,但是当我尝试结果时,会返回一个大错...

Vaex 将 csv 转换为 feather 而不是 hdf5

作者:afriedman111 提问时间:4/13/2023

vaex 是否提供将文件转换为格式的方法?我已经查看了文档和示例,它似乎只允许转换为格式。我看到 DataFrame 有一个函数,但看起来它只在不同的数组类型之间转换。.csv.feather.hdf...

导入 vaex 错误:PydanticImportError:“BaseSettings”已移至“pydantic-settings”包

作者:Kailash M S 提问时间:7/12/2023

我正在使用 Sagemaker 笔记本,导入 vaex 时出现以下错误。我使用的 vaex 版本是 4.16.0 PydanticImportError:已移至包中。有关详细信息,请参阅 https...

在 vaex 中构建 3D 阵列以进行过滤的最快方法

作者:lemontrack 提问时间:9/12/2023

我有一个应用程序,我正在处理一个大型 3 维数组,其中包含一个映射到地理位置的索引(~10k 唯一值)、一个时间戳(一整年每小时一次,导致 ~9k 个值)以及每个索引和时间戳的 ~20 个不同值。这些...

在 Python Polars 中将函数应用于列内存不足

作者:Lionel Peer 提问时间:1/11/2023

我有一个大型 GIS 数据集 (167x25e6),它是通过 .csv 到现在的 parquet 从 GeoJSON 生成的。这是我第一次真正需要处理内存不足的数据帧,我仍在努力找出 Polars 是...

Python Vaex 联接数据帧,其中两列的值不匹配

作者:Kristina 提问时间:3/18/2023

嗨,我想知道是否有与以下 pandas python join 语法等效的 Vaex。从本质上讲,我正在尝试将数据帧连接到自身,其中第 1 列中的值与第 1 列中的值匹配,而第 2 列中的值与第 2 ...

优化从 MS SQL Server 读取和写入 CSV 文件

作者:db0 提问时间:3/31/2023

我正在尝试使用 Python 脚本优化客户端的读/写任务。他们必须将数据放在 csv 文件中,即使我建议使用 parquet 文件。我的代码从 sql 数据库读取到 DataFrame,然后从 Dat...

将代码从 Pandas 重构为 Vaex |loc 在 pandas howerver 中很有用,不能在 Vaex 中使用

作者:Arafat Absi 提问时间:6/20/2023

我正在努力让我的代码正常工作,这是在 pandas 中写的,现在我正在使用 vaex 重构它,因为 vaex 中不存在 howerver loc()。谁能帮我解决这个问题! 想法:旨在通过减去end...


共15条 当前第1页