大型数据帧头部期间出现 VAEX 错误

vaex error during head of a large data frame

提问人:euh 提问时间:2/3/2023 更新时间:2/3/2023 访问量:311

问:

我正在尝试使用 vaex 作为 pandas 的替代品来合并字符串列上的超大数据帧(100k 行 + 176m 行)。

似乎没有任何错误,我什至可以检查结果数据框,但是当我尝试结果时,会返回一个大错误堆栈(在下面附加它)。.join.shape.head

末尾的一行提到 . 我的第一个猜测是我没有足够的 RAM,但合并出乎意料地好。我该如何解决这个问题?pyarrow.lib.ArrowInvalid: offset overflow while concatenating arrays

enter image description here

Python Vaex

评论


答: 暂无答案