pandas 问答列表

如何获取 Excel 在 pd.read_csv() 中使用的自定义分隔符

作者:Philip de Bruin 提问时间:8/11/2023

我有几个 .txt 文件,其中包含我想绘制的数据。由于有这么多,我更喜欢使用 python 而不是 Excel 来绘制这些。.txt文件是由德国机器生成的,这就是十进制逗号的原因。这可以通过将 dec...

如何修复 ParserError:年份 0 超出范围:0000-00-00 使用 Python Pandas to_datetime方法

作者:JA-pythonista 提问时间:2/11/2020

我正在尝试将列“travel_start”转换为日期时间对象。 Dashboard["travel_start"] = pd.to_datetime(Dashboard["travel_start"...

在 Python 中为具有不同实际值的多列删除异常值并计算修剪后的平均值

作者:Anakin Skywalker 提问时间:8/14/2023

我有一个数据集。假设有 10010 行和 100 列,列值可能包括 NaN,并且每列 NaN 可以不同。 我想要 从该数据集中选取 n 个列(假设 20 列,不带顺序,例如 Column1、Col...

如何为 pandas GroupBy 对象实现方括号运算符?

作者:Evan Aad 提问时间:8/15/2023

在 Python 3.11 中:要将方括号运算符应用于对象,应实现对象的 __getitem__ 方法。 在 Python 的模块中,可以将方括号应用于通过该方法返回的对象,例如 .(示例摘自本教程...

解析邮政地址的 DataFrame - 删除国家/地区和单位编号

作者:Saania 提问时间:8/16/2023

我有一个带有一列邮政地址的数据帧(生成 - 我用它来解析我的数据帧)。但是,的输出具有国家/地区名称 - 我不想要。它还包含单元号 - 我不想要。geopy.geocoders GoogleV3geo...

如果显示字符串,如何获取最小日期?

作者:JShec 提问时间:8/16/2023

你好 Stackoverflow 社区, 如果字符串出现,我很难找到如何获取最小日期。例如,我知道如何通过执行 df['date'].min() 来获取最小日期,但我有一个名为 system 的列,其...

使用 fuzzywuzzy 库根据特定列查找 pyspark 数据帧的相似行

作者:DonkeyKong 提问时间:8/17/2023

我正在尝试根据特定列在数据帧中查找“相似”行。例如,假设我们有这个数据—— +---+------+ | id| fruit| +---+------+ | 1| apple| | 2| appl|...

在 Python-Pandas 中允许/传递 null 值

作者:dragnblow 提问时间:8/17/2023

我有一个功能如下: def check(*args): return args[0] in args[1] 我想做的是允许像 Y、N、“” 这样的东西 如何在此传递或允许 null/empt...

匹配两个数据帧并计算匹配行在第一个数据帧中出现的次数

作者:kiwi_kimchi 提问时间:8/17/2023

我有两个数据帧( 和 )。df1df2 df1看起来像这样: A B C Girl 25 APPLE Boy 10 SAMSUNG Girl 10 LG Boy 5 Ap Boy 68 SAM...

将 Excel 文件读入 pandas 数据帧时保留撇号

作者:Arseny Yershov 提问时间:8/17/2023

将 Excel 文件读入 Pandas 数据帧,如下所示: import pandas as pd df = pd.read_excel(open('C:/somedir/somefile.xls...


共852条 当前第44页