分组依据 问答列表

Pandas 数据帧获取每个组的第一行

作者:Nilani Algiriyage 提问时间:11/19/2013

我有一只熊猫,如下所示:DataFrame df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["f...

联接到多个类别的项的 SQL 查询

作者:scms 提问时间:7/13/2023

我有这 2 个表、内容项和一个类别的联接表。我只需要一个查询来选择多个类别中的项目(在所有类别中,而不是在任何类别中)。 -- content items CREATE TABLE `items` ...

如何联接多个表以获得一个结果集,该结果集包括满足 group by 和 having 子句的行以及满足一个条件的行

作者:lemon chow 提问时间:8/7/2023

我有两个表 - 输入: Input_table ait_no schema_nm column_nm table_nm 1 AIC公司 SSN系列 sic_tabl 2 AIC公司 ssn_1 b...

如何选择与MySQL中另一列相关的一组列?

作者:Ben 提问时间:8/24/2023

我有一个包含用户、文件和文件期限的 MySQL 表,如下所示。 用户 文件 文件年龄 一个 1 42 一个 2 17 一个 3 4 B 4 85 B 5 73 B 6 11 C 7 6 C 8 9 ...

在 having 子句中使用 MIN() 时遇到问题

作者:BenS 提问时间:8/30/2023

尝试为每个customer_id选择最早的order_date。 使用以下查询 SELECT customer_id, order_date FROM Delivery GROUP BY cus...

MySQL 根据一个表中的值从另一个表中筛选出行

作者:Allen King 提问时间:9/23/2023

我在连接这两个表时遇到问题。下面的查询将返回 1 和 8。但是,我还想检查是否在 .如何联接仅返回 8 的两个表。ID-AID-AStatusCodeTableAID-A TableA ID-A,...

带有 groupby() 的 pyspark agg() 无法使用 pandas_udf

作者:BC Smith 提问时间:9/12/2020

当我使用 min、sum、max、count、mean 或 std 之一时,pyspark groupby().agg() 工作正常。但是如果我 提供median_udf、range_udf或quan...

Hive 查找组或更改点的起点和终点

作者:GoGoGo 提问时间:4/2/2016

下表如下: +------+------+ | Name | Time | +------+------+ | A | 1 | | A | 2 | | A | 3 | | A | 4 | ...

没有聚合的数据透视表?

作者: 提问时间:8/6/2010

我有一个项目列表 - 每个项目都有一个标题,加上一堆属性,包括一个日期。 如果我将日期放入数据透视表的行框中,然后对其进行分组,然后将标题放在下面 - 这样我就有了年、季度、创建时间、标题,我会得到...

Python pandas:在groupby/apply的情况下,我们可以避免apply吗?

作者:BhishanPoudel 提问时间:4/3/2019

我听说过很多关于熊猫申请的速度很慢,应该尽可能少地使用。 在以下情况下,我需要在不使用 apply 的情况下计算列:Pct_Change_Adjusted df = pd.DataFrame({'...


共50条 当前第1页