查找包含重复字段的 ID 时遇到问题-解网

问：

我的数据如下所示：

ID  Email
1   [email protected]
2   [email protected]
3   [email protected]
4   someone[email protected]
5   [email protected]
6   [email protected]

每个 ID 应该正好有 1 封电子邮件，但事实并非如此。

> dim(data)
[1] 5071    2
> length(unique(data$Person_Onyx_Id))
[1] 5071
> length((data$Email))
[1] 5071
> length(unique(data$Email))
[1] 4481

因此，我需要找到具有重复电子邮件地址的ID。

看起来这应该很容易，但我要指出：

> sqldf("select ID, count(Email) from data  group by ID having count(Email) > 1")
[1] ID count(Email)  
<0 rows> (or 0-length row.names)

我还尝试删除子句并将结果发送到对象，并按...似乎每个人都有 1...havingcount(Email)IDcount(Email)

我会提供实际数据，但由于电子邮件地址的敏感性，我不能。dput

sql r sqldf

查找包含重复字段的 ID 时遇到问题