使用 R 和 ggplot2 有没有更好的方法来可视化 TRUE 和 FALSE 布尔值列？-解网

问：

所以我有一个更大的数据集，但为了简单起见，我尽了最大努力提供我的问题/数据集的简化版本：

所以总共有3只小猪。其中一头猪只拥有一栋房子，我想在 Y 轴上绘制房屋总价值，然后是每头猪拥有多少的分面视图。

房子	房屋价值	猪1	猪2	猪3
干草	30000	真	假	假
棒	70000	真	真	假
砖	100000	真	真	真

这是我想要的这个样子的快速草图：

我对我的 R 用法以及我的 GGPLOT2 用法非常生疏。我正在用这些数据做各种疯狂的事情，例如：

library(ggplot2)
library(readr)
piggies <- read_csv("piggies.csv")
ggplot(piggies, aes(x=PIG1, fill=as.factor(HOUSEVALUE)))+geom_bar(position='dodge')
ggplot(piggies, aes(x=PIG2, fill=as.factor(HOUSEVALUE)))+geom_bar(position='dodge')

我知道上面的 ggplot2 可视化效果近乎疯狂，但我最难追踪布尔值列的可靠资源并使 Y 轴表示“计数”以外的其他内容

（编辑了示例GGPlot公式，使其比我的原始示例略少疯狂）

r ggplot2 布尔可视化逻辑

好吧，你的手绘草图在 y 轴上有房屋价值，而你当前的地块在 y 轴上有房屋价值，所以这是一个很好的起点。此外，ggplot 作为 tidyverse 的一部分，旨在处理整洁数据。您的数据集不整洁，因为您的列名中有信息（猪名）。使您的数据整洁，您将不需要任何布尔值，您的生活将变得更加简单。您还可以调查和之间的区别。geom_histogramgeom_bar

0赞 EliCash 9/29/2022

Limey - 公平的观点，我不认为我离得很近，我想我会编辑那个样本，只是想放一些东西......但我很欣赏这个链接，我将研究如何优化我的 CSV 文件。

0赞 EliCash 9/29/2022

阿克伦，我试过了，但收到了Error in df1 %>% pivot_longer(cols = starts_with("PIG")) %>% filter(value) %>% : could not find function "%>%"

0赞 EliCash 9/30/2022

@Limey 您将如何使这些特定数据整洁？

答：

1赞 Silentdevildoll 9/30/2022 #1

我不确定这是否是你要找的，它会给出每头猪拥有的每种类型的堆叠总量。与@Akrun所说的类似，它在绘图之前使用pivot_longer：

dat<-data.frame("HOUSES" = c("Hay", "Sticks", "Bricks"), "HOUSEVALUE" = c(30000, 70000, 100000), "PIG1" = c(T,T,T), "PIG2" = c(F,T,T), "PIG3" = c(F,F,T))


library(dplyr)
library(tidyr)
library(ggplot2)

dat%>%
  pivot_longer(cols = starts_with("PIG"))%>%
  filter(value)%>%
  ggplot()+
  aes(name, HOUSEVALUE, fill = HOUSES)+
  geom_bar(stat = "identity")

使用 R 和 ggplot2 有没有更好的方法来可视化 TRUE 和 FALSE 布尔值列？

Using R and ggplot2 is there a better way to visualize TRUE and FALSE Boolean Value columns?

评论

评论