提问人:Ankita 提问时间:2/20/2013 最后编辑:Karolis KoncevičiusAnkita 更新时间:3/24/2021 访问量:179862
在 R 编程语言中使用 ~(波浪号)
Use of ~ (tilde) in R programming Language
问:
我在有关回归建模的教程中看到了以下命令:
myFormula <- Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width
这个命令到底是做什么的,(波浪号)在命令中的作用是什么?~
答:
右边的东西是一个公式
对象。它通常用于表示统计模型,其中左边的东西是响应,右边的东西是解释变量。所以在英语中,你会说“物种取决于萼片长度、萼片宽度、花瓣长度和花瓣宽度”。<-
~
~
该行的部分将公式存储在一个被调用的对象中,以便你可以在 R 代码的其他部分使用它。myFormula <-
myFormula
R 中公式对象的其他常见用法
该包使用它们来指定要绘制的变量。
该软件包使用它们来指定用于打印的面板。
该软件包将它们用于非标准真空。lattice
ggplot2
dplyr
评论
懒惰
小插图的“公式”部分很好地介绍了什么是公式
R 定义用于公式的(波浪号)运算符。公式有各种各样的用途,但也许最常见的是回归:~
library(datasets)
lm( myFormula, data=iris)
help("~")
或者会教你更多。help("formula")
@Spacedman涵盖了基础知识。让我们讨论一下它是如何工作的。
首先,作为一个运算符,请注意它本质上是一个函数的快捷方式(有两个参数):
> `~`(lhs,rhs)
lhs ~ rhs
> lhs ~ rhs
lhs ~ rhs
这有助于了解用于例如 家庭命令。apply
其次,您可以将公式作为文本进行操作:
oldform <- as.character(myFormula) # Get components
myFormula <- as.formula( paste( oldform[2], "Sepal.Length", sep="~" ) )
第三,您可以将其作为列表进行操作:
myFormula[[2]]
myFormula[[3]]
最后,有一些关于公式的有用技巧(更多信息见):help("formula")
myFormula <- Species ~ .
例如,上面的版本与原始版本相同,因为圆点表示“所有尚未使用的变量”。这将查看您在最终模型调用中使用的 data.frame,查看 data.frame 中存在哪些变量但公式中未明确提及,并将点替换为那些缺少的变量。
评论
Species~.
myFormula <- Species ~ .
一句话,
The tilde
(~) separates the left side of a formula with the right side of the formula.
例如,在线性函数中,它将因变量与自变量分开,并且可以解释为“作为函数”。因此,当一个人的工资(工资)与他们的受教育年限(years_of_education)成函数时,我们会做这样的事情,
wages ~ years_of_education
这里
Species ~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width
这意味着,是 的函数。Species
Sepal Length, Sepal Width, Petal Length and Petal Width
下一个:将多个列粘贴在一起
评论