回归分析 是一种用于估计两个或多个变量之间关系的统计工具。其中总是包含一个响应变量和一个或多个预测变量。回归分析被广泛应用于数据拟合,进而对数据进行预测。它帮助企业或组织通过利用因变量(响应变量)和自变量(预测变量)来了解其产品在市场上的表现。在本文中,让我们通过示例一起来学习 R 编程中不同类型的回归分析。
R 中的回归类型
在 R 语言中,主要有三种广泛使用的回归类型。它们分别是:
线性回归
在这三种回归类型中,线性回归模型是应用最为广泛的一种。在线性回归中,我们估计两个变量之间的关系,即一个响应变量和一个预测变量之间的关系。线性回归在图表上产生一条直线。用数学公式表示为:
y = ax + b
\u000a> 其中,
>
>
> – x 表示预测变量或自变量
> – y 表示响应变量或因变量
> – a 和 b 是系数
R 语言中的实现
在 R 编程中,我们使用 lm() 函数来创建线性回归模型。
> 语法: lm(formula)
> 参数:
> formula: 表示数据所要拟合的公式。
要了解更多可选参数,请在控制台中使用以下命令: help("lm")
示例: 在这个例子中,让我们在图表上绘制线性回归线,并根据身高预测体重。
R
CODEBLOCK_504fdfda
Output:
Call:
lm(formula = y ~ x)
Coefficients:
(Intercept) x
-39.7137 0.6847
Predicted value of a person with height = 182
1
84.9098
多元回归
多元回归是另一种回归分析技术,它是线性回归模型的扩展,因为它使用多个预测变量来构建模型。用数学公式表示为:
y = a + x1 b1 + x2 b2 + ….. + xn * bn
\u000a### R 语言中的实现
在 R 编程中,多元回归同样使用 lm() 函数来创建模型。
> 语法: lm(formula, data)
>
>
> 参数:
>
>
> – formula: 表示数据所要拟合的公式
> – data: 表示应用公式的数据框
示例: 让我们利用 R 基础包中现有的空气质量数据集创建一个多元回归模型,并在图表上绘制该模型。
R
CODEBLOCK_6d6bc296
Output:
Regression model:
Call:
lm(formula = Ozone ~ Wind + Temp, data = input)
Coefficients:
(Intercept) Wind Temp
-58.239 -0.739 1.329
逻辑回归
逻辑回归是另一种广泛使用的回归分析技术,它在一个范围内预测值。此外,它主要用于预测分类数据的值。例如,邮件是垃圾邮件还是非垃圾邮件,赢或输,男或女等等。用数学公式表示为:
y=\frac{1}{1+e^{-z}}
\u000a> 其中,
>
>
> – y