R语言-如何做回归模型预测
本经验将和各位网友分役钽俏淌享如何在R语言环境下进行回归模型预测。以下的案例来自美国社会调查机构:为了研究谋杀率与哪些因素有关,收集美国50个地区的谋杀率、收入水平、文盲率、生活经验、霜冻天数的数据,如下图:
2.分析不同变量的拟合性情况
这里主要调用car包,通过使用scatterplotMatrix() 函数,分析不同变量的相关关系及对因变量的拟合情况,输入如下代码:
library(car)
scatterplotMatrix(sj[,2:6])
上图第一部分,显示的是各个变量之间的相关性,第二部分显示的是各个相关性的显著性检验P值。从第一部分可见,谋杀率与文盲率、生活经验、霜冻天数分别具有0.7、-0.78以及-0.54的相关性,并且显著性水平P值均小于0.05,而谋杀率与收入水平的相关性不具有显著性,所以不列入模型。
4.尝试建立多元一项式回归模型
根据前面的分析结果,将文盲率、生活经验和霜冻天数列入模型,首先建立多元一项式模型,输入如下代码:
谋杀率<-lm(谋杀率~文盲率+生活经验+霜冻天数,data=sj)
summary(谋杀率)
由于篇幅有限,各位读者除了按照上面的方式建模,还需要考虑以上3个自变量的交互效应对模型的影响,从中观察R方的变化。
6.检验拟合值的同方差性
从上面可以发现,拟合值具有同方差的特征,为了进一步检验,这里采用ncvTest()函数,对模型进行检验,输入如下代码:
par(mfrow=c(2,2))
ncvTest(谋杀率)综上所述:模型的显著性符合p<0.05,R方=72.17%,并且残差呈现正态分布,拟合值具有同方差性的特征,模型的拟合效果整体看不错,可以达到实用的水平!
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:39
阅读量:51
阅读量:41
阅读量:86
阅读量:51