UA MATH571A 一元线性回归III 方差分析与相关性分析_一元配置方差与等级回归分析-程序员宅基地

技术标签: # 线性回归  统计  回归  

ANOVA Table

ANOVA(Analysis of Variance)是分析方差构成的常用方法。在前两篇中,我们定义过
S S T = ∑ i = 1 N ( Y i − Y ˉ ) 2 SST = \sum_{i=1}^N (Y_i-\bar{Y})^2 SST=i=1N(YiYˉ)2
SST表示被解释变量Y的样本总离差平方和(或称总平方和),代表样本数据整体的信息含量,其自由度为 d f T = N − 1 df_T=N-1 dfT=N1。我们也定义过
S S E = ∑ i = 1 N e i 2 = ∑ i = 1 N ( Y i − Y ^ i ) 2 SSE = \sum_{i=1}^{N} e_i^2 = \sum_{i=1}^{N} (Y_i - \hat{Y}_i)^2 SSE=i=1Nei2=i=1N(YiY^i)2
SSE是回归的残差平方和,代表无法被变量X解释的那部分信息量,自由度为 d f E = N − 2 df_E=N-2 dfE=N2
S S T − S S E = ∑ i = 1 N [ ( Y i − Y ˉ ) 2 − ( Y i − Y ^ i ) 2 ] = ∑ i = 1 N [ Y ˉ 2 + Y i ^ 2 − 2 Y i ( Y ^ i − Y ˉ ) ] = ∑ i = 1 N [ Y ˉ 2 + Y i ^ 2 − 2 ( Y i − Y ˉ ) ( Y ^ i − Y ˉ ) ] = ∑ i = 1 N ( Y ^ i − Y ˉ ) 2 ≜ S S R SST-SSE=\sum_{i=1}^N [(Y_i-\bar{Y})^2-(Y_i - \hat{Y}_i)^2] \\ =\sum_{i=1}^N [\bar{Y}^2+\hat{Y_i}^2-2Y_i(\hat{Y}_i-\bar{Y})] \\ = \sum_{i=1}^N [\bar{Y}^2+\hat{Y_i}^2-2(Y_i-\bar{Y})(\hat{Y}_i-\bar{Y})] \\ =\sum_{i=1}^N (\hat{Y}_i - \bar{Y})^2 \triangleq SSR SSTSSE=i=1N[(YiYˉ)2(YiY^i)2]=i=1N[Yˉ2+Yi^22Yi(Y^iYˉ)]=i=1N[Yˉ2+Yi^22(YiYˉ)(Y^iYˉ)]=i=1N(Y^iYˉ)2SSR
SSR是回归平方和,代表回归模型可以解释的那部分信息含量,自由度为 d f R = 1 df_R=1 dfR=1。对于回归而言,只有两个回归系数贡献两个自由度,但存在约束 ∑ i = 1 N ( Y ^ i − Y ˉ ) = 0 \sum_{i=1}^N (\hat{Y}_i - \bar{Y})=0 i=1N(Y^iYˉ)=0,所以减去一个自由度,只剩下一个自由度。将三个平方和做自由度修正,定义
M S T = S S T d f T ,    M S R = S S R d f R ,    M S E = S S E d f E MST = \frac{SST}{df_T}, \ \ MSR = \frac{SSR}{df_R}, \ \ MSE = \frac{SSE}{df_E} MST=dfTSST,  MSR=dfRSSR,  MSE=dfESSE
根据上述定义,可以写出下列方差分析表(ANOVA Table)

来源 SS df MS
回归 S S R = ∑ i = 1 N ( Y ^ i − Y ˉ ) 2 SSR=\sum_{i=1}^N (\hat{Y}_i - \bar{Y})^2 SSR=i=1N(Y^iYˉ)2 1 M S R = S S R d f R MSR = \frac{SSR}{df_R} MSR=dfRSSR
残差 S S E = ∑ i = 1 N ( Y i − Y ^ i ) 2 SSE=\sum_{i=1}^N (Y_i - \hat{Y}_i )^2 SSE=i=1N(YiY^i)2 N-2 M S E = S S E d f E MSE = \frac{SSE}{df_E} MSE=dfESSE
总平方和 S S T = ∑ i = 1 N ( Y i − Y ˉ ) 2 SST=\sum_{i=1}^N (Y_i - \bar{Y})^2 SST=i=1N(YiYˉ)2 N-1 M S T = S S T d f T MST = \frac{SST}{df_T} MST=dfTSST

F检验

回归系数的F检验

之前有说过MSE是方差的无偏估计,也就是 E ( M S E ) = σ 2 E(MSE)=\sigma^2 E(MSE)=σ2。现在计算一下MSR的期望。
S S R = ∑ i = 1 N ( Y ^ i − Y ˉ ) 2 = ∑ i = 1 N [ β ^ 0 + β ^ 1 X i − ( β ^ 0 + β ^ 1 X ˉ ) ] 2 = β ^ 1 2 ∑ i = 1 N ( X i − X ˉ ) 2 E ( β ^ 1 2 ) = V a r ( β ^ 1 ) + [ E ( β ^ 1 ) ] 2 = σ 2 ∑ i = 1 N ( X i − X ˉ ) 2 + β 1 2 E ( M S R ) = E ( S S R ) = σ 2 + β 1 2 ∑ i = 1 N ( X i − X ˉ ) 2 SSR = \sum_{i=1}^N (\hat{Y}_i - \bar{Y})^2 = \sum_{i=1}^N [\hat{\beta}_0 +\hat{\beta}_1X_i- (\hat{\beta}_0+\hat{\beta}_1\bar{X})]^2 =\hat{\beta}_1^2\sum_{i=1}^N (X_i - \bar{X})^2 \\ E(\hat{\beta}_1^2)=Var(\hat{\beta}_1)+[E(\hat{\beta}_1)]^2=\frac{\sigma^2}{\sum_{i=1}^N (X_i - \bar{X})^2} + \beta_1^2 \\ E(MSR)=E(SSR)=\sigma^2 + \beta_1^2 \sum_{i=1}^N (X_i - \bar{X})^2 SSR=i=1N(Y^iYˉ)2=

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_44207974/article/details/103122331

智能推荐

【ICPC济南区域赛】签到题题解_icpc2021济南题解-程序员宅基地

文章浏览阅读406次。M Cook Pancakes!对于N个饼,显然需要fry 2N次;考虑最优的情况,显然在每次都同时fry K次即答案为 【2N/K】#include<bits/stdc++.h>using namespace std; int main(){ int N,K; cin>>N>>K; if(N<=K)cout<<2<<endl; else{ cout<<ceil(2_icpc2021济南题解

大数据分析模型构建步骤_构建大数据分析模型-程序员宅基地

文章浏览阅读4.1k次。  我们知道做认识事情都有个流程顺序,正确的流程可以事半功倍,错误的流程往往会导致事情重新来做,越来越多的企业都实现了大数据营销推广。今天我们就来了解一下,大数据分析中的模型构建步骤。  大数据环境下的数据分析模型构建步骤  常用的数据挖掘方法主要是基于客户画像体系与结果,选取相关性较大的特征变量,通过分类模型、聚类模型、回归模型、神经网络和关联规则等机器算法进行深度挖掘。常用算法的基本内容如下:  1、分类和聚类  分类算法是极其常用的数据挖掘方法之一,其核心思..._构建大数据分析模型

Xdebug安装与使用_xdebug 验证脚本的目标目录不是 public。-程序员宅基地

文章浏览阅读1.1k次。Xdebug安装与使用为什么需要Debugger?很多PHP程序员调试使用echo、print_r()、var_dump()、printf()等,其实对 于有较丰富开发经验的程序员来说这些也已经足够了,他们往往可以在程序执行的过程中,通过输出特定变量的值可以判断程序执行是否正确,甚至效率高低也可以 看出来(当然可能还需要使用一些时间函数)。那么我们为什么还需要一个专门的_xdebug 验证脚本的目标目录不是 public。

Java配合Tabula框架实现上传并解析PDF表格_java tabula-程序员宅基地

文章浏览阅读1.5k次,点赞3次,收藏6次。功能:解析上传的pdf表格,并存入数据库最近有个需求,功能如上。百度了一下主要推荐的框架有两个。一个是Itext,听说很厉害,但是商业使用需要花钱就没有太多了解。另一个是PdfBox,简单的写了个demo,可以获取到pdf内的所有文字并返回String。返回的数据位置会错乱,且api没有中文版,例子也不多,使用起来很麻烦(是我太菜)。在之后发现了Tabula,功能实现的很强大,就搜了搜看有没有给Java调用的方法,就找到了下边的贴子:https://blog.csdn.net/qq_3695600_java tabula

使用VsCode打造C#开发IDE_vscode 做c#开发-程序员宅基地

文章浏览阅读6.6k次,点赞3次,收藏25次。用VsCode写了几天Java,还是比较满意的,无论是在智能提示方面,还是在调试跳转文本编辑等方面,个人感觉都不次于IDEA等正牌重型IDE,所以就想顺带用VsCode把VisualStudio也替代了,但是还是发现有点儿小问题,就是必须严格的按照VsCode的新建步骤来,否则运行调试时会报错误。下面就详细分享一下用VsCode开发C#的步骤。_vscode 做c#开发

mysql-数据库字段date datetime timestamp与实体类类型对应关系_数据库的时间与实体类型的关系-程序员宅基地

文章浏览阅读8k次,点赞12次,收藏36次。https://www.cnblogs.com/lrzr/archive/2017/08/07/7299211.htmlhttps://blog.csdn.net/weixin_38336276/article/details/83892408https://www.cnblogs.com/1130136248wlxk/articles/5238538.html_数据库的时间与实体类型的关系

随便推点

存储过程 @与字符连接_存储过程连接符-程序员宅基地

文章浏览阅读289次。&gt; BEGIN -&gt; declare a int; -&gt; declare b varchar(5000); -&gt; set a=1; -&gt; set b=''; -&gt; while a&lt;10 do -&gt; set b = concat(b,',',a); -&gt; set a=a+_存储过程连接符

实验三 顺序图、协作图设计_添加课程顺序图-程序员宅基地

文章浏览阅读6.1k次,点赞6次,收藏36次。实验三 顺序图、协作图设计【实验目的】理解顺序图和协作图的概念及作用; 掌握UML顺序图与协作图的基本图形,了解它们各自的组成元素、特定作用和适用场合; 重点掌握顺序图的画法及其中元素所代表的意义。【实验性质】设计性实验。【实验要求】学习根据指定的用例描述绘制顺序图和协作图的方法; 学习使用Rational Rose绘制顺序图和协作图; 掌握顺序图和协作图的相互转换方法。【实验内容】以网上选课系统中的Select Course(选课)用例为例,设计和实现顺序图、协作图.._添加课程顺序图

Kaggle滑水 - CTR预估(FM_FFM)_ffm在滑坡预测里面是什么-程序员宅基地

文章浏览阅读2.4k次。本文继续以Avazu-CTR赛题为背景,尝试采用FM(Factorization Machine,因子分解机)及FFM(Field-aware Factorization Machine,场感知因子分解机)来进行CTR预估任务。本文的源码托管于我的Github:PnYuan - Kaggle_CTR,欢迎查看交流。1.概念商用推荐场景中的CTR预估工作易面临大规模稀疏数据的挑战..._ffm在滑坡预测里面是什么

安装numpy+mkl报错的处理办法_numpy mkl后报错-程序员宅基地

文章浏览阅读2.6k次。转载自:http://www.fkccp.com/archives/2710.html 非常感谢这个大神,我纠结了好久这个问题!Processing c:\users\rao\downloads\numpy-1.11.2+mkl-cp27-cp27m-win32.whl Installing collected packages: numpy Exception: Traceback (mo_numpy mkl后报错

POJ 2746 约瑟夫问题_poj2746-程序员宅基地

文章浏览阅读525次。题目总时间限制: 1000ms 内存限制: 65536kB 描述 约瑟夫问题:有n只猴子,按顺时针方向围成一圈选大王(编号从1到n),从第1号开始报数,一直数到m,数到m的猴子退出圈外,剩下的猴子再接着从1开始报数。就这样,直到圈内只剩下一只猴子时,这个猴子就是猴王,编程求输入n,m后,输出最后猴王的编号。输入 每行是用空格分开的两个整数,第一个是 n, 第二个是 m ( 0 < m,n <_poj2746

如何为微信小程序添加定位导航和地图标注功能_小程序地图导航-程序员宅基地

文章浏览阅读1.3k次。在JavaScript代码中,我们需要将获取到的用户位置信息设置为map组件的latitude和longitude属性,并创建一个标注点并设置在markers属性中。在获取到用户的地理位置信息后,我们需要将用户的位置在地图上进行标注。在JavaScript代码中,我们需要在数据中添加路线规划相关信息,并在路线规划成功的回调函数中更新数据。同样的,我们在实现地图标注功能时,也需要获取用户的地理位置信息。至此,我们已经成功地实现了获取用户地理位置信息并在地图上标注出用户位置的功能。二、地图标注功能的实现。_小程序地图导航

推荐文章

热门文章

相关标签