复回归分析-1.ppt
《复回归分析-1.ppt》由会员分享,可在线阅读,更多相关《复回归分析-1.ppt(93页珍藏版)》请在三一文库上搜索。
1、複迴歸分析-1,Multiple Regression,學習主題,解釋複迴歸模式 複習簡單迴歸的重要觀念 殘差分析 檢定整個模型的顯著性 檢定個別變數的影響 檢定部分模型 電腦報表使用及詮釋,今日重點,解釋複迴歸模式 複習簡單迴歸的重要觀念 殘差分析 檢定整個模型的顯著性 檢定個別變數的影響 檢定部分模型 電腦報表使用及詮釋,迴歸模式之種類,建立線性複迴歸模式之步驟,1. 設立迴歸模式中確定之部分(期望值) 2. 估計模式參數(X變數係數及截距) 3. 誤差項的機率分配 進入統計推論的前提 4. 評估模式 5. 利用模式做預測及估計,建立所使用的模型,1. 定義模型中所包含的兩個變數 獨立變數
2、(可自主變動不受其他因素的影響而改變其值) 反應變數(受到獨立變數的影響而改變其值者) 2. 根據變數間的關係建立假設之方程式 預期的影響 (諸如:正或負相關,係數為何) 函數形式 (線性linear或非線性non-linear),一般線性複迴歸模式,某個變數和其它變數之間的線性關係,相依或反應變數(response variable ),獨立或預測變數(predictor variables),Population slopes,Population Y-intercept,隨機誤差(Random error),一般線性複迴歸模式,母體真實關係 代表獨立變數 的貢獻 可為其他變數的函數,例如
3、:,動動腦想一想,Q:若X和Y的關係式為,可否經轉換而成線性模式?,你答對了嗎?,A:可以,則,動動腦想一想,Q:若X和Y的關係式為,可否經轉換而成線性模式?,你答對了嗎?,A:可以,則,母體複迴歸模式,Bivariate model,觀測值,期望值,樣本複迴歸模式,Bivariate model,建立線性複迴歸模式之步驟,1. 設立迴歸模式中確定之部分(期望值) 2. 估計模式參數(X變數係數及截距) 3. 誤差項的機率分配 進入統計推論的前提 4. 評估模式 5. 利用模式做預測及估計,學習主題,解釋複迴歸模式 複習簡單迴歸的重要觀念 殘差分析 檢定整個模型的顯著性 檢定個別變數的影響 檢
4、定部分模型 電腦報表使用及詮釋,最小平方法的圖形表達 Least Squares Method Graphically,Y,X,e1,LS即為使得,最小,e2,e3,e4,最小平方法 Least Squares Method,1. 最適切 表示觀察值與預估值間的差異為最小 但是差異有正有負會互相抵消 因此選擇誤差的平方和作為依據較佳 2. 最小平方法即為使得誤差平方和(SSE)為最小,最小平方法,選擇估計模式,使得誤差平方和,SSE=,為最小,最小平方法的求解過程1,如何使得變異量平方最小呢?,可以使用偏微分,分別讓方程式對,及,取偏微分,並使結果為0,最小平方法的求解過程2,取偏微分,並使結
5、果為0,簡化後得到:,讓方程式對,最小平方法的求解過程3,取偏微分,並使結果為0,簡化後得到:,讓方程式對,最小平方法的求解過程4,取偏微分,並使結果為0,簡化後得到:,讓方程式對,最小平方法的求解過程5,求解聯立方程式並解得,及,計算係數常用的表Computation Table,估計係數之詮釋,1. 第k個斜率係數(slope, bk) 在所有其它X變數固定下, Xk改變一個單位時, Y平均改變bk的量 2. Y-截距(b0) 在所有Xk = 0時, 平均之Y值,例一 參數估計,你在New York Times的廣告部門工作. 你想找出廣告大小(平方公分) 和報紙流通量(circulati
6、on, 單位千次)對讀者回應次數的效應(單位百次).,你所收集資料如下: 回應 廣告大小 流通 1 1 2 4 8 8 1 3 1 3 5 7 2 6 4 4 10 6,例 一的模型,考慮模型如下:,表廣告大小,表流通量,計算係數常用的表Computation Table,最小平方法的求解,求解聯立方程式並解得b0及b1,b2 15 = 6b0 + 33b1 + 28b2 103 = 33b0 + 235b1 + 188b2 88 = 28b0 + 188b1 + 170b2 b0=0.0640, b1=0.2049, b2=0.2805,參數估計電腦報表,Parameter Estimate
7、s Parameter Standard T for H0: Variable DF Estimate Error Param=0 Prob|T| INTERCEP 1 0.0640 0.2599 0.246 0.8214 ADSIZE 1 0.2049 0.0588 3.656 0.0399 CIRC 1 0.2805 0.0686 4.089 0.0264,bi,b2,b0,b1,係數之詮釋,1. 斜率 (b1) 在流通量不變情形下, 廣告大小(X1) 每增加一平方公分,回應次數(Y), 可期望(平均)增加20.49次, 2. 斜率 (b2) 在廣告大小不變情形下, 流通量(X2)每增加
8、仟份的回應次數(Y), 可期望(平均)增加28.05次, 3. 截距 (b0) 在廣告大小(X1) 且每仟份流通量(X2)均為0下, 回應次數(Y), 可期望(平均)增加6.4次,上述說法實為不合理, 故b0無具體意義,線性複迴歸方程式,Too complicated by hand!,Ouch!,例二 參數估計,你是大型連鎖超商的行銷經理,認為活力棒(高能量補充品)為有潛力的產品,想找出產品價格(cent分)和店內促銷(元)對活力棒銷售量(次數/週)的影響,分別在34家連鎖店收集資料如下:,例二 資料,例二的模型,考慮模型如下:,表price,表promotion,參數估計電腦報表,b2,b
9、1,b0,係數之詮釋,1. 斜率 (b1) 在店內促銷經費不變情形下, 售價(X1) 每降低一分,銷售次數(Y), 可期望(平均)增加53.2次, 2. 斜率 (b2) 在售價不變情形下,店內促銷經費(X2)每增加 百元的銷售次數(Y), 可期望(平均)增加361.3次, 3. 截距 (b0) b0亦無具體意義,參數估計電腦報表,b2,b1,b0,係數之詮釋,1. 斜率 (b1) 在店內促銷經費不變情形下, 售價(X1) 每降低一分,銷售次數(Y), 可期望(平均)增加53.2次, 2. 斜率 (b2) 在售價不變情形下,店內促銷經費(X2)每增加 百元的銷售次數(Y), 可期望(平均)增加3
10、61.3次, 3. 截距 (b0) b0亦無具體意義,參數估計電腦報表,b2,b1,b0,係數之詮釋,1. 斜率 (b1) 在店內促銷經費不變情形下, 售價(X1) 每降低一分,銷售次數(Y), 可期望(平均)增加53.2次, 2. 斜率 (b2) 在售價不變情形下,店內促銷經費(X2)每增加 百元的銷售次數(Y), 可期望(平均)增加361.3次, 3. 截距 (b0) b0亦無具體意義,比較不同模型的估計值,表price,表promotion,參數估計電腦報表,b2,b1,b0,比較不同模型的估計值,表price,表promotion,建立線性複迴歸模式之步驟,1. 設立迴歸模式中確定之部
11、分(期望值) 2. 估計模式參數(X變數係數及截距) 3. 誤差項的機率分配 進入統計推論的前提 4. 評估模式 5. 利用模式做預測及估計,迴歸模型適用前滿足之假設Linear Regression Model Assumptions,1. 隨機誤差機率分配的平均數為0 2. 隨機誤差機率分配的變異數為固定常數s2 3. 隨機誤差機率分配為常態分配 4. 任何隨機誤差間均相互獨立,i.i.d:獨立且為完全相同之分配,1,X,2,X,隨機誤差機率分配示意圖Error Probability Distribution,Y,f(,e,),X,建立線性複迴歸模式之步驟,1. 設立迴歸模式中確定之部分
12、(期望值) 2. 估計模式參數(X變數係數及截距) 3. 誤差項的機率分配 進入統計推論的前提 4. 評估模式 5. 利用模式做預測及估計,評估複迴模式之步驟,1. 檢視變異測量(決定係數coefficient of determination及模型估計的標準誤) 2. 殘差分析(residual analysis) 3. 檢定參數顯著性 整個模式 個別係數 部分模式,隨機誤差變異量 Random Error Variation,1. 真實的Y與預估的Y 間的差異變異情形 2. 根據迴歸模型所測得的標準誤 模型估計的標準誤 3. 受到下列因素的影響 模型選定的正確性 各個參數估計的正確性,迴歸
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析
链接地址:https://www.31doc.com/p-2499801.html