中级社会统计.ppt
《中级社会统计.ppt》由会员分享,可在线阅读,更多相关《中级社会统计.ppt(95页珍藏版)》请在三一文库上搜索。
1、Ming-chi Chen,社會統計,Page.1,中級社會統計,第十三講 複迴歸分析,Ming-chi Chen,社會統計,Page.2,複迴歸分析,前面我們學到只有一個自變項的簡單迴歸分析 我們知道一個地區的人均病床數會影響到該地區的平均餘命 我們也知道一個地區的人均教育支出會影響該地區的平均餘命 但是如果教育支出相等的條件下,醫療資源的多寡會不會影響平均壽命?兩者孰輕孰重? 控制的概念(在其他條件不變的情況下),Ming-chi Chen,社會統計,Page.3,複迴歸分析,研究兩個或兩個以上的IV對DV的影響的分析方式,稱為複迴歸分析(multiple regression analy
2、sis) 又稱多元迴歸分析 迴歸方程式,Ming-chi Chen,社會統計,Page.4,多元迴歸Multiple Regression Models,統計成績與努力(所花時間)的關係如下:,觀念,Ming-chi Chen,社會統計,Page.5,多元迴歸Multiple Regression Models,兩者的迴歸線:,觀念,Ming-chi Chen,社會統計,Page.6,多元迴歸Multiple Regression Models,將學生對於數理科目的興趣納入考量發現:,觀念,x2=30,x2=20,x2=10,Ming-chi Chen,社會統計,Page.7,多元迴歸Mult
3、iple Regression Models,如果我們針對具有相同興趣水準的學生來考量努力與成績的關係,則可以分別用三個迴歸線來表達:,觀念,Ming-chi Chen,社會統計,Page.8,多元迴歸Multiple Regression Models,這三條線的斜率似乎沒有原本迴歸線來得大,表示努力與成績的關係有一部份是受到興趣的干擾(confounding): 有興趣的學生通常花比較多的時間,觀念,Ming-chi Chen,社會統計,Page.9,多元迴歸Multiple Regression Models,此時利用多元迴歸比簡單迴歸可以算出三條簡單迴歸的平均斜率。,觀念,Ming-c
4、hi Chen,社會統計,Page.10,多元迴歸Multiple Regression Models,多元迴歸用來分析一個以上自變數對於依變數的影響,可以看出其他變數不變(常數)的條件下,某一個變數對於依變數產生的淨影響為何?,觀念,Ming-chi Chen,社會統計,Page.11,Partial Derivative偏微分觀念,觀念,經濟學說我們對於某商品的需求量與價格及所得有關:,在所得不變的條件下,商品價格x1變動,對於需求量y有何影響?,Ming-chi Chen,社會統計,Page.12,Partial Derivative偏微分觀念,觀念,假設所得固定為100,,因為價格變動
5、所造成的商品需求變動可以表為:,帶入原來的函數:,Ming-chi Chen,社會統計,Page.13,Partial Derivative偏微分觀念,觀念,如果我們將x1切割成很小的單位,則每個極小單為的變動所造成的q變動為:,在x2不變(保持恆定)的情況下,x1的變動所造成y的變動,Ming-chi Chen,社會統計,Page.14,Partial Derivative偏微分觀念,觀念,X2所得,X1價格,y需求,三個以上的自變數在三度空間上無法表達。,二個自變數的多元迴歸分析在於設法找出最合適資料分佈的一個平面。,Ming-chi Chen,社會統計,Page.15,多元迴歸的參數推估
6、,求多元迴歸x1與x2的係數?,我們可以將所有的觀察值y視為x1與x2的線性函數加上誤差值e,多元迴歸的預測值可以表為:,Ming-chi Chen,社會統計,Page.16,The Normal Equation,觀念,X2所得,X1價格,y需求,求使e2最小的平面,Ming-chi Chen,社會統計,Page.17,The Normal Equation,觀念,求 Minimum Q? 將(1)式分別對a, b1, b2做偏微分,再將所得之方程式設為零,然後求解聯立方程式即可求得最小值。,Ming-chi Chen,社會統計,Page.18,The Normal Equation,觀念,
7、e總和為零,e與x1及x2不相關(uncorrelated),Ming-chi Chen,社會統計,Page.19,Basic Rules for Differentiation,Rule 8: the chain rule,複習,Ming-chi Chen,社會統計,Page.20,Example of chain rule,複習,Ming-chi Chen,社會統計,Page.21,微分求迴歸係數,Ming-chi Chen,社會統計,Page.22,Ming-chi Chen,社會統計,Page.23,The Normal Equation,觀念,Ming-chi Chen,社會統計,P
8、age.24,The Normal Equation,觀念,Sum,Average,Ming-chi Chen,社會統計,Page.25,The Normal Equation,觀念,Sum,Average,Ming-chi Chen,社會統計,Page.26,The Normal Equation,觀念,迴歸平面通過中心點:,Ming-chi Chen,社會統計,Page.27,Normal Equations in Reduced Form,觀念,若將所有變數都以離均值來表示,求b1, b2等於:,Ming-chi Chen,社會統計,Page.28,Normal Equations in
9、 Reduced Form,觀念,解聯立方程式:,Ming-chi Chen,社會統計,Page.29,Normal Equations in Reduced Form,觀念,解聯立方程式:,Ming-chi Chen,社會統計,Page.30,觀念,Ming-chi Chen,社會統計,Page.31,一般化迴歸模型的假設條件,依變數Yi為隨機變數,自變數(Xi,i=1,k)為預先選定的變數。 Zero Mean: E(ei)=0 Homoscedasticity: e2 is the same for all value of independent variable. Normality
10、: ei為常態分配 No serial correlation: E(eiej) =0, i j Independent of ei and xij: E(eixij)=0,Ming-chi Chen,社會統計,Page.32,一般化迴歸模型的假設條件,No perfect multicollinearity: it is not possible to find a set of numbers c0, c1, ck such that,樣本數nk+1,在複迴歸模型若有k個自變數,則有k+1(包括截距)個迴歸參數,此時利用樣本來估計迴歸參數時,樣本數必須大於k+1個。,Ming-chi Ch
11、en,社會統計,Page.33,The General Multiple Regression Model,b0, b1, bk are the least-squares estimates of 0, 1, k that minimize the residual sum of squares:,The Gauss-Markov Theorem: If the basic assumptions hold: b0, b1, bk are the unbiased estimates of0, 1, ,k b0, b1, bk have the minimum variances among
12、 the class of linear unbiased estimators,母體迴歸線,樣本迴歸線,Ming-chi Chen,社會統計,Page.34,Estimated Standard Error of Regression,如同在簡單迴歸中,為了要做假設檢定,我們必須要估計e2 。 在簡單迴歸中,我們知道S2e=SSE/(n-2)為e2 的不偏估計式。 同理,在複迴歸中, S2e=SSE/(n-(K+1)為e2 的不偏估計式。其中n為樣本數,(K+1)為所欲估計的未知數(即K個自變數加上一個常數項)。,Ming-chi Chen,社會統計,Page.35,Estimated St
13、andard Error of Regression,SSE的一般性公式:,Ming-chi Chen,社會統計,Page.36,Partition of Total Sum of Squares,觀念,多元迴歸中,SST = SSR + SSE仍然成立,e與x1及x2不相關,Ming-chi Chen,社會統計,Page.37,Partition of Total Sum of Squares,觀念,SST=,SSE,+ SSR,Ming-chi Chen,社會統計,Page.38,Sum of Square due to Regression,觀念,代入,以大寫字母來表示與平均值間的差異。
14、,Ming-chi Chen,社會統計,Page.39,Sum of Square due to Regression,觀念,Ming-chi Chen,社會統計,Page.40,Coefficient of Determination R2,判定係數,用來衡量迴歸方程式的配合度或解釋力,Ming-chi Chen,社會統計,Page.41,Adjusted R square,如果樣本數小或自變項個數增加,會使自由度變小,因此判定係數R2 會高估。 亦即在複迴歸模型中若不斷加入與模型無關的解釋變數時, R2會提高一些,不能代表迴歸模型的解釋能力。 需要調整複判定係數(adjusted coef
15、ficient of multiple determination) 主要調整的是自由度,Ming-chi Chen,社會統計,Page.42,Adjusted R square,Ming-chi Chen,社會統計,Page.43,Adjusted R square,Ming-chi Chen,社會統計,Page.44,Adjusted R square,Ming-chi Chen,社會統計,Page.45,Measuring Goodness of fit,在複迴歸中,可利用檢定迴歸方程式中所有的自變數對於依變數Y是否有聯合的解釋能力: H0:迴歸方程式無解釋能力 0 = 1 = 2=K
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中级 社会 统计
链接地址:https://www.31doc.com/p-2710742.html