計(jì)量經(jīng)濟(jì)學(xué)---一元線性回歸實(shí)用全套PPT
Click to edit Master title style,,Click to edit Master text styles,,Second level,,Third level,,Fourth level,,Fifth level,,*,,*,單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級(jí),,第三級(jí),,第四級(jí),,第五級(jí),,,,*,*,單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級(jí),,第三級(jí),,第四級(jí),,第五級(jí),,,,單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級(jí),,第三級(jí),,第四級(jí),,第五級(jí),,,,*,計(jì)量經(jīng)濟(jì)學(xué) 一元(yī yuán)線性回歸,,第一頁(yè),共21頁(yè)。,回歸分析是要通過(guò)樣本(yàngběn)所估計(jì)的參數(shù)來(lái)代替總體的真實(shí)參數(shù),或者說(shuō)是用樣本(yàngběn)回歸線代替總體回歸線。,盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù) 抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。,,那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。,,主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間(qū jiān)估計(jì)。,第二頁(yè),共21頁(yè)。,一、擬合(nǐ hé)優(yōu)度檢驗(yàn),擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度(chéngdù)的檢驗(yàn)。,,度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2,問(wèn)題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型(móxíng)最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度?,第三頁(yè),共21頁(yè)。,如果存在這樣(zhèyàng)一個(gè)區(qū)間,稱之為置信區(qū)間(confidence interval);,,變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。,,(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越?。?,一、擬合(nǐ hé)優(yōu)度檢驗(yàn),,給定顯著性水平?,查t分布表得臨界值,,|t1,說(shuō)明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;,,已知由一組樣本(yàngběn)觀測(cè)值(Xi,Yi),i=1,2…,n得到如下樣本(yàngběn)回歸直線,,如果Yi=?i 即實(shí)際(shíjì)觀測(cè)值落在樣本回歸“線”上,則擬合最好。,,1-?稱為置信系數(shù)(置信度)(confidence coefficient), ?稱為顯著性水平(level of significance);,,若 |t|? t ?/2(n-2),則拒絕H1 ,接受H0 ;,,若 |t|> t ?/2(n-2),則拒絕H0 ,接受H1 ;,,度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2,,計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)(cānshù)真值是否為零來(lái)進(jìn)行顯著性檢驗(yàn)的。,,由于置信區(qū)間一定程度(chéngdù)地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度(chéngdù),因此置信區(qū)間越小越好。,,回歸(huíguī)平方和(Explained Sum of Squares),1、總離差平方和的分解(fēnjiě),已知由一組樣本(yàngběn)觀測(cè)值(Xi,Yi),i=1,2…,n得到如下樣本(yàngběn)回歸直線,第四頁(yè),共21頁(yè)。,如果Yi=?i 即實(shí)際(shíjì)觀測(cè)值落在樣本回歸“線”上,則擬合最好。,,可認(rèn)為,“離差”全部來(lái)自回歸線,而與“殘差”無(wú)關(guān)。,第五頁(yè),共21頁(yè)。,對(duì)于所有樣本(yàngběn)點(diǎn),則需考慮這些點(diǎn)與樣本(yàngběn)均值離差的平方和,可以證明:,,記,總體(zǒngtǐ)平方和(Total Sum of Squares),回歸(huíguī)平方和(Explained Sum of Squares),殘差平方和,(,Residual Sum of Squares,,),第六頁(yè),共21頁(yè)。,TSS=ESS+RSS,Y的觀測(cè)值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來(lái)自回歸線(ESS),另一部分則來(lái)自隨機(jī)(suí jī)勢(shì)力(RSS)。,在給定樣本中,TSS不變,,,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此(yīncǐ),,擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS,第七頁(yè),共21頁(yè)。,2、可決系數(shù)(xìshù)R2統(tǒng)計(jì)量,稱 R2 為(樣本)可決系數(shù)(xìshù)/判定系數(shù)(xìshù)(coefficient of determination)。,可決系數(shù)的取值范圍:[0,1],,R2越接近1,說(shuō)明實(shí)際(shíjì)觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。,第八頁(yè),共21頁(yè)。,,在例的收入(shōurù)-消費(fèi)支出例中,,注:可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著(suí zhe)抽樣的不同而不同。為此,對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第3章中進(jìn)行。,第九頁(yè),共21頁(yè)。,二、變量(biànliàng)的顯著性檢驗(yàn),回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響(yǐngxiǎng)因素。,,在一元線性模型中,就是要判斷X是否對(duì)Y具有顯著的線性性影響(yǐngxiǎng)。這就需要進(jìn)行變量的顯著性檢驗(yàn)。,變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)。,,計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)(cānshù)真值是否為零來(lái)進(jìn)行顯著性檢驗(yàn)的。,第十頁(yè),共21頁(yè)。,,1,、假設(shè)檢驗(yàn),,所謂假設(shè)檢驗(yàn),就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來(lái)判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè)。,,假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。,,先假定原假設(shè)正確,然后根據(jù)(gēnjù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。,,判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的,第十一頁(yè),共21頁(yè)。,2、變量(biànliàng)的顯著性檢驗(yàn),第十二頁(yè),共21頁(yè)。,檢驗(yàn)(jiǎnyàn)步驟:,(1)對(duì)總體(zǒngtǐ)參數(shù)提出假設(shè),,H0: ?1=0, H1:?1?0,(2)以原假設(shè)(jiǎshè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值,(,3,)給定顯著性水平,?,查,t,分布表,得臨界值,t,?/2,(n-2),(4),比較,判斷,,若,|t|>,t,?/2,(n-2),,則拒絕,H,0,,,接受,H,1,,;,,若,|t|,?,,t,?/2,(n-2),,則拒絕,H,1,,,接受,H,0,,;,第十三頁(yè),共21頁(yè)。,對(duì)于一元線性回歸方程中的?0,可構(gòu)造(gòuzào)如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):,,在上述收入(shōurù)-消費(fèi)支出例中,首先計(jì)算?2的估計(jì)值,第十四頁(yè),共21頁(yè)。,t統(tǒng)計(jì)(tǒngjì)量的計(jì)算結(jié)果分別為:,給定顯著性水平?,查t分布表得臨界值,,t,,|t1,說(shuō)明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;,,|t2|<,表明在95%的置信度下,無(wú)法拒絕(jùjué)截距項(xiàng)為零的假設(shè)。,第十五頁(yè),共21頁(yè)。,假設(shè)檢驗(yàn)可以通過(guò)一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒(méi)有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。,,要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過(guò)構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間”,來(lái)考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是(jiùshì)參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)。,三、參數(shù)(cānshù)的置信區(qū)間,第十六頁(yè),共21頁(yè)。,,如果存在這樣(zhèyàng)一個(gè)區(qū)間,稱之為置信區(qū)間(confidence interval); 1-?稱為置信系數(shù)(置信度)(confidence coefficient), ?稱為顯著性水平(level of significance);置信區(qū)間的端點(diǎn)稱為置信限(confidence limit)或臨界值(critical values)。,第十七頁(yè),共21頁(yè)。,一元(yī yuán)線性模型中,?i (i=1,2)的置信區(qū)間:,在變量(biànliàng)的顯著性檢驗(yàn)中已經(jīng)知道:,意味著,如果(rúguǒ)給定置信度(1-?),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t?/2, t?/2)的概率是(1-? )。表示為:,即,,第十八頁(yè),共21頁(yè)。,于是(yúshì)得到:(1-?)的置信度下, ?i的置信區(qū)間是,在上述收入-消費(fèi)(xiāofèi)支出例中,如果給定? ,查表得:,由于(yóuyú),,于是,,?,1,、?,0,的置信區(qū)間分別為:,,(,0.6345,0.9195),,,,(),,第十九頁(yè),共21頁(yè)。,由于置信區(qū)間一定程度(chéngdù)地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度(chéngdù),因此置信區(qū)間越小越好。,要縮小置信區(qū)間,需,,(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越小;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減?。?,(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比(zhèngbǐ),模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。,第二十頁(yè),共21頁(yè)。,謝謝(xiè xie)觀看,第二十一頁(yè),共21頁(yè)。,