統(tǒng)計學第七章方差分析.ppt
《統(tǒng)計學第七章方差分析.ppt》由會員分享,可在線閱讀,更多相關《統(tǒng)計學第七章方差分析.ppt(46頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第七章方差分析,一、方差分析的基本問題二、單因素方差分析三、雙因素方差分析,方差分析(AnalysisofVariance,ANOVA)是假設檢驗的一種延續(xù)與擴展,它可以解決諸如多個均值是否相等等方面的檢驗問題,在因素分析中具有一定的優(yōu)勢。例4:一個兒童食品制造商生產(chǎn)兒童麥片,該制造商認為以下三種因素影響麥片味道:(1)麥片中小麥與玉米的比例;(2)甜味劑類型的選擇:糖、蜂蜜等;(3)制作時間的長短。該例中,食品制造商通過生產(chǎn)出不同類型的麥片并邀請兒童進行品嘗試驗,最后發(fā)現(xiàn):(1)麥片成份及甜味劑類型對麥片食味有很大影響;(2)制作時間對麥片食味沒有影響。,一、方差分析的基本問題,因此,食品制造商可以對麥片成份及甜味劑類型給予充分的關注以生產(chǎn)更合兒童口味的麥片,而對制作時間不必太介意。,方差分析可以用來分析不同因素(如上例中小麥與玉米的比例、甜味劑類型、制作時間)對總體特征是否有顯著影響。,所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數(shù)據(jù)誤差的來源,方差分析主要用來對多個總體均值是否相等作出假設檢驗。例:某飲料制造商生產(chǎn)一種新型飲料,共有四種顏色:(1)橘黃、(2)粉紅、(3)綠色、(4)無色。該制造商想知道顏色是否對銷售量有顯著影響,隨機抽取了5家超市前一期的銷售量(下表)進行分析。,一、方差分析的內(nèi)容,下表四種飲料銷售量情況,樣本均值27.3229.5626.4431.46樣本方差2.672.143.311.66樣本標準差1.641.461.821.29,,四種顏色可以看作是四個總體,其中,?i(I=1,2,3,4)表示所有飲料(無色、粉紅、橘黃、綠色)銷售量之均值。,樣本來自于一個相同的總體,樣本來自于不同的總體,要知道顏色是否對飲料銷售有顯著影響,就是要知道四種顏色飲料銷售量的均值是否有顯著差異,即進行下述假設檢驗:,H0:?1=?2=?3=?4H1:四個總體均值不全相等,1、相關術語因素:是一個獨立的變量,是方差分析的研究對象(上例中的飲料顏色);,二、方差分析的假設,單因素方差分析:只針對一個因素進行分析;多因素方差分析:同時針對多個因素進行分析。,水平:因素中的內(nèi)容(上例中飲料的四種顏色:無色、粉色、橘黃色、綠色),2、進行方差分析必須滿足如下假設,(1)每個總體的相應變量(因素)服從正態(tài)分布對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本比如,每種顏色飲料的銷售量必需服從正態(tài)分布(2)所有總體相應變量(因素)的方差相等?2對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同(3)不同觀察值(水平)相互獨立(每個樣本點的取值不影響其他樣本點的取值)比如,每個超市的銷售量都與其他超市的銷售量獨立,在上述假定條件下,判斷顏色對銷售量是否有顯著影響,實際上也就是檢驗具有同方差的四個正態(tài)總體的均值是否相等的問題如果四個總體的均值相等,可以期望四個樣本的均值也會很接近四個樣本的均值越接近,我們推斷四個總體均值相等的證據(jù)也就越充分樣本均值越不同,我們推斷總體均值不同的證據(jù)就越充分,?如果原假設成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒有系統(tǒng)誤差這意味著每個樣本都來自均值為??、差為?2的同一正態(tài)總體,?如果備擇假設成立,即H1:mi(i=1,2,3,4)不全相等至少有一個總體的均值是不同的有系統(tǒng)誤差這意味著四個樣本分別來自均值不同的四個正態(tài)總體,觀察值之間的差異來自兩個方面:,某因素不同水平的影響(系統(tǒng)性影響),其他隨機因素的影響(隨機性影響),水平間方差(組間方差),水平內(nèi)方差(組內(nèi)方差),,,,三、方差分析的原理,如果原假設成立:說明某因素不同水平的影響不顯著(無系統(tǒng)性影響),只剩下隨機性影響,因此組間方差與組內(nèi)方差差別不大,它們的比接近于1。如果原假設不成立:說明某因素不同水平的影響顯著(存在系統(tǒng)性影響),組間方差與組內(nèi)方差差別較大,它們的比遠超出1。,二、單因素方差分析的步驟提出假設構造檢驗統(tǒng)計量統(tǒng)計決策,提出假設,一般提法H0:m1=m2=…=mk(因素有k個水平)H1:m1,m2,…,mk不全相等對前面的例子H0:m1=m2=m3=m4顏色對銷售量沒有影響H0:m1,m2,m3,m4不全相等顏色對銷售量有影響,構造檢驗的統(tǒng)計量,為檢驗H0是否成立,需確定檢驗的統(tǒng)計量構造統(tǒng)計量需要計算水平的均值全部觀察值的總均值離差平方和均方(MS),構造檢驗的統(tǒng)計量(計算水平的均值),假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式為,式中:ni為第i個總體的樣本觀察值個數(shù)xij為第i個總體的第j個觀察值,構造檢驗的統(tǒng)計量(計算全部觀察值的總均值),全部觀察值的總和除以觀察值的總個數(shù)計算公式為,構造檢驗的統(tǒng)計量(前例計算結果),,,構造檢驗的統(tǒng)計量(計算總離差平方和SST),全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計算公式為,前例的計算結果:SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.9295,構造檢驗的統(tǒng)計量(計算誤差項平方和SSE),每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和該平方和反映的是隨機誤差的大小計算公式為,前例的計算結果:SSE=39.084,構造檢驗的統(tǒng)計量(計算水平項平方和SSA),各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機誤差,也包括系統(tǒng)誤差計算公式為,前例的計算結果:SSA=76.8455,構造檢驗的統(tǒng)計量(三個平方和的關系),?總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系,SST=SSE+SSA,,,,構造檢驗的統(tǒng)計量(三個平方和的作用),SST反映了全部數(shù)據(jù)總的誤差程度;SSE反映了隨機誤差的大??;SSA反映了隨機誤差和系統(tǒng)誤差的大小如果原假設成立,即H1=H2=…=Hk為真,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統(tǒng)誤差判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗這種差異,需要構造一個用于檢驗的統(tǒng)計量,構造檢驗的統(tǒng)計量(計算均方MS),各離差平方和的大小與觀察值的多少有關,為了消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為均方差計算方法是用離差平方和除以相應的自由度三個平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)SSE的自由度為n-k,構造檢驗的統(tǒng)計量(計算均方MS),SSA的均方也稱組間方差,記為MSA,計算公式為,SSE的均方也稱組內(nèi)方差,記為MSE,計算公式為,構造檢驗的統(tǒng)計量(計算檢驗的統(tǒng)計量F),將MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即,構造檢驗的統(tǒng)計量(F分布與拒絕域),如果均值相等,F(xiàn)=MSA/MSE?1,對原假設:H0:?1=?2=?3=?4及備擇假設:H1:四個總體均值不全相等計算F值:F=MSA/MSE=25.6152/2.4428=10.486給出顯著性水平:?=0.05,查F(r-1,n-r)分布表臨界值:3.24,由于計算的F=10.486>3.24,拒絕原假設,從而得出:顏色對該公司飲料銷售有顯著影響。,三、雙因素方差分析,分析兩個因素(因素A和因素B)對試驗結果的影響分別對兩個因素進行檢驗,分析是一個因素在起作用,還是兩個因素都起作用,還是兩個因素都不起作用如果A和B對試驗結果的影響是相互獨立的,分別判斷因素A和因素B對試驗指標的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析如果除了A和B對試驗結果的單獨影響外,因素A和因素B的搭配還會對銷售量產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析對于無交互作用的雙因素方差分析,其結果與對每個因素分別進行單因素方差分析的結果相同,雙因素方差分析中需假設兩個因素不交互作用,即各自獨立地發(fā)揮影響作用。(一)數(shù)據(jù)結構,雙因素方差分析,雙因素方差分析的數(shù)據(jù)結構,?是因素A的第i個水平下各觀察值的平均值,?是因素B的第j個水平下的各觀察值的均值,?是全部kr個樣本數(shù)據(jù)的總平均值,雙因素方差分析的步驟,提出假設,對因素A提出的假設為H0:m1=m2=…=mi=…=mk(mi為第i個水平的均值)H1:mi(i=1,2,…,k)不全相等對因素B提出的假設為H0:m1=m2=…=mj=…=mr(mj為第j個水平的均值)H1:mj(j=1,2,…,r)不全相等,構造檢驗的統(tǒng)計量,為檢驗H0是否成立,需確定檢驗的統(tǒng)計量構造統(tǒng)計量需要計算總離差平方和水平項平方和誤差項平方和均方,構造檢驗的統(tǒng)計量(計算總離差平方和SST),全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況計算公式為,構造檢驗的統(tǒng)計量(計算SSA、SSB和SSE),因素A的離差平方和SSA,因素B的離差平方和SSB,誤差項平方和SSE,構造檢驗的統(tǒng)計量(各平方和的關系),?總離差平方和(SST)、水平項離差平方和(SSA和SSB)、誤差項離差平方和(SSE)之間的關系,SST=SSA+SSB+SSE,構造檢驗的統(tǒng)計量(計算均方MS),各離差平方和的大小與觀察值的多少有關,為消除觀察值多少對離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計算方法是用離差平方和除以相應的自由度三個平方和的自由度分別是總離差平方和SST的自由度為kr-1因素A的離差平方和SSA的自由度為k-1因素B的離差平方和SSB的自由度為r-1隨機誤差平方和SSE的自由度為(k-1)(r-1),構造檢驗的統(tǒng)計量(計算均方MS),因素A的均方,記為MSA,計算公式為,因素B的均方,記為MSB,計算公式為,隨機誤差項的均方,記為MSE,計算公式為,構造檢驗的統(tǒng)計量(計算檢驗的統(tǒng)計量F),為檢驗因素A的影響是否顯著,采用下面的統(tǒng)計量,為檢驗因素B的影響是否顯著,采用下面的統(tǒng)計量,統(tǒng)計決策,?將統(tǒng)計量的值F與給定的顯著性水平?的臨界值F?進行比較,作出接受或拒絕原假設H0的決策根據(jù)給定的顯著性水平?在F分布表中查找相應的臨界值F?若FA?F?,則拒絕原假設H0,表明均值之間的差異是顯著的,即所檢驗的因素(A)對觀察值有顯著影響若FB?F?,則拒絕原假設H0,表明均值之間有顯著差異,即所檢驗的因素(B)對觀察值有顯著影響,雙因素方差分析表(基本結構),雙因素方差分析,【例】有四個品牌的彩電在五個地區(qū)銷售,為分析彩電的品牌(因素A)和銷售地區(qū)(因素B)對銷售量是否有影響,對每個品牌在各地區(qū)的銷售量取得以下數(shù)據(jù),見下表。試分析品牌和銷售地區(qū)對彩電的銷售量是否有顯著影響?,雙因素方差分析(提出假設),對因素A提出的假設為H0:m1=m2=m3=m4(品牌對銷售量沒有影響)H1:mi(i=1,2,…,4)不全相等(品牌對銷售量有影響)對因素B提出的假設為H0:m1=m2=m3=m4=m5(地區(qū)對銷售量沒有影響)H1:mj(j=1,2,…,5)不全相等(地區(qū)對銷售量有影響),雙因素方差分析(Excel輸出的結果),結論:FA=18.10777>F?=3.4903,拒絕原假設H0,說明彩電的品牌對銷售量有顯著影響FB=2.100846- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 統(tǒng)計學 第七 方差分析
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://weibangfood.com.cn/p-3525728.html