四川省宜賓市一中高三數(shù)學(xué)上學(xué)期第十三周 統(tǒng)計教學(xué)設(shè)計
-
資源ID:110573492
資源大?。?span id="h74xvao" class="font-tahoma">1.10MB
全文頁數(shù):48頁
- 資源格式: DOC
下載積分:10積分
快捷下載

會員登錄下載
微信登錄下載
微信掃一掃登錄
友情提示
2、PDF文件下載后,可能會被瀏覽器默認(rèn)打開,此種情況可以點擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請知曉。
|
四川省宜賓市一中高三數(shù)學(xué)上學(xué)期第十三周 統(tǒng)計教學(xué)設(shè)計
統(tǒng)計
1.隨機(jī)抽樣
(1)理解隨機(jī)抽樣的必要性和重要性.
(2)會用簡單隨機(jī)抽樣方法從總體中抽取樣本;了解分層抽樣和系統(tǒng)抽樣方法.
2.用樣本估計總體
(1)了解分布的意義和作用,能根據(jù)頻率分布表畫頻率分布直方圖、頻率折線圖、莖葉圖,體會它們各自的特點.
(2)理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,會計算數(shù)據(jù)標(biāo)準(zhǔn)差.
(3)能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并作出合理的解釋.
(4)會用樣本的頻率分布估計總體分布,會用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征,理解用樣本估計總體的思想.
(5)會用隨機(jī)抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題.
3.變量的相關(guān)性
(1)會做兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,并利用散點圖認(rèn)識變量間的相關(guān)關(guān)系.
(2)了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸方程系數(shù)公式不要求記憶).
4.了解回歸分析的思想、方法及其簡單應(yīng)用.
5.了解獨(dú)立性檢驗的思想、方法及其初步應(yīng)用.
11.1 隨機(jī)抽樣
考點梳理
1.簡單隨機(jī)抽樣
(1)簡單隨機(jī)抽樣:一般地,設(shè)一個總體含有N個個體,從中逐個________地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機(jī)會________,就把這種抽樣方法叫做簡單隨機(jī)抽樣.
(2)最常用的簡單隨機(jī)抽樣方法有兩種:________法和________法.
抽簽法(抓鬮法):一般地,抽簽法就是把總體中的N個個體________,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取______個號簽,連續(xù)抽取________次,就得到一個容量為n的樣本.
隨機(jī)數(shù)法:隨機(jī)數(shù)法就是利用______________、隨機(jī)數(shù)骰子或計算機(jī)產(chǎn)生的隨機(jī)數(shù)進(jìn)行抽樣.
簡單隨機(jī)抽樣有操作簡便易行的優(yōu)點,在總體個數(shù)不多的情況下是行之有效的.
2.系統(tǒng)抽樣
(1)一般地,假設(shè)要從容量為N的總體中抽取容量為n的樣本,我們可以按下列步驟進(jìn)行系統(tǒng)抽樣:
①先將總體的N個個體________.有時可直接利用個體自身所帶的號碼,如學(xué)號、準(zhǔn)考證號、門牌號等;
②確定分段間隔k,對編號進(jìn)行分段.當(dāng)(n是樣本容量)是整數(shù)時,取k=,如果遇到不是整數(shù)的情況,可以先從總體中隨機(jī)地剔除幾個個體,使得總體中剩余的個體數(shù)能被樣本容量整除;
③在第1段用______________抽樣方法確定第一個個體編號l(l≤k);
④按照一定的規(guī)則抽取樣本.通常是將l加上________得到第2個個體編號________,再________得到第3個個體編號________,依次進(jìn)行下去,直到獲取整個樣本.
(2)當(dāng)總體中元素個數(shù)較少時,常采用____________,當(dāng)總體中元素個數(shù)較多時,常采用______________.
3.分層抽樣
(1)分層抽樣的概念:一般地,在抽樣時,將總體分成________的層,然后按照一定的________,從各層獨(dú)立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.
(2)當(dāng)總體是由__________的幾個部分組成時,往往選用分層抽樣的方法.
(3)分層抽樣時,每個個體被抽到的機(jī)會是________的.
自查自糾
1.(1)不放回 都相等
(2)抽簽 隨機(jī)數(shù) 編號 1 n 隨機(jī)數(shù)表
2.(1)①編號?、酆唵坞S機(jī)
④間隔k (l+k) 加k (l+2k)
(2)簡單隨機(jī)抽樣 系統(tǒng)抽樣
3.(1)互不交叉 比例 (2)差異明顯 (3)均等
基礎(chǔ)自測
(2020·四川)某學(xué)校為了解三年級、六年級、九年級這三個年級之間的學(xué)生視力是否存在顯著差異,擬從這三個年級中按人數(shù)比例抽取部分學(xué)生進(jìn)行調(diào)查,則最合理的抽樣方法是( )
A.抽簽法 B.系統(tǒng)抽樣法 C.分層抽樣法 D.隨機(jī)數(shù)法
解:按人數(shù)比例抽取,則用分層抽樣最合理.故選C.
某學(xué)校高三一班共有60名學(xué)生,現(xiàn)采用系統(tǒng)抽樣的方法從中抽取6名學(xué)生做“早餐與健康”的調(diào)查,為此將學(xué)生編號為1,2,…,60.選取的這6名學(xué)生的編號可能是( )
A.1,2,3,4,5,6
B.6,16,26,36,46,56
C.1,2,4,8,16,32
D.3,9,13,27,36,54
解:由系統(tǒng)抽樣知識知,所選取學(xué)生編號之間的間距相等且為10,故選B.
(2020·泉州校級期末)采用系統(tǒng)抽樣的方法從2 005個個體中抽取一個容量為50的樣本,則抽樣間隔和隨機(jī)剔除的個體數(shù)分別為( )
A.40,5 B.50,5 C.5,40 D.5,50
解:因為2 005÷50=40余5,所以用系統(tǒng)抽樣法從2 005個個體中抽取一個容量為50的樣本,抽樣間隔是40,且應(yīng)隨機(jī)剔除的個體數(shù)為5.故選A.
交通管理部門為了解機(jī)動車駕駛員(簡稱駕駛員)對某新法規(guī)的知曉情況,對甲、乙、丙、丁四個社區(qū)做分層抽樣調(diào)查.假設(shè)四個社區(qū)駕駛員的總?cè)藬?shù)為N,其中甲社區(qū)有駕駛員96人.若在甲、乙、丙、丁四個社區(qū)抽取駕駛員的人數(shù)分別為12,21,25,43,則這四個社區(qū)駕駛員的總?cè)藬?shù)N為________.
解:由題意知抽樣比為,而四個社區(qū)一共抽取的駕駛員人數(shù)為12+21+25+43=101,故有=,解得N=808.故填808.
(2020·云南昆明檢測)某公司員工對戶外運(yùn)動分別持“喜歡”“不喜歡”和“一般”三種態(tài)度,其中持“一般”態(tài)度的比持“不喜歡”態(tài)度的多12人,按分層抽樣方法從該公司全體員工中選出部分員工座談戶外運(yùn)動,如果選出的人有6位對戶外運(yùn)動持“喜歡”態(tài)度,有1位對戶外運(yùn)動持“不喜歡”態(tài)度,有3位對戶外運(yùn)動持“一般”態(tài)度,那么這個公司全體員工中對戶外運(yùn)動持“喜歡”態(tài)度的有________.
解:設(shè)全體員工中對戶外運(yùn)動持“喜歡”“不喜歡”“一般”態(tài)度的人數(shù)分別為6x、x、3x,由題意可得3x-x=12,x=6,所以對戶外運(yùn)動持“喜歡”態(tài)度的有6×6=36(人).故填36.
類型一 簡單隨機(jī)抽樣
某校高一年級有43名足球運(yùn)動員,要從中抽出5人調(diào)查學(xué)習(xí)負(fù)擔(dān)情況.請用抽簽法設(shè)計一個抽樣方案.
解:(抽簽法)
第一步:編號,把43名運(yùn)動員編號為1~43;
第二步:制簽,做好大小、形狀相同的號簽,分別寫上這43個數(shù);
第三步:攪拌,將這些號簽放在暗箱中,進(jìn)行均勻攪拌;
第四步:抽簽入樣,每次從中抽取一個,連續(xù)抽取5次(不放回抽取),從而得到容量為5的入選樣本.
(隨機(jī)數(shù)表法)
第一步,將43名足球運(yùn)動員進(jìn)行編號01~43.
第二步,在隨機(jī)數(shù)表中任選一數(shù)字作為開始數(shù)字,任選一方向作為讀數(shù)方向.比如:選第7行第7個數(shù)“5”,向右讀.
第三步,從“5”開始向右每次讀取兩位,凡不在01~43中的數(shù)或已讀過的數(shù),都跳過不作記錄,依次得31,24,06,04,21.
第四步,以上號碼對應(yīng)的5個人就是要抽取的對象.(答案不唯一)
【點撥】考慮到總體中個體數(shù)較少,利用抽簽法或隨機(jī)數(shù)表法很容易獲取樣本,但須按這兩種抽樣方法的操作步驟進(jìn)行.注意掌握隨機(jī)數(shù)表的使用方法.
學(xué)校舉辦元旦晚會,需要從每班選10名男生,8名女生參加合唱節(jié)目,某班有男生32名,女生28名,試用抽簽法確定該班參加合唱的同學(xué).
解:第一步,將32名男生從00到31進(jìn)行編號;
第二步,用相同的紙條制成32個號簽,在每個號簽上寫上這些編號;
第三步,將寫好的號簽放在暗箱內(nèi)搖勻,不放回地逐個從中抽出10個號簽;
第四步,相應(yīng)編號的男生參加合唱;
第五步,用相同的辦法從28名女生中選出8名,則此8名女生參加合唱.
類型二 系統(tǒng)抽樣
(2020·天津檢測)從某廠生產(chǎn)的802輛轎車中抽取80輛測試某項性能.請合理選擇抽樣方法進(jìn)行抽樣,并寫出抽樣過程.
解:由于總體及樣本中的個體數(shù)較多,且無明顯差異,因此采用系統(tǒng)抽樣的方法,步驟如下:
第一步,先將802輛轎車編號為001,002,003,…,802.然后從802輛轎車中剔除2輛轎車(剔除方法可用隨機(jī)數(shù)法).
第二步,將余下的800輛轎車編號為1,2,…,800,并均勻分成80段,每段含=10個個體.
第三步,從第1段即1,2,…,10這10個編號中,用簡單隨機(jī)抽樣的方法抽取一個號(如5)作為起始號.
第四步,從5開始,再將編號為15,25,…,795的個體抽出,得到一個容量為80的樣本.
【點撥】①總體容量和樣本容量都較大時,選用系統(tǒng)抽樣比較合適;②系統(tǒng)抽樣的號碼成等差數(shù)列,公差為每組的容量.
將參加學(xué)校期末考試的高三年級的400名學(xué)生編號為001,002,…,400,已知這400名學(xué)生到甲、乙、丙三棟樓去考試,從001到200號在甲樓,從201到295號在乙樓,從296到400號在丙樓.現(xiàn)采用系統(tǒng)抽樣方法抽取一個容量為50的樣本,且隨機(jī)抽得的首個號碼為003,則三個樓被抽中的人數(shù)依次為________.
解:由系統(tǒng)抽樣的方法先確定分段的間隔k,k==8,故甲樓被抽中的人數(shù)為:=25(人).
因為95=11×8 +7,故乙樓被抽中的人數(shù)為12人.
故丙樓被抽中的人數(shù)為50-25-12=13(人).
故填25,12,13.
類型三 分層抽樣
某企業(yè)共有5個分布在不同區(qū)域的工廠,職工3萬人,其中職工比例為3∶2∶5∶2∶3.現(xiàn)從3萬人中抽取一個300人的樣本,分析員工的生產(chǎn)效率.已知生產(chǎn)效率與不同的地理位置的生活習(xí)俗及文化傳統(tǒng)有關(guān),問應(yīng)采取什么樣的方法?并寫出具體過程.
解:應(yīng)采取分層抽樣的方法.過程如下:
(1)將3萬人分為五層,其中一個工廠為一層.
(2)按照樣本容量的比例隨機(jī)抽取各工廠應(yīng)抽取的樣本:
300×=60(人);300×=40(人);
300×=100(人);300×=40(人);
300×=60(人).
因此各工廠應(yīng)抽取的人數(shù)分別為60人,40人,100人,40人,60人.
(3)將300人組到一起即得到一個樣本.
【點撥】分層抽樣的實質(zhì)為按比例抽取,當(dāng)總體由差異明顯的幾部分組成時,多用分層抽樣.應(yīng)認(rèn)識到,在各層抽取樣本時,又可能會用到簡單隨機(jī)抽樣,系統(tǒng)抽樣,甚至分層抽樣來抽取樣本.
(2020·天津期末)某公司有1 000名員工,其中,高層管理人員占5%,中層管理人員占15%,一般員工占80%,為了解公司的某種情況,現(xiàn)用分層抽樣的方法抽取120人進(jìn)行調(diào)查,則一般員工應(yīng)抽取____________人.
解:應(yīng)抽取一般員工120×80%=96人.故填96.
點撥
1.簡單隨機(jī)抽樣是系統(tǒng)抽樣和分層抽樣的基礎(chǔ),是一種等概率的抽樣,它的特點是:
(1)它要求總體個數(shù)較少;
(2)它是從總體中逐個抽取的;
(3)它是一種不放回抽樣.
2.系統(tǒng)抽樣又稱等距抽樣,號碼序列一旦確定,樣本即確定好了.但要注意,如果編號的個體特征隨編號的變化呈現(xiàn)一定的周期性,那么樣本的代表性是不可靠的,甚至?xí)?dǎo)致明顯的偏向.
3.分層抽樣一般在總體是由差異明顯的幾個部分組成時使用.
4.抽樣方法經(jīng)常交叉使用,比如系統(tǒng)抽樣中均勻分段后的第一段,可采用簡單隨機(jī)抽樣;分層抽樣中,若每層中個體數(shù)量仍很大時,則可輔之以系統(tǒng)抽樣等.
5.三種抽樣方法的比較
類別
共同點
各自特點
相互聯(lián)系
適用范圍
簡單隨機(jī)抽樣
抽樣過程中每個個體被抽取的概率相等
從總體中逐個抽樣
總體中的個體數(shù)較少
系統(tǒng)
抽樣
將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取
在起始部分抽樣時采用簡單隨機(jī)抽樣
總體中的個體數(shù)較多
分層
抽樣
將總體分成幾層,分層進(jìn)行抽取
分層抽樣時采用簡單隨機(jī)抽樣或系統(tǒng)抽樣
總體由差異明顯的幾部分組成
課時作業(yè)
1.下面的抽樣方法是簡單隨機(jī)抽樣的是( )
A.在某年明信片銷售活動中,規(guī)定每100萬張為一個開獎組,通過隨機(jī)抽取的方式確定號碼的后四位為2709的為三等獎
B.某車間包裝一種產(chǎn)品,在勻速的自動包裝的傳送帶上,每隔30分鐘抽一包產(chǎn)品,稱其重量是否合格
C.某學(xué)校分別從行政人員、教師、后勤人員中抽取2人、14人、4人了解學(xué)校機(jī)構(gòu)改革的意見
D.用抽簽法從10件產(chǎn)品中選取3件進(jìn)行質(zhì)量檢驗
解:選項A、B不是簡單隨機(jī)抽樣,因為抽取的個體間的間隔是固定的;選項C不是簡單隨機(jī)抽樣,因為總體的個體有明顯的層次;選項D是簡單隨機(jī)抽樣.故選D.
2.為了解1 000名學(xué)生的學(xué)習(xí)情況,采用系統(tǒng)抽樣的方法,從中抽取容量為40的樣本,則分段的間隔為( )
A.50 B.40 C.25 D.20
解:由=25,可得分段的間隔為25.故選C.
3.(2020·豫南九校模擬)某網(wǎng)絡(luò)零售平臺對購物情況做了一項調(diào)查,收回的有效問卷共500 000份,其中購買下列四種商品的人數(shù)統(tǒng)計為:服飾鞋帽198 000人,家居用品94 000人,化妝品116 000人,家用電器92 000人.為了解消費(fèi)者對商品的滿意度,該平臺用分層抽樣的方法從中選出部分問卷進(jìn)行調(diào)查,已知在購買“化妝品”這一類中抽取了116份,則在購買“家居用品”這一類中抽取的問卷份數(shù)為( )
A.92 B.94 C.116 D.118
解:在購買“化妝品”這一類中抽取了116份,設(shè)在購買“家居用品”這一類中應(yīng)抽取的問卷份數(shù)為x,則=,解得x=94.故選B.
4.在120個零件中,一級品24個,二級品36個,三級品60個.用系統(tǒng)抽樣法從中抽取容量為20的樣本,則二級品中每個個體被抽取到的概率是( )
A. B. C. D.
解:二級品中每個個體被抽到的概率等于所有零件中每個個體被抽取到的概率,所以所求的概率為=.故選B.
5.總體由編號為01,02,…,19,20的20個個體組成.利用下面的隨機(jī)數(shù)表選取5個個體,選取方法是從隨機(jī)數(shù)表第1行的第5列和第6列數(shù)字開始由左到右依次選取兩個數(shù)字,則選出來的第5個個體的編號為( )
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
A.08 B.07 C.02 D.01
解:從選定的兩位數(shù)字開始向右讀,剔除不合題意及與前面重復(fù)的編號,得到符合題意的編號分別為08,02,14,07,01,…,因此選出來的第5個個體的編號為01.故選D.
6.(2020·湖南)在一次馬拉松比賽中,35名運(yùn)動員的成績(單位:分鐘)的莖葉圖如圖所示.
若將運(yùn)動員按成績由好到差編為1~35號,再用系統(tǒng)抽樣方法從中抽取7人,則其中成績在區(qū)間[139,151]上的運(yùn)動員人數(shù)是( )
A.3 B.4 C.5 D.6
解:因為35÷7=5,因此可將編號為1~35的35個數(shù)據(jù)分成7組,每組有5個數(shù)據(jù),在區(qū)間[139,151]上共有20個數(shù)據(jù),分在4個小組中,每組取1人,共取4人.故選B.
7.為規(guī)范學(xué)校辦學(xué),省教育廳督察組對某所高中進(jìn)行了抽樣調(diào)查.抽到的班級一共有52名學(xué)生,現(xiàn)將該班學(xué)生隨機(jī)編號,用系統(tǒng)抽樣的方法抽取一個容量為4的樣本,己知7號、33號、46號同學(xué)在樣本中,那么樣本中還有一位同學(xué)的編號應(yīng)為________.
解:抽樣間隔為=13,又已知46-33=13,故另一位同學(xué)的編號為7+13=20,故填20.
8.(2020·浙江模擬)某初級中學(xué)有學(xué)生270人,其中一年級108人,二、三年級各81人,現(xiàn)要利用抽樣方法抽取10人參加某項調(diào)查,考慮選用簡單隨機(jī)抽樣、分層抽樣和系統(tǒng)抽樣三種方案,使用簡單隨機(jī)抽樣和分層抽樣時,將學(xué)生按一、二、三年級依次統(tǒng)一編號為1,2,…,270;使用系統(tǒng)抽樣時,將學(xué)生統(tǒng)一隨機(jī)編號為1,2,…,270,并將整個編號依次分為10段,如果抽得號碼有下列四種情況:
①7,34,61,88,115,142,169,196,223,250 ;
②5,9,100,107,111,121,180,195,200,265 ;
③11,38,65,92,119,146,173,200,227,254 ;
④30,57,84,111,138,165,192,219,246,270 .
關(guān)于上述樣本的下列結(jié)論:
(1)②③都不能為系統(tǒng)抽樣
(2)②④都不能為分層抽樣
(3)①④都可能為分層抽樣
(4)①③都可能為系統(tǒng)抽樣
正確的是____________.(填上所有正確結(jié)論的編號)
解:根據(jù)三種抽樣方法的特征,若是分層抽樣,則各年級應(yīng)占的比例為4∶3∶3,①②③均適合;若是系統(tǒng)抽樣,則抽取的樣本號碼應(yīng)該構(gòu)成公差為27的等差數(shù)列,且首項小于或等于27,①③適合,④的首項為30,不是系統(tǒng)抽樣,綜上知,故填(4).
9.為了考察某校的教學(xué)水平,將抽查該校高三年級部分學(xué)生本學(xué)年的考試成績進(jìn)行考察.為了全面地反映實際情況,采用以下三種方式進(jìn)行抽樣(已知該校高三年級共有20個教學(xué)班,并且每個班內(nèi)的學(xué)生已經(jīng)按隨機(jī)方式編好了學(xué)號,假定該校每班學(xué)生人數(shù)都相同):①從全年級20個班中任意抽取一個班,再從該班中任意抽取20人,考察他們的學(xué)習(xí)成績;②每個班都抽取1人,共計20人,考察這20個學(xué)生的成績;③把學(xué)生按成績分成優(yōu)秀、良好、普通三個級別,從中抽取100名學(xué)生進(jìn)行考察(已知若按成績分,該校高三學(xué)生中優(yōu)秀生共150人,良好生共600人,普通生共250人).根據(jù)上面的敘述,回答下列問題:
(1)上面三種抽取方式中,其總體、個體、樣本分別指什么?每一種抽取方式抽取的樣本中,其樣本容量分別是多少?
(2)上面三種抽取方式中各自采用了何種抽取樣本的方法?
解:(1)這三種抽取方式中,其總體都是指該校高三全體學(xué)生本學(xué)年的考試成績,個體都是指高三年級每個學(xué)生本學(xué)年的考試成績.其中第一種抽取方式中樣本為所抽取的20名學(xué)生本學(xué)年的考試成績,樣本容量為20;第二種抽取方式中,樣本為所抽取的20名學(xué)生本學(xué)年的考試成績,樣本容量為20;第三種抽取方式中,樣本為所抽取的100名學(xué)生本學(xué)年的考試成績,樣本容量為100.
(2)第一種采用簡單隨機(jī)抽樣法;第二種采用系統(tǒng)抽樣法和簡單隨機(jī)抽樣法;第三種采用分層抽樣法和簡單隨機(jī)抽樣法.
10.一支田徑隊有男運(yùn)動員56人,女運(yùn)動員42人,用分層抽樣的方法從全體運(yùn)動員中抽出一個容量為28的樣本.
解:田徑運(yùn)動員的總?cè)藬?shù)是56+42=98(人),要得到28人的樣本,占總體的比例為.于是,應(yīng)該在男運(yùn)動員中隨機(jī)抽取56×=16(人),在女運(yùn)動員中隨機(jī)抽取28-16=12(人).這樣,就可以得到一個容量為28的樣本.
11.某裝訂廠平均每小時大約裝訂圖書362冊,需要檢驗員每小時抽取40冊圖書,檢驗其質(zhì)量狀況,請你設(shè)計一個抽樣方案.
解:第一步,把這些圖書分成40個組,由于的商是9,余數(shù)是2,所以每個小組有9冊書,還剩2冊書.這時抽樣距就是9.
第二步,先用簡單隨機(jī)抽樣的方法從362冊書中抽取2冊,不進(jìn)行檢驗.
第三步,將剩下的書進(jìn)行編號,編號分別為0,1,…,359.
第四步,從第一組(編號為0,1,…,8)的書中用簡單隨機(jī)抽樣的方法,抽取1冊書,設(shè)其編號為k.
第五步,順次抽取編號分別為下面數(shù)字的書:k,k+9,k+18,k+27,…,k+39×9.這樣總共就抽取了40個樣本.
(2020·荊門元月調(diào)考)將參加數(shù)學(xué)競賽決賽的500名學(xué)生編號為:001,002,…,500,采用系統(tǒng)抽樣的方法抽取一個容量為50的樣本,分組后,在第一組采用簡單隨機(jī)抽樣抽得的號碼為003.這500名學(xué)生分別在三個考點考試,從001到200在第一考點,從201到355在第二考點,從356到500在第三考點,則第三考點被抽中的人數(shù)為( )
A.14 B.15 C.16 D.21
解:由題意可知,將500名學(xué)生平均分成50組,每組10人,第k(k∈N*)組抽到的號碼為10(k-1)+3.令356≤10(k-1)+3≤500(k∈N*),解得37≤k≤50,則滿足37≤k≤50的正整數(shù)k有14個,故第三考點被抽中的學(xué)生人數(shù)為14人.故選A.
11.2 用樣本估計總體
知識點梳理
1.用樣本的頻率分布估計總體分布
(1)通常我們對總體作出的估計一般分成兩種:一種是用樣本的__________估計總體的__________;另一種是用樣本的________估計總體的__________.
(2)在頻率分布直方圖中,縱軸表示________,數(shù)據(jù)落在各小組內(nèi)的頻率用________________表示.各小長方形的面積總和等于________.
(3)連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布________.隨著樣本容量的增加,作圖時所分的________增加,組距減小,相應(yīng)的頻率折線圖會越來越接近于一條光滑曲線,統(tǒng)計中稱之為______________,它能夠更加精細(xì)地反映出____________________________________.
(4)當(dāng)樣本數(shù)據(jù)較少時,用莖葉圖表示數(shù)據(jù)的效果較好,它不但可以____________________,而且可以______________,給數(shù)據(jù)的記錄和表示都帶來方便.
2.用樣本的數(shù)字特征估計總體的數(shù)字特征
(1)眾數(shù),中位數(shù),平均數(shù)
眾數(shù):在一組數(shù)據(jù)中,出現(xiàn)次數(shù)________的數(shù)據(jù)叫做這組數(shù)據(jù)的眾數(shù).
中位數(shù):將一組數(shù)據(jù)按大小依次排列,把處在最中間位置的一個數(shù)據(jù)(或者最中間兩個數(shù)據(jù)的________)叫做這組數(shù)據(jù)的中位數(shù).
平均數(shù):樣本數(shù)據(jù)的算術(shù)平均數(shù),即x=______________.
在頻率分布直方圖中,中位數(shù)左邊和右邊的直方圖的面積應(yīng)該________.
(2)樣本方差,樣本標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差s=,其中xn是__________________,n是________,x是________.標(biāo)準(zhǔn)差是反映總體__________的特征數(shù),樣本方差是樣本標(biāo)準(zhǔn)差的__________.通常用樣本方差估計總體方差,當(dāng)樣本容量接近總體容量時,樣本方差很接近總體方差.
自查自糾
1.(1)頻率分布 分布 數(shù)字特征 數(shù)字特征
(2) 各小長方形的面積 1
(3)折線圖 組數(shù) 總體密度曲線
總體在各個范圍內(nèi)取值的百分比
(4)保留所有信息 隨時記錄
2.(1)最多 平均數(shù) (x1+x2+…+xn) 相等
(2)樣本數(shù)據(jù)的第n項 樣本容量 平均數(shù)
波動大小 平方
基礎(chǔ)自測
(2020·山東)某高校調(diào)查了200名學(xué)生每周的自習(xí)時間(單位:小時),制成了如圖所示的頻率分布直方圖,其中自習(xí)時間的范圍是[17.5,30],樣本數(shù)據(jù)分組為[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30].根據(jù)直方圖,這200名學(xué)生中每周的自習(xí)時間不少于22.5小時的人數(shù)是( )
A.56 B.60 C.120 D.140
解:由頻率分布直方圖知,自習(xí)時間不少于22.5小時的有200×(0.16+0.08+0.04)×2.5=140(人).故選D.
(2020·全國卷Ⅲ)某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務(wù)質(zhì)量,收集并整理了2020年1月至2020年12月期間月接待游客量(單位:萬人)的數(shù)據(jù),繪制了下面的折線圖.
根據(jù)該折線圖,下列結(jié)論錯誤的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩(wěn)
解:易知B,C,D對,A錯.故選A.
(2020·全國卷Ⅱ)根據(jù)下面給出的2020年至2020年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結(jié)論中不正確的是( )
A.逐年比較,2020年減少二氧化硫排放量的效果最顯著
B.2020年我國治理二氧化硫排放顯現(xiàn)成效
C.2020年以來我國二氧化硫年排放量呈減少趨勢
D.2020年以來我國二氧化硫年排放量與年份正相關(guān)
解:根據(jù)柱形圖易知選項A,B,C正確,2020年以來我國二氧化硫年排放量與年份負(fù)相關(guān),選項D錯誤.故選D.
(2020·江蘇)已知一組數(shù)據(jù)4.7,4.8,5.1,5.4,5.5,則該組數(shù)據(jù)的方差是________.
解:這組數(shù)據(jù)的平均數(shù)
x(—)==5.1,則方差
s2===0.1.故填0.1.
(2020·山東)如圖所示的莖葉圖記錄了甲、乙兩組各5名工人某日的產(chǎn)量數(shù)據(jù)(單位:件).若這兩組數(shù)據(jù)的中位數(shù)相等,且平均值也相等,則x和y的值分別為________.
解:根據(jù)兩組數(shù)據(jù)的中位數(shù)相等可得65=60+y,解得y=5,又它們的平均值相等,所以=,解得x=3.故填3,5.
類型一 數(shù)字特征及其應(yīng)用
(2020·廣東)某工廠36名工人的年齡數(shù)據(jù)如下表:
工人編號
年齡
工人編號
年齡
工人編號
年齡
工人編號
年齡
1
40
10
36
19
27
28
34
2
44
11
31
20
43
29
39
3
40
12
38
21
41
30
43
4
41
13
39
22
37
31
38
5
33
14
43
23
34
32
42
6
40
15
45
24
42
33
53
7
45
16
39
25
37
34
37
8
42
17
38
26
44
35
49
9
43
18
36
27
42
36
39
(1)用系統(tǒng)抽樣法從36名工人中抽取容量為9的樣本,且在第一分段里用隨機(jī)抽樣法抽到的年齡數(shù)據(jù)為44,列出樣本的年齡數(shù)據(jù);
(2)計算(1)中樣本的平均值和方差s2;
(3)36名工人中年齡在-s與+s之間有多少人?所占的百分比是多少(精確到0.01%)?
解:(1)根據(jù)系統(tǒng)抽樣的方法,抽取容量為9的樣本,因此分成9組,每組4人,由于第一組中用隨機(jī)抽樣抽到的年齡數(shù)據(jù)為44,且編號間隔為4,因此,依次抽到的年齡數(shù)據(jù)為:44,40,36,43,36,37,44,43,37.
(2) =(44+40+36+43+36+37+44+43+37)=40,
s2=[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=.
(3)s===,
x(—)-s=36,x(—)+s=43,在x(—)-s與x(—)+s之間的數(shù)據(jù)是37,38,39,40,41,42,43,處在此年齡階段的工人一共有23人,所占比例為×100%≈63.89%.
【點撥】(1)根據(jù)系統(tǒng)抽樣的定義和性質(zhì),結(jié)合題意,直接列舉樣本;(2)利用均值、方差的概念求解樣本的均值x及方差s2;(3)利用(2)的結(jié)果,計算得到年齡在x(—)-s與x(—)+s之間的人數(shù),再求解百分比.本題主要考查系統(tǒng)抽樣及平均數(shù)、方差的知識,意在考查學(xué)生的數(shù)據(jù)處理能力和計算能力.
對甲、乙兩名自行車賽手在相同條件下進(jìn)行了6次測試,測得他們的最大速度(單位:m/s)的數(shù)據(jù)如下:
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
(1)畫出莖葉圖;
(2)分別求出甲、乙兩名自行車賽手最大速度(m/s)數(shù)據(jù)的平均數(shù)、方差、極差,并判斷選誰參加比賽比較合適?
解:(1)畫莖葉圖如下(中間數(shù)為數(shù)據(jù)的十位數(shù)).
(2)x(—)甲==33.
x(—)乙==33.
s=[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.
s=[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.
甲的極差為11,乙的極差為10.
綜合比較以上數(shù)據(jù)可知,甲、乙平均數(shù)相同,但乙的極差、方差相對更小,成績更穩(wěn)定,故選乙參加比賽較合適.
類型二 頻率分布表、頻率分布直方圖及其應(yīng)用
(1)(2020·四川)我國是世界上嚴(yán)重缺水的國家,某市政府為了鼓勵居民節(jié)約用水,計劃調(diào)整居民生活用水收費(fèi)方案,擬確定一個合理的月用水量標(biāo)準(zhǔn)x(噸),一位居民的月用水量不超過x的部分按平價收費(fèi),超出x的部分按議價收費(fèi).為了了解居民用水情況,通過抽樣,獲得了某年100位居民每人的月均用水量(單位:噸),將數(shù)據(jù)按照[0,0.5),[0.5,1),…,[4,4.5]分成9組,制成了如圖所示的頻率分布直方圖.
(Ⅰ)求直方圖中a的值;
(Ⅱ)設(shè)該市有30萬居民,估計全市居民中月均用水量不低于3噸的人數(shù),并說明理由;
(Ⅲ)若該市政府希望使85%的居民每月的用水量不超過標(biāo)準(zhǔn)x(噸),估計x的值,并說明理由.
解:(Ⅰ)由頻率分布直方圖知,月均用水量在[0,0.5)中的頻率為0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的頻率分別為0.08,0.20,0.26,0.06,0.04,0.02,由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.
(Ⅱ)由(Ⅰ)可知,100位居民每人月均用水量不低于3噸的頻率為0.06+0.04+0.02=0.12.
由以上樣本的頻率,可以估計全市30萬居民中月均用水量不低于3噸的人數(shù)為300 000×0.12=36 000.
(Ⅲ)因為前6組的頻率之和為0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
而前5組的頻率之和為0.04+0.08+0.15+0.20+0.26=0.73<0.85,
所以2.5≤x<3.
由0.3×(x-2.5)=0.85-0.73,解得x=2.9.
所以,估計月用水量標(biāo)準(zhǔn)為2.9噸時,85%的居民每月的用水量不超過標(biāo)準(zhǔn).
(2)(2020·北京)某市居民用水?dāng)M實行階梯水價,每人月用水量中不超過w立方米的部分按4元/立方米收費(fèi),超出w立方米的部分按10元/立方米收費(fèi),從該市隨機(jī)調(diào)查了10000位居民,獲得了他們某月的用水量數(shù)據(jù),整理得到如下頻率分布直方圖:
(Ⅰ)如果w為整數(shù),那么根據(jù)此次調(diào)查,為使80%以上居民在該月的用水價格為4元/立方米,w至少定為多少?
(Ⅱ)假設(shè)同組中的每個數(shù)據(jù)用該組區(qū)間的右端點值代替.當(dāng)w=3時,估計該市居民該月的人均水費(fèi).
解:(Ⅰ)由用水量的頻率分布直方圖知,
該市居民該月用水量在區(qū)間[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]內(nèi)的頻率依次為0.1,0.15,0.2,0.25,0.15.
所以該月用水量不超過3立方米的居民占85%,用水量不超過2立方米的居民占45%.
依題意,w至少定為3.
(Ⅱ)由用水量的頻率分布直方圖及題意,得居民該月用水費(fèi)用的數(shù)據(jù)分組與頻率分布表:
組號
1
2
3
4
5
6
7
8
分組
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
頻率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根據(jù)題意,該市居民該月的人均水費(fèi)估計為:
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
【點撥】在頻率分布直方圖中,每個小矩形的面積就是相應(yīng)的頻率或概率,所有小矩形的面積之和為1,這是解題的關(guān)鍵,也是識圖的基礎(chǔ).
(1)(北京朝陽2020屆二模)從某市的中學(xué)生中隨機(jī)調(diào)查了部分男生,獲得了他們的身高數(shù)據(jù),整理得到如下頻率分布直方圖.
(Ⅰ)求a的值;
(Ⅱ)假設(shè)同組中的每個數(shù)據(jù)用該組區(qū)間的中點值代替,估計該市中學(xué)生中的全體男生的平均身高;
(Ⅲ)從該市的中學(xué)生中隨機(jī)抽取一名男生,根據(jù)直方圖中的信息,估計其身高在180 cm以上的概率.若從全市中學(xué)的男生(人數(shù)眾多)中隨機(jī)抽取3人,用X表示身高在180 cm以上的男生人數(shù),求隨機(jī)變量X的分布列和數(shù)學(xué)期望E(X).
解:(Ⅰ)根據(jù)題意得: (0.005×2+a+0.020×2+0.040)×10=1.解得a=0.010.
(Ⅱ)設(shè)樣本中男生身高的平均值為x(—),則
x(—)=145×0.05+155×0.1+165×0.2+175×0.4+185×0.2+195×0.05
=(145+195)×0.05+155×0.1+(165+185)×0.2+175×0.4
=17+15.5+70+70=172.5.
所以估計該市中學(xué)生中全體男生的平均身高為172.5 cm.
(Ⅲ)從全市中學(xué)的男生中任意抽取一人,其身高在180 cm以上的概率約為.
由已知得,隨機(jī)變量X的可能取值為0,1,2,3.
所以P(X=0)=C·=;
P(X=1)=C·=;
P(X=2)=C·=;
P(X=3)=C·=.
隨機(jī)變量X的分布列為
X
0
1
2
3
P
因為X~ B,所以E(X)=3×=.
(2)(2020·貴州模擬)一組樣本數(shù)據(jù)的頻率分布直方圖如圖所示,試估計此樣本數(shù)據(jù)的中位數(shù)為( )
A.13 B.12 C.11.52 D.
解:由圖知,(0.02+0.08)×4=0.4,則樣本數(shù)據(jù)的中位數(shù)為10+4×=.故選D.
類型三 莖葉圖及其應(yīng)用
(2020·全國卷Ⅱ)某公司為了解用戶對其產(chǎn)品的滿意度,從A,B兩地區(qū)分別隨機(jī)調(diào)查了20個用戶,得到用戶對產(chǎn)品的滿意度評分如下:
A地區(qū):
62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地區(qū):
73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根據(jù)兩組數(shù)據(jù)完成兩地區(qū)用戶滿意度評分的莖葉圖,并通過莖葉圖比較兩地區(qū)滿意度評分的平均值及分散程度(不要求計算出具體值,給出結(jié)論即可);
A地區(qū)
B地區(qū)
4
5
6
7
8
9
(2)根據(jù)用戶滿意度評分,將用戶的滿意度從低到高分為三個等級:
滿意度評分
低于70分
70分到89分
不低于90分
滿意度等級
不滿意
滿意
非常滿意
記事件C:“A地區(qū)用戶的滿意度等級高于B地區(qū)用戶的滿意度等級”.假設(shè)兩地區(qū)用戶的評價結(jié)果相互獨(dú)立.根據(jù)所給數(shù)據(jù),以事件發(fā)生的頻率作為相應(yīng)事件發(fā)生的概率,求C的概率.
解:(1)兩地區(qū)用戶滿意度評分的莖葉圖如下
A地區(qū)
B地區(qū)
3
6 4 2
6 8 8 6 4 3
9 2 8 6 5 1
7 5 5 2
4
5
6
7
8
9
6 8
1 3 6 4
2 4 5 5
3 3 4 6 9
3 2 1
1 3
通過莖葉圖可以看出,A地區(qū)用戶滿意度評分的平均值高于B地區(qū)用戶滿意度評分的平均值;A地區(qū)用戶滿意度評分比較集中,B地區(qū)用戶滿意度評分比較分散.
(2)記CA1表示事件:“A地區(qū)用戶的滿意等級為滿意或非常滿意”;
CA2表示事件:“A地區(qū)用戶的滿意等級為非常滿意”;
CB1表示事件:“B地區(qū)用戶的滿意度等級為不滿意”;
CB2表示事件:“B地區(qū)用戶的滿意度等級為滿意”,
則CA1與CB1獨(dú)立,CA2與CB2獨(dú)立,CB1與CB2互斥,C=CB1CA1∪CB2CA2.
P(C)=P(CB1CA1∪CB2CA2)=P(CB1CA1)+P(CB2CA2)
=P(CB1)P(CA1)+P(CB2)P(CA2).
由所給數(shù)據(jù)得CA1,CA2,CB1,CB2發(fā)生的頻率分別為,,,,故P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=,P(C)=×+×=0.48.
【點撥】本題考查莖葉圖和特征數(shù)、互斥事件和獨(dú)立事件,根據(jù)莖葉的密集程度比較平均值大小,如果密集主干部位在高位,那么平均值大;方差看它們的數(shù)字偏離程度,偏離越大則方差越大.讀懂所求概率事件包含的基本事件的含義,利用分類討論思想將事件分解為幾個互斥事件的情況來求概率.
某市為了考核甲、乙兩部門的工作情況,隨機(jī)訪問了50位市民.根據(jù)這50位市民對這兩部門的評分(評分越高表明市民的評價越高),繪制莖葉圖如下:
(1)分別估計該市的市民對甲、乙兩部門評分的中位數(shù);
(2)分別估計該市的市民對甲、乙兩部門的評分高于90的概率;
(3)根據(jù)莖葉圖分析該市的市民對甲、乙兩部門的評價.
解:(1)由所給莖葉圖知,50位市民對甲部門的評分由小到大排序,排在第25,26位的是75,75,故樣本中位數(shù)為75,所以該市的市民對甲部門評分的中位數(shù)的估計值是75.50位市民對乙部門的評分由小到大排序,排在第25,26位的是66,68,故樣本中位數(shù)為67,所以該市的市民對乙部門評分的中位數(shù)的估計值是67.
(2)由所給莖葉圖知,50位市民對甲、乙部門的評分高于90的比率分別為=0.1,=0.16.故該市的市民對甲、乙部門的評分高于90的概率的估計值分別為0.1,0.16.
(3)由所給莖葉圖知,市民對甲部門的評分的中位數(shù)高于對乙部門的評分的中位數(shù),而且由莖葉圖可以大致看出對甲部門的評分的標(biāo)準(zhǔn)差要小于對乙部門的評分的標(biāo)準(zhǔn)差,說明該市市民對甲部門的評價較高、評價較為一致,對乙部門的評價較低、評價差異較大.
點撥
1.用樣本估計總體是統(tǒng)計的基本思想,而利用頻率分布表和頻率分布直方圖來估計總體則是用樣本的頻率分布去估計總體分布的兩種主要方法.分布表在數(shù)量表示上比較準(zhǔn)確,直方圖比較直觀.
2.頻率分布表中的頻數(shù)之和等于樣本容量,各組中的頻率之和等于1;在頻率分布直方圖中,各小長方形的面積表示相應(yīng)各組的頻率,所以,所有小長方形的面積的和等于1.
3.莖葉圖的優(yōu)點是原有信息不會抹掉,能夠展示數(shù)據(jù)分布情況,但當(dāng)樣本數(shù)據(jù)較多或數(shù)據(jù)位數(shù)較多時,莖葉圖就顯得不太方便了.
4.標(biāo)準(zhǔn)差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越?。驗榉讲钆c原始數(shù)據(jù)的單位不同,且平方后可能夸大了偏差的程度,所以雖然方差與標(biāo)準(zhǔn)差都是測量樣本數(shù)據(jù)離散程度的工具,但在解決實際問題時,一般多采用標(biāo)準(zhǔn)差.
課時作業(yè)
1.在“世界讀書日”前夕,為了了解某地5 000名居民某天的閱讀時間,從中抽取了200名居民的閱讀時間進(jìn)行統(tǒng)計分析.在這個問題中,5 000名居民的閱讀時間的全體是( )
A.總體 B.個體 C.樣本的容量 D.從總體中抽取的一個樣本
解:5 000名居民的閱讀時間的全體是總體,每名居民的閱讀時間是個體,200是樣本容量.故選A.
2.(2020·陜西質(zhì)檢)一個頻數(shù)分布表(樣本容量為30)不小心被損壞了一部分(如圖),若樣本中數(shù)據(jù)在[20,60)內(nèi)的頻率為0.8,則樣本中在[40,60)內(nèi)的數(shù)據(jù)個數(shù)為( )
A.15 B.16 C.17 D.19
解:由題意知,樣本中在[40,60)內(nèi)的數(shù)據(jù)個數(shù)為30×0.8-4-5=15.故選A.
3.若樣本數(shù)據(jù)x1,x2,…,x10的標(biāo)準(zhǔn)差為8,則數(shù)據(jù)2x1-1,2x2-1,…,2x10-1的標(biāo)準(zhǔn)差為( )
A.8 B.15 C.16 D.32
解:令yi=2xi-1(i=1,2,3,…,10),則sy=2sx=16.故選C.
4.(成都七中2020年一模)某校教育處連續(xù)30天對同學(xué)們的著裝進(jìn)行檢查,著裝不合格的人數(shù)見如圖所示的莖葉圖,則中位數(shù)、眾數(shù)、極差分別是( )
A.44,45,56 B.44,43,57 C.44,43,56 D.45,43,57
解:由莖葉圖知,排在第15,16位的是43,45,故中位數(shù)為44.觀察莖葉圖易知,眾數(shù)為43,極差為67-10=57.故選B.
5.(2020·全國卷Ⅲ)某旅游城市為向游客介紹本地的氣溫情況,繪制了一年中各月平均最高氣溫和平均最低氣溫的雷達(dá)圖.圖中A點表示十月的平均最高氣溫約為15℃,B點表示四月的平均最低氣溫約為5℃.下面敘述不正確的是( )
A.各月的平均最低氣溫都在0℃以上
B.七月的平均溫差比一月的平均溫差大
C.三月和十一月的平均最高氣溫基本相同
D.平均最高氣溫高于20℃的月份有5個
解:平均最高氣溫高于20℃的月份只有七、八兩個月份,D敘述不正確.故選D.
6.某科研所共有職工20人,其年齡統(tǒng)計表如下:
年齡
38
39
40
41
42
人數(shù)
5
3
2
由于電腦故障,有兩個數(shù)字在表格中不能顯示出來,則下列說法正確的是( )
A.年齡數(shù)據(jù)的中位數(shù)是40,眾數(shù)是38
B.年齡數(shù)據(jù)的中位數(shù)和眾數(shù)一定相等
C.年齡數(shù)據(jù)的平均數(shù)x∈(39,40)
D.年齡數(shù)據(jù)的平均數(shù)一定大于中位數(shù)
解:根據(jù)表中數(shù)據(jù),得(5×38+10×39+3×41+2×42)<x(—)<(5×38+10×40+3×41+2×42),解得39.35<x(—)<39.85,所以x(—)∈(39,40).故選C.
7.(2020·湖北)某電子商務(wù)公司對10 000名網(wǎng)絡(luò)購物者上一年度的消費(fèi)情況進(jìn)行統(tǒng)計,發(fā)現(xiàn)消費(fèi)金額(單位:萬元)都在區(qū)間[0.3,0.9]內(nèi),其頻率分布直方圖如圖所示.
(1)直方圖中的a=____________;
(2)在這些購物者中,消費(fèi)金額在區(qū)間[0.5,0.9]內(nèi)的購物者的人數(shù)為____________.
解:(1)由頻率分布直方圖及頻率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.
(2)消費(fèi)金額在區(qū)間[0.5,0.9]內(nèi)的頻率為0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消費(fèi)金額在區(qū)間[0.5,0.9]內(nèi)的購物者的人數(shù)為0.6×10 000=6 000.故填3;6 000.
8.抽樣統(tǒng)計甲、乙兩位射擊運(yùn)動員的5次訓(xùn)練成績(單位:環(huán)),結(jié)果如下:
運(yùn)動員
第1次
第2次
第3次
第4次
第5次
甲
8.7
9.1
9.0
8.9
9.3
乙
8.9
9.0
9.1
8.8
9.2
則成績較為穩(wěn)定(方差較小)的那位運(yùn)動員成績的方差為________.
解:x(—)甲==9.0,
x(—)乙==9.0,
s=[(8.7-9.0)2+(9.1-9.0)2+(9.0-9.0)2+(8.9-9.0)2+(9.3-9.0)2]=0.04,s=[(8.9-9.0)2+(9.0-9.0)2+(9.1-9.0)2+(8.8-9.0)2+(9.2-9.0)2]=0.02,s<s,所以成績較為穩(wěn)定的運(yùn)動員乙成績的方差為0.02.故填0.02.
9.(2020·吉林二次調(diào)研)某車間20名工人年齡數(shù)據(jù)如下表:
年齡(歲)
19
24
26
30
34
35
40
合計
工人數(shù)(人)
1
3
3
5
4
3
1
20
(1)求這20名工人年齡的眾數(shù)與平均數(shù);
(2)以十位數(shù)為莖,個位數(shù)為葉,作出這20名工人年齡的莖葉圖;
(3)從年齡在24和26的工人中隨機(jī)抽取2人,求這2人均是24歲的概率.
解:(1)由題意可知,這20名工人年齡的眾數(shù)是30,平均數(shù)為x(—)=×(19+24×3+26×3+30×5+34×4+35×3+40)=30.
(2)這20名工人年齡的莖葉圖為,
(3)所求概率P==.
10.(2020·北京)某大學(xué)藝術(shù)專業(yè)400名學(xué)生參加某次測評,根據(jù)男女學(xué)生人數(shù)比例,使用分層抽樣的方法從中隨機(jī)抽取了100名學(xué)生,記錄他們的分?jǐn)?shù),將數(shù)據(jù)分成7組:[20,30),[30,40),…,[80,90],并整理得到如下頻率分布直方圖:
(1)從總體的400名學(xué)生中隨機(jī)抽取一人,估計其分?jǐn)?shù)小于70的概率;
(2)已知樣本中分?jǐn)?shù)小于40的學(xué)生有5人,試估計總體中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù);
(3)已知樣本中有一半男生的分?jǐn)?shù)不小于70,且樣本中分?jǐn)?shù)不小于70的男女生人數(shù)相等.試估計總體中男生和女生人數(shù)的比例.
解:(1)根據(jù)頻率分布直方圖可知,樣本中分?jǐn)?shù)不小于70的頻率為(0.02+0.04)×10=0.6,所以樣本中分?jǐn)?shù)小于70的頻率為1-0.6=0.4,所以所求為0.4.
(2)根據(jù)題意,樣本中分?jǐn)?shù)不小于50的頻率為(0.01+0.02+0.04+0.02)×10=0.9,分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù)為100-100×0.9-5=5.
所以總體中分?jǐn)?shù)在區(qū)間[40,50)內(nèi)的人數(shù)估計為400×=20.
(3)由題意可知,樣本中分?jǐn)?shù)不小于70的學(xué)生人數(shù)為(0.02+0.04)×10×100=60,
所以樣本中分?jǐn)?shù)不小于70的男生人數(shù)為60×=30.
所以樣本中的男生人數(shù)為30×2=60,女生人數(shù)為100-60=40,男生和女生人數(shù)的比例為60∶40=3∶2.
所以根據(jù)分層抽樣原理,總體中男生和女生人數(shù)的比例估計為3∶2.
11.(2020·北京)A,B,C三個班共有100名學(xué)生,為調(diào)查他們的體育鍛煉情況,通過分層抽樣獲得了部分學(xué)生一周的鍛煉時間,數(shù)據(jù)如下表(單位:小時):
A班
6
6.5
7
7.5
8
B班
6
7
8
9
10
11
12
C班
3
4.5
6
7.5
9
10.5
12
13.5
(1)試估計C班的學(xué)生人數(shù);
(2)從A班和C班抽出的學(xué)生中,各隨機(jī)選取一人,A班選出的人記為甲,C班選出的人記為乙.假設(shè)所有學(xué)生的鍛煉時間相互獨(dú)立,求該周甲的鍛煉時間比乙的鍛煉時間長的概率;
(3)再從A,B,C三個班中各隨機(jī)抽取一名學(xué)生,他們該周的鍛煉時間分別是7,9,8.25(單位:小時).這3個新數(shù)據(jù)與表格中的數(shù)據(jù)構(gòu)成的新樣本的平均數(shù)記為μ1,表格中數(shù)據(jù)的平均數(shù)記為μ0,試判斷μ0和μ1的大小(結(jié)論不要求證明).
解:(1)C班學(xué)生人數(shù)約為100×=100×=40(人).
(2)設(shè)事件Ai為“甲是現(xiàn)有樣本中A班的第i個人”,i=1,2,…,5.
事件Cj為“乙是現(xiàn)有樣本中C班的第j個人”,j=1,2,…,8.
由題意可知P(Ai)=,i=1,2,…,5;P(Cj)=,j=1,2,…,8.
P(AiCj)=P(Ai)P(Cj)=×=,i=1,2,…,5,j=1,2,…,8.
設(shè)事件E為“該周甲的鍛煉時間比乙的鍛煉時間長”,由題意知,
E=A1C1∪A1C2∪A2C1∪A2C2∪A2C3∪A3C