有時(shí)候,灑脫一點(diǎn),眼前便柳暗花明;寬容一點(diǎn),心中便海闊天空。身邊的世界往往比我們想象的要睿智與寬容。心存感激,永不放棄!即使是在猛烈的風(fēng)雨中,我們也要有抬起頭,直面前方的勇氣。因?yàn)檎埾嘈牛喝魏慰嚯y的經(jīng)歷,只要不是毀滅,就是財(cái)富!高一頻道為你整理了《高一數(shù)學(xué)必修四線性回歸分析知識點(diǎn)》希望對你有幫助!
【一】
重點(diǎn)難點(diǎn)講解:
1.回歸分析:
就是對具有相關(guān)關(guān)系的兩個(gè)變量之間的關(guān)系形式進(jìn)行測定,確定一個(gè)相關(guān)的數(shù)學(xué)表達(dá)式,以便進(jìn)行估計(jì)預(yù)測的統(tǒng)計(jì)分析方法。根據(jù)回歸分析方法得出的數(shù)學(xué)表達(dá)式稱為回歸方程,它可能是直線,也可能是曲線。
2.線性回歸方程
設(shè)x與y是具有相關(guān)關(guān)系的兩個(gè)變量,且相應(yīng)于n組觀測值的n個(gè)點(diǎn)(xi,yi)(i=1,......,n)大致分布在一條直線的附近,則回歸直線的方程為。
其中。
3.線性相關(guān)性檢驗(yàn)
線性相關(guān)性檢驗(yàn)是一種假設(shè)檢驗(yàn),它給出了一個(gè)具體檢驗(yàn)y與x之間線性相關(guān)與否的辦法。
①在課本附表3中查出與顯著性水平0.05與自由度n-2(n為觀測值組數(shù))相應(yīng)的相關(guān)系數(shù)臨界值r0.05。
②由公式,計(jì)算r的值。
③檢驗(yàn)所得結(jié)果
如果|r|≤r0.05,可以認(rèn)為y與x之間的線性相關(guān)關(guān)系不顯著,接受統(tǒng)計(jì)假設(shè)。
如果|r|>r0.05,可以認(rèn)為y與x之間不具有線性相關(guān)關(guān)系的假設(shè)是不成立的,即y與x之間具有線性相關(guān)關(guān)系。
典型例題講解:
例1.從某班50名學(xué)生中隨機(jī)抽取10名,測得其數(shù)學(xué)考試成績與物理考試成績資料如表:序號12345678910數(shù)學(xué)成績54666876788285879094,物理成績61806286847685828896試建立該10名學(xué)生的物理成績對數(shù)學(xué)成績的線性回歸模型。
解:設(shè)數(shù)學(xué)成績?yōu)閤,物理成績?yōu)椋瑒t可設(shè)所求線性回歸模型為,
計(jì)算,代入公式得∴所求線性回歸模型為=0.74x+22.28。
說明:將自變量x的值分別代入上述回歸模型中,即可得到相應(yīng)的因變量的估計(jì)值,由回歸模型知:數(shù)學(xué)成績每增加1分,物理成績平均增加0.74分。大家可以在老師的幫助下對自己班的數(shù)學(xué)、化學(xué)成績進(jìn)行分析。
例2.假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費(fèi)用y(萬元),有如下的統(tǒng)計(jì)資料:x23456y2.23.85.56.57.0
若由資料可知y對x成線性相關(guān)關(guān)系。試求:
(1)線性回歸方程;(2)估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?
分析:本題為了降低難度,告訴了y與x間成線性相關(guān)關(guān)系,目的是訓(xùn)練公式的使用。
解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.049162536于是b=,。∴線性回歸方程為:=bx+a=1.23x+0.08。
(2)當(dāng)x=10時(shí),=1.23×10+0.08=12.38(萬元)即估計(jì)使用10年時(shí)維修費(fèi)用是12.38萬元。
說明:本題若沒有告訴我們y與x間是線性相關(guān)的,應(yīng)首先進(jìn)行相關(guān)性檢驗(yàn)。如果本身兩個(gè)變量不具備線性相關(guān)關(guān)系,或者說它們之間相關(guān)關(guān)系不顯著時(shí),即使求出回歸方程也是沒有意義的,而且其估計(jì)與預(yù)測也是不可信的。
例3.某省七年的國民生產(chǎn)總值及社會商品零售總額如下表所示:已知國民生產(chǎn)總值與社會商品的零售總額之間存在線性關(guān)系,請建立回歸模型。年份國民生產(chǎn)總值(億元)
社會商品零售總額(億元)1985396.26205.821986442.04227.951987517.77268.661988625.10337.521989700.83366.001990792.54375.111991858.47413.18合計(jì)4333.012194.24
解:設(shè)國民生產(chǎn)總值為x,社會商品零售總額為y,設(shè)線性回歸模型為。
依上表計(jì)算有關(guān)數(shù)據(jù)后代入的表達(dá)式得:∴所求線性回歸模型為y=0.445957x+37.4148,表明國民生產(chǎn)總值每增加1億元,社會商品零售總額將平均增加4459.57萬元。
例4.已知某地每單位面積菜地年平均使用氮肥量xkg與每單位面積蔬菜每年平均產(chǎn)量yt之間的關(guān)系有如下數(shù)據(jù):年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份19931994199519961997199871999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x與y之間的相關(guān)系數(shù),并檢驗(yàn)是否線性相關(guān);
(2)若線性相關(guān),求蔬菜產(chǎn)量y與使用氮肥量之間的回歸直線方程,并估計(jì)每單位面積施肥150kg時(shí),每單位面積蔬菜的年平均產(chǎn)量。
分析:(1)使用樣本相關(guān)系數(shù)計(jì)算公式來完成;(2)查表得出顯著水平0.05與自由度15-2相應(yīng)的相關(guān)系數(shù)臨界值r0.05比較,若r>r0.05,則線性相關(guān),否則不線性相關(guān)。
解:(1)列出下表,并用科學(xué)計(jì)算器進(jìn)行有關(guān)計(jì)算:i123456789101112131415xi707480788592909592108115123130138145yi5.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0xiyi357444544608.4765938.490011401058118813571500.616251766.41885,.故蔬菜產(chǎn)量與施用氮肥量的相關(guān)系數(shù):r=由于n=15,故自由度15-2=13。由相關(guān)系數(shù)檢驗(yàn)的臨界值表查出與顯著水平0.05及自由度13相關(guān)系數(shù)臨界值r0.05=0.514,則r>r0.05,從而說明蔬菜產(chǎn)量與氮肥量之間存在著線性相關(guān)關(guān)系。
(2)設(shè)所求的回歸直線方程為=bx+a,則∴回歸直線方程為=0.0931x+0.7102。
當(dāng)x=150時(shí),y的估值=0.0931×150+0.7102=14.675(t)。
說明:求解兩個(gè)變量的相關(guān)系數(shù)及它們的回歸直線方程的計(jì)算量較大,需要細(xì)心謹(jǐn)慎計(jì)算,如果會使用含統(tǒng)計(jì)的科學(xué)計(jì)算器,能簡單得到,這些量,也就無需有制表這一步,直接算出結(jié)果就行了。另外,利用計(jì)算機(jī)中有關(guān)應(yīng)用程序也可以對這些數(shù)據(jù)進(jìn)行處理。
【二】
問題提出
1.函數(shù)是研究兩個(gè)變量之間的依存關(guān)系的一種數(shù)量形式.對于兩個(gè)變量,如果當(dāng)一個(gè)變量的取值一定時(shí),另一個(gè)變量的取值被惟一確定,則這兩個(gè)變量之間的關(guān)系就是一個(gè)函數(shù)關(guān)系.
2.在中學(xué)校園里,有這樣一種說法:“如果你的數(shù)學(xué)成績好,那么你的物理學(xué)習(xí)就不會有什么大問題.”按照這種說法,似乎學(xué)生的物理成績與數(shù)學(xué)成績之間存在著某種關(guān)系,我們把數(shù)學(xué)成績和物理成績看成是兩個(gè)變量,那么這兩個(gè)變量之間的關(guān)系是函數(shù)關(guān)系嗎?
3.我們不能通過一個(gè)人的數(shù)學(xué)成績是多少就準(zhǔn)確地?cái)喽ㄆ湮锢沓煽兡苓_(dá)到多少,學(xué)習(xí)興趣、學(xué)習(xí)時(shí)間、教學(xué)水平等,也是影響物理成績的一些因素,但這兩個(gè)變量是有一定關(guān)系的,它們之間是一種不確定性的關(guān)系.類似于這樣的兩個(gè)變量之間的關(guān)系,有必要從理論上作些探討,如果能通過數(shù)學(xué)成績對物理成績進(jìn)行合理估計(jì),將有著非常重要的現(xiàn)實(shí)意義.
知識探究(一):變量之間的相關(guān)關(guān)系
思考1:考察下列問題中兩個(gè)變量之間的關(guān)系:
(1)商品銷售收入與廣告支出經(jīng)費(fèi);
(2)糧食產(chǎn)量與施肥量;
(3)人體內(nèi)的脂肪含量與年齡.
這些問題中兩個(gè)變量之間的關(guān)系是函數(shù)關(guān)系嗎?
思考2:“出高徒”可以解釋為教師的水平越高,學(xué)生的水平就越高,那么學(xué)生的學(xué)業(yè)成績與教師的教學(xué)水平之間的關(guān)系是函數(shù)關(guān)系嗎?你能舉出類似的描述生活中兩個(gè)變量之間的這種關(guān)系的成語嗎?
思考3:上述兩個(gè)變量之間的關(guān)系是一種非確定性關(guān)系,稱之為相關(guān)關(guān)系,那么相關(guān)關(guān)系的含義如何?
自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系,叫做相關(guān)關(guān)系.
1、球的體積和球的半徑具有()
A函數(shù)關(guān)系B相關(guān)關(guān)系
C不確定關(guān)系D無任何關(guān)系
2、下列兩個(gè)變量之間的關(guān)系不是
函數(shù)關(guān)系的是()
A角的度數(shù)和正弦值
B速度一定時(shí),距離和時(shí)間的關(guān)系
C正方體的棱長和體積
D日照時(shí)間和水稻的畝產(chǎn)量AD練:知識探究(二):散點(diǎn)圖
【問題】在對人體脂肪含量和年齡關(guān)系的研究中,研究人員獲得了一組樣本數(shù)據(jù):
其中各年齡對應(yīng)的脂肪數(shù)據(jù)是這個(gè)年齡人群脂肪含量的樣本平均數(shù).
思考1:對某一個(gè)人來說,他的體內(nèi)脂肪含量不一定隨年齡增長而增加或減少,但是如果把很多個(gè)體放在一起,就可能表現(xiàn)出一定的規(guī)律性.觀察上表中的數(shù)據(jù),大體上看,隨著年齡的增加,人體脂肪含量怎樣變化?
思考2:為了確定年齡和人體脂肪含量之間的更明確的關(guān)系,我們需要對數(shù)據(jù)進(jìn)行分析,通過作圖可以對兩個(gè)變量之間的關(guān)系有一個(gè)直觀的印象.以x軸表示年齡,y軸表示脂肪含量,你能在直角坐標(biāo)系中描出樣本數(shù)據(jù)對應(yīng)的圖形嗎?
思考3:上圖叫做散點(diǎn)圖,你能描述一下散點(diǎn)圖的含義嗎?
在平面直角坐標(biāo)系中,表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)圖形,稱為散點(diǎn)圖.
思考4:觀察散點(diǎn)圖的大致趨勢,人的年齡的與人體脂肪含量具有什么相關(guān)關(guān)系?
思考5:在上面的散點(diǎn)圖中,這些點(diǎn)散布在從左下角到右上角的區(qū)域,對于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).一般地,如果兩個(gè)變量成正相關(guān),那么這兩個(gè)變量的變化趨勢如何?
思考6:如果兩個(gè)變量成負(fù)相關(guān),從整體上看這兩個(gè)變量的變化趨勢如何?其散點(diǎn)圖有什么特點(diǎn)?
一個(gè)變量隨另一個(gè)變量的變大而變小,散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域.
一般情況下兩個(gè)變量之間的相關(guān)關(guān)系成正相關(guān)或負(fù)相關(guān),類似于函數(shù)的單調(diào)性.
知識探究(一):回歸直線
思考1:一組樣本數(shù)據(jù)的平均數(shù)是樣本數(shù)據(jù)的中心,那么散點(diǎn)圖中樣本點(diǎn)的中心如何確定?它一定是散點(diǎn)圖中的點(diǎn)嗎?
思考2:在各種各樣的散點(diǎn)圖中,有些散點(diǎn)圖中的點(diǎn)是雜亂分布的,有些散點(diǎn)圖中的點(diǎn)的分布有一定的規(guī)律性,年齡和人體脂肪含量的樣本數(shù)據(jù)的散點(diǎn)圖中的點(diǎn)的分布有什么特點(diǎn)?
這些點(diǎn)大致分布在一條直線附近.
思考3:如果散點(diǎn)圖中的點(diǎn)的分布,從整體上看大致在一條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.對具有線性相關(guān)關(guān)系的兩個(gè)變量,其回歸直線一定通過樣本點(diǎn)的中心嗎?
思考4:對一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),你認(rèn)為其回歸直線是一條還是幾條?
思考5:在樣本數(shù)據(jù)的散點(diǎn)圖中,能否用直尺準(zhǔn)確畫出回歸直線?借助計(jì)算機(jī)怎樣畫出回歸直線?
知識探究(二):回歸方程
在直角坐標(biāo)系中,任何一條直線都有相應(yīng)的方程,回歸直線的方程稱為回歸方程.對一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),如果能夠求出它的回歸方程,那么我們就可以比較具體、清楚地了解兩個(gè)相關(guān)變量的內(nèi)在聯(lián)系,并根據(jù)回歸方程對總體進(jìn)行估計(jì).
思考1:回歸直線與散點(diǎn)圖中各點(diǎn)的位置應(yīng)具有怎樣的關(guān)系?
整體上接近
思考2:對于求回歸直線方程,你有哪些想法?
思考4:為了從整體上反映n個(gè)樣本數(shù)據(jù)與回歸直線的接近程度,你認(rèn)為選用哪個(gè)數(shù)量關(guān)系來刻畫比較合適?20.9%某小賣部為了了解熱茶銷售量與氣溫
之間的關(guān)系,隨機(jī)統(tǒng)計(jì)并制作了某6天
賣出熱茶的杯數(shù)與當(dāng)天氣溫的對照表:
如果某天的氣溫是-50C,你能根據(jù)這些
數(shù)據(jù)預(yù)測這天小賣部賣出熱茶的杯數(shù)嗎?
實(shí)例探究
為了了解熱茶銷量與
氣溫的大致關(guān)系,我們
以橫坐標(biāo)x表示氣溫,
縱坐標(biāo)y表示熱茶銷量,
建立直角坐標(biāo)系.將表
中數(shù)據(jù)構(gòu)成的6個(gè)數(shù)對
表示的點(diǎn)在坐標(biāo)系內(nèi)
標(biāo)出,得到下圖。
你發(fā)現(xiàn)這些點(diǎn)有什么規(guī)律?
今后我們稱這樣的圖為散點(diǎn)圖(scatterplot).
建構(gòu)數(shù)學(xué)
所以,我們用類似于估計(jì)平均數(shù)時(shí)的
思想,考慮離差的平方和
當(dāng)x=-5時(shí),熱茶銷量約為66杯
線性回歸方程:
一般地,設(shè)有n個(gè)觀察數(shù)據(jù)如下:當(dāng)a,b使2.三點(diǎn)(3,10),(7,20),(11,24)的
線性回歸方程是()D11.69
二、求線性回歸方程
例2:觀察兩相關(guān)變量得如下表:
求兩變量間的回歸方程解1:列表:
閱讀課本P73例1
EXCEL作散點(diǎn)圖
利用線性回歸方程解題步驟:
1、先畫出所給數(shù)據(jù)對應(yīng)的散點(diǎn)圖;
2、觀察散點(diǎn),如果在一條直線附近,則說明所給量具有線性相關(guān)關(guān)系
3、根據(jù)公式求出線性回歸方程,并解決其他問題。
(1)如果x=3,e=1,分別求兩個(gè)模型中y的值;(2)分別說明以上兩個(gè)模型是確定性
模型還是隨機(jī)模型.
模型1:y=6+4x;模型2:y=6+4x+e.
解(1)模型1:y=6+4x=6+4×3=18;
模型2:y=6+4x+e=6+4×3+1=19.C線性相關(guān)與線性回歸方程小結(jié)1、變量間相關(guān)關(guān)系的散點(diǎn)圖
2、如何利用“小二乘法”思想求直線的回歸方程
3、學(xué)會用回歸思想考察現(xiàn)實(shí)生活中變量之間的相關(guān)關(guān)系
【一】
重點(diǎn)難點(diǎn)講解:
1.回歸分析:
就是對具有相關(guān)關(guān)系的兩個(gè)變量之間的關(guān)系形式進(jìn)行測定,確定一個(gè)相關(guān)的數(shù)學(xué)表達(dá)式,以便進(jìn)行估計(jì)預(yù)測的統(tǒng)計(jì)分析方法。根據(jù)回歸分析方法得出的數(shù)學(xué)表達(dá)式稱為回歸方程,它可能是直線,也可能是曲線。
2.線性回歸方程
設(shè)x與y是具有相關(guān)關(guān)系的兩個(gè)變量,且相應(yīng)于n組觀測值的n個(gè)點(diǎn)(xi,yi)(i=1,......,n)大致分布在一條直線的附近,則回歸直線的方程為。
其中。
3.線性相關(guān)性檢驗(yàn)
線性相關(guān)性檢驗(yàn)是一種假設(shè)檢驗(yàn),它給出了一個(gè)具體檢驗(yàn)y與x之間線性相關(guān)與否的辦法。
①在課本附表3中查出與顯著性水平0.05與自由度n-2(n為觀測值組數(shù))相應(yīng)的相關(guān)系數(shù)臨界值r0.05。
②由公式,計(jì)算r的值。
③檢驗(yàn)所得結(jié)果
如果|r|≤r0.05,可以認(rèn)為y與x之間的線性相關(guān)關(guān)系不顯著,接受統(tǒng)計(jì)假設(shè)。
如果|r|>r0.05,可以認(rèn)為y與x之間不具有線性相關(guān)關(guān)系的假設(shè)是不成立的,即y與x之間具有線性相關(guān)關(guān)系。
典型例題講解:
例1.從某班50名學(xué)生中隨機(jī)抽取10名,測得其數(shù)學(xué)考試成績與物理考試成績資料如表:序號12345678910數(shù)學(xué)成績54666876788285879094,物理成績61806286847685828896試建立該10名學(xué)生的物理成績對數(shù)學(xué)成績的線性回歸模型。
解:設(shè)數(shù)學(xué)成績?yōu)閤,物理成績?yōu)椋瑒t可設(shè)所求線性回歸模型為,
計(jì)算,代入公式得∴所求線性回歸模型為=0.74x+22.28。
說明:將自變量x的值分別代入上述回歸模型中,即可得到相應(yīng)的因變量的估計(jì)值,由回歸模型知:數(shù)學(xué)成績每增加1分,物理成績平均增加0.74分。大家可以在老師的幫助下對自己班的數(shù)學(xué)、化學(xué)成績進(jìn)行分析。
例2.假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費(fèi)用y(萬元),有如下的統(tǒng)計(jì)資料:x23456y2.23.85.56.57.0
若由資料可知y對x成線性相關(guān)關(guān)系。試求:
(1)線性回歸方程;(2)估計(jì)使用年限為10年時(shí),維修費(fèi)用是多少?
分析:本題為了降低難度,告訴了y與x間成線性相關(guān)關(guān)系,目的是訓(xùn)練公式的使用。
解:(1)列表如下:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.049162536于是b=,。∴線性回歸方程為:=bx+a=1.23x+0.08。
(2)當(dāng)x=10時(shí),=1.23×10+0.08=12.38(萬元)即估計(jì)使用10年時(shí)維修費(fèi)用是12.38萬元。
說明:本題若沒有告訴我們y與x間是線性相關(guān)的,應(yīng)首先進(jìn)行相關(guān)性檢驗(yàn)。如果本身兩個(gè)變量不具備線性相關(guān)關(guān)系,或者說它們之間相關(guān)關(guān)系不顯著時(shí),即使求出回歸方程也是沒有意義的,而且其估計(jì)與預(yù)測也是不可信的。
例3.某省七年的國民生產(chǎn)總值及社會商品零售總額如下表所示:已知國民生產(chǎn)總值與社會商品的零售總額之間存在線性關(guān)系,請建立回歸模型。年份國民生產(chǎn)總值(億元)
社會商品零售總額(億元)1985396.26205.821986442.04227.951987517.77268.661988625.10337.521989700.83366.001990792.54375.111991858.47413.18合計(jì)4333.012194.24
解:設(shè)國民生產(chǎn)總值為x,社會商品零售總額為y,設(shè)線性回歸模型為。
依上表計(jì)算有關(guān)數(shù)據(jù)后代入的表達(dá)式得:∴所求線性回歸模型為y=0.445957x+37.4148,表明國民生產(chǎn)總值每增加1億元,社會商品零售總額將平均增加4459.57萬元。
例4.已知某地每單位面積菜地年平均使用氮肥量xkg與每單位面積蔬菜每年平均產(chǎn)量yt之間的關(guān)系有如下數(shù)據(jù):年份19851986198719881989199019911992x(kg)7074807885929095y(t)5.16.06.87.89.010.210.012.0年份19931994199519961997199871999x(kg)92108115123130138145y(t)11.511.011.812.212.512.813.0(1)求x與y之間的相關(guān)系數(shù),并檢驗(yàn)是否線性相關(guān);
(2)若線性相關(guān),求蔬菜產(chǎn)量y與使用氮肥量之間的回歸直線方程,并估計(jì)每單位面積施肥150kg時(shí),每單位面積蔬菜的年平均產(chǎn)量。
分析:(1)使用樣本相關(guān)系數(shù)計(jì)算公式來完成;(2)查表得出顯著水平0.05與自由度15-2相應(yīng)的相關(guān)系數(shù)臨界值r0.05比較,若r>r0.05,則線性相關(guān),否則不線性相關(guān)。
解:(1)列出下表,并用科學(xué)計(jì)算器進(jìn)行有關(guān)計(jì)算:i123456789101112131415xi707480788592909592108115123130138145yi5.16.06.87.89.010.210.012.011.511.011.812.212.512.813.0xiyi357444544608.4765938.490011401058118813571500.616251766.41885,.故蔬菜產(chǎn)量與施用氮肥量的相關(guān)系數(shù):r=由于n=15,故自由度15-2=13。由相關(guān)系數(shù)檢驗(yàn)的臨界值表查出與顯著水平0.05及自由度13相關(guān)系數(shù)臨界值r0.05=0.514,則r>r0.05,從而說明蔬菜產(chǎn)量與氮肥量之間存在著線性相關(guān)關(guān)系。
(2)設(shè)所求的回歸直線方程為=bx+a,則∴回歸直線方程為=0.0931x+0.7102。
當(dāng)x=150時(shí),y的估值=0.0931×150+0.7102=14.675(t)。
說明:求解兩個(gè)變量的相關(guān)系數(shù)及它們的回歸直線方程的計(jì)算量較大,需要細(xì)心謹(jǐn)慎計(jì)算,如果會使用含統(tǒng)計(jì)的科學(xué)計(jì)算器,能簡單得到,這些量,也就無需有制表這一步,直接算出結(jié)果就行了。另外,利用計(jì)算機(jī)中有關(guān)應(yīng)用程序也可以對這些數(shù)據(jù)進(jìn)行處理。
【二】
問題提出
1.函數(shù)是研究兩個(gè)變量之間的依存關(guān)系的一種數(shù)量形式.對于兩個(gè)變量,如果當(dāng)一個(gè)變量的取值一定時(shí),另一個(gè)變量的取值被惟一確定,則這兩個(gè)變量之間的關(guān)系就是一個(gè)函數(shù)關(guān)系.
2.在中學(xué)校園里,有這樣一種說法:“如果你的數(shù)學(xué)成績好,那么你的物理學(xué)習(xí)就不會有什么大問題.”按照這種說法,似乎學(xué)生的物理成績與數(shù)學(xué)成績之間存在著某種關(guān)系,我們把數(shù)學(xué)成績和物理成績看成是兩個(gè)變量,那么這兩個(gè)變量之間的關(guān)系是函數(shù)關(guān)系嗎?
3.我們不能通過一個(gè)人的數(shù)學(xué)成績是多少就準(zhǔn)確地?cái)喽ㄆ湮锢沓煽兡苓_(dá)到多少,學(xué)習(xí)興趣、學(xué)習(xí)時(shí)間、教學(xué)水平等,也是影響物理成績的一些因素,但這兩個(gè)變量是有一定關(guān)系的,它們之間是一種不確定性的關(guān)系.類似于這樣的兩個(gè)變量之間的關(guān)系,有必要從理論上作些探討,如果能通過數(shù)學(xué)成績對物理成績進(jìn)行合理估計(jì),將有著非常重要的現(xiàn)實(shí)意義.
知識探究(一):變量之間的相關(guān)關(guān)系
思考1:考察下列問題中兩個(gè)變量之間的關(guān)系:
(1)商品銷售收入與廣告支出經(jīng)費(fèi);
(2)糧食產(chǎn)量與施肥量;
(3)人體內(nèi)的脂肪含量與年齡.
這些問題中兩個(gè)變量之間的關(guān)系是函數(shù)關(guān)系嗎?
思考2:“出高徒”可以解釋為教師的水平越高,學(xué)生的水平就越高,那么學(xué)生的學(xué)業(yè)成績與教師的教學(xué)水平之間的關(guān)系是函數(shù)關(guān)系嗎?你能舉出類似的描述生活中兩個(gè)變量之間的這種關(guān)系的成語嗎?
思考3:上述兩個(gè)變量之間的關(guān)系是一種非確定性關(guān)系,稱之為相關(guān)關(guān)系,那么相關(guān)關(guān)系的含義如何?
自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系,叫做相關(guān)關(guān)系.
1、球的體積和球的半徑具有()
A函數(shù)關(guān)系B相關(guān)關(guān)系
C不確定關(guān)系D無任何關(guān)系
2、下列兩個(gè)變量之間的關(guān)系不是
函數(shù)關(guān)系的是()
A角的度數(shù)和正弦值
B速度一定時(shí),距離和時(shí)間的關(guān)系
C正方體的棱長和體積
D日照時(shí)間和水稻的畝產(chǎn)量AD練:知識探究(二):散點(diǎn)圖
【問題】在對人體脂肪含量和年齡關(guān)系的研究中,研究人員獲得了一組樣本數(shù)據(jù):
其中各年齡對應(yīng)的脂肪數(shù)據(jù)是這個(gè)年齡人群脂肪含量的樣本平均數(shù).
思考1:對某一個(gè)人來說,他的體內(nèi)脂肪含量不一定隨年齡增長而增加或減少,但是如果把很多個(gè)體放在一起,就可能表現(xiàn)出一定的規(guī)律性.觀察上表中的數(shù)據(jù),大體上看,隨著年齡的增加,人體脂肪含量怎樣變化?
思考2:為了確定年齡和人體脂肪含量之間的更明確的關(guān)系,我們需要對數(shù)據(jù)進(jìn)行分析,通過作圖可以對兩個(gè)變量之間的關(guān)系有一個(gè)直觀的印象.以x軸表示年齡,y軸表示脂肪含量,你能在直角坐標(biāo)系中描出樣本數(shù)據(jù)對應(yīng)的圖形嗎?
思考3:上圖叫做散點(diǎn)圖,你能描述一下散點(diǎn)圖的含義嗎?
在平面直角坐標(biāo)系中,表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)圖形,稱為散點(diǎn)圖.
思考4:觀察散點(diǎn)圖的大致趨勢,人的年齡的與人體脂肪含量具有什么相關(guān)關(guān)系?
思考5:在上面的散點(diǎn)圖中,這些點(diǎn)散布在從左下角到右上角的區(qū)域,對于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).一般地,如果兩個(gè)變量成正相關(guān),那么這兩個(gè)變量的變化趨勢如何?
思考6:如果兩個(gè)變量成負(fù)相關(guān),從整體上看這兩個(gè)變量的變化趨勢如何?其散點(diǎn)圖有什么特點(diǎn)?
一個(gè)變量隨另一個(gè)變量的變大而變小,散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域.
一般情況下兩個(gè)變量之間的相關(guān)關(guān)系成正相關(guān)或負(fù)相關(guān),類似于函數(shù)的單調(diào)性.
知識探究(一):回歸直線
思考1:一組樣本數(shù)據(jù)的平均數(shù)是樣本數(shù)據(jù)的中心,那么散點(diǎn)圖中樣本點(diǎn)的中心如何確定?它一定是散點(diǎn)圖中的點(diǎn)嗎?
思考2:在各種各樣的散點(diǎn)圖中,有些散點(diǎn)圖中的點(diǎn)是雜亂分布的,有些散點(diǎn)圖中的點(diǎn)的分布有一定的規(guī)律性,年齡和人體脂肪含量的樣本數(shù)據(jù)的散點(diǎn)圖中的點(diǎn)的分布有什么特點(diǎn)?
這些點(diǎn)大致分布在一條直線附近.
思考3:如果散點(diǎn)圖中的點(diǎn)的分布,從整體上看大致在一條直線附近,則稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線.對具有線性相關(guān)關(guān)系的兩個(gè)變量,其回歸直線一定通過樣本點(diǎn)的中心嗎?
思考4:對一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),你認(rèn)為其回歸直線是一條還是幾條?
思考5:在樣本數(shù)據(jù)的散點(diǎn)圖中,能否用直尺準(zhǔn)確畫出回歸直線?借助計(jì)算機(jī)怎樣畫出回歸直線?
知識探究(二):回歸方程
在直角坐標(biāo)系中,任何一條直線都有相應(yīng)的方程,回歸直線的方程稱為回歸方程.對一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù),如果能夠求出它的回歸方程,那么我們就可以比較具體、清楚地了解兩個(gè)相關(guān)變量的內(nèi)在聯(lián)系,并根據(jù)回歸方程對總體進(jìn)行估計(jì).
思考1:回歸直線與散點(diǎn)圖中各點(diǎn)的位置應(yīng)具有怎樣的關(guān)系?
整體上接近
思考2:對于求回歸直線方程,你有哪些想法?
思考4:為了從整體上反映n個(gè)樣本數(shù)據(jù)與回歸直線的接近程度,你認(rèn)為選用哪個(gè)數(shù)量關(guān)系來刻畫比較合適?20.9%某小賣部為了了解熱茶銷售量與氣溫
之間的關(guān)系,隨機(jī)統(tǒng)計(jì)并制作了某6天
賣出熱茶的杯數(shù)與當(dāng)天氣溫的對照表:
如果某天的氣溫是-50C,你能根據(jù)這些
數(shù)據(jù)預(yù)測這天小賣部賣出熱茶的杯數(shù)嗎?
實(shí)例探究
為了了解熱茶銷量與
氣溫的大致關(guān)系,我們
以橫坐標(biāo)x表示氣溫,
縱坐標(biāo)y表示熱茶銷量,
建立直角坐標(biāo)系.將表
中數(shù)據(jù)構(gòu)成的6個(gè)數(shù)對
表示的點(diǎn)在坐標(biāo)系內(nèi)
標(biāo)出,得到下圖。
你發(fā)現(xiàn)這些點(diǎn)有什么規(guī)律?
今后我們稱這樣的圖為散點(diǎn)圖(scatterplot).
建構(gòu)數(shù)學(xué)
所以,我們用類似于估計(jì)平均數(shù)時(shí)的
思想,考慮離差的平方和
當(dāng)x=-5時(shí),熱茶銷量約為66杯
線性回歸方程:
一般地,設(shè)有n個(gè)觀察數(shù)據(jù)如下:當(dāng)a,b使2.三點(diǎn)(3,10),(7,20),(11,24)的
線性回歸方程是()D11.69
二、求線性回歸方程
例2:觀察兩相關(guān)變量得如下表:
求兩變量間的回歸方程解1:列表:
閱讀課本P73例1
EXCEL作散點(diǎn)圖
利用線性回歸方程解題步驟:
1、先畫出所給數(shù)據(jù)對應(yīng)的散點(diǎn)圖;
2、觀察散點(diǎn),如果在一條直線附近,則說明所給量具有線性相關(guān)關(guān)系
3、根據(jù)公式求出線性回歸方程,并解決其他問題。
(1)如果x=3,e=1,分別求兩個(gè)模型中y的值;(2)分別說明以上兩個(gè)模型是確定性
模型還是隨機(jī)模型.
模型1:y=6+4x;模型2:y=6+4x+e.
解(1)模型1:y=6+4x=6+4×3=18;
模型2:y=6+4x+e=6+4×3+1=19.C線性相關(guān)與線性回歸方程小結(jié)1、變量間相關(guān)關(guān)系的散點(diǎn)圖
2、如何利用“小二乘法”思想求直線的回歸方程
3、學(xué)會用回歸思想考察現(xiàn)實(shí)生活中變量之間的相關(guān)關(guān)系