20、利用普通最小二乘法求的樣本回歸直線具有以下特點(diǎn):
(1)樣本回歸直線必然通過(guò)點(diǎn)X的均值和點(diǎn)Y的均值;
(2)預(yù)測(cè)值Y的平均值與實(shí)際值Y的平均值相等;
(3)殘差ei均值為零;
(4)殘差ei與解釋變量X不相關(guān)。
21、普通最小乘估計(jì)量的特性:
(1)無(wú)偏性:E(β0)= β0,E(β1)= β1由不同樣本得到的β0和β1可能大于或小于總體的β1和β0,但平均起來(lái)等于總體參數(shù)。
(2)線性特性:即估計(jì)量β0和β1均為樣本觀測(cè)值Y的線性組合。
(3)有效性:即β1和β0的方差最小。
22、簡(jiǎn)單線性回歸模型的檢驗(yàn)
(1)對(duì)估計(jì)值的直觀判斷:1.對(duì)回歸系數(shù)β1的符號(hào)判斷;2.對(duì)β1的大小判斷。
(2)擬合優(yōu)度的檢驗(yàn):擬合優(yōu)度是指樣本回歸直線與樣本觀測(cè)值之間的擬合程度,通常用判定系數(shù)r2表示。檢驗(yàn)擬合優(yōu)度的目的,是了解釋變量X對(duì)被解釋變量Y的解釋程度。X對(duì)Y的解釋能力越強(qiáng),殘差ei的絕對(duì)值就越小,從而樣本觀測(cè)值離回歸直線的距離越近。判定系數(shù)計(jì)算公式:
ESS Σ(Y(預(yù)測(cè)值)—Y(均值)) β12(回歸系數(shù))Σ(X(樣本值)—X(均值))
r2=———=——————————————=————————————————————
TSS Σ(Y(樣本值)—Y(均值)) Σ(Y(樣本值)—Y(均值))
判定系數(shù)r2的兩個(gè)重要性質(zhì):
1.它是一個(gè)非負(fù)的量。
2.它是在0與1之間變化的量。當(dāng)r2=1時(shí),所有的觀測(cè)值都落在樣本回歸直線上,是完全擬合;當(dāng)r2=0時(shí),解釋變量與被解釋變量之間沒(méi)有關(guān)系。
23、相關(guān)系數(shù)是衡量變量之間線性相關(guān)的指標(biāo)。用r表示,它具有下列性質(zhì):
(1)它是可正可負(fù)的數(shù)
(2)它是在-1與+1之間變化的量。
(3)它具有對(duì)稱性,即X與Y之間的相關(guān)系數(shù)與Y與X值將的相關(guān)系數(shù)相同。
(4)如果X和Y在統(tǒng)計(jì)上獨(dú)立,則相關(guān)系數(shù)為零。當(dāng)r=0,并不說(shuō)明兩個(gè)變量之間一定獨(dú)立。這是因?yàn)椋瑀僅適用于變量之間的線性關(guān)系,而變量之間可能存在非線性關(guān)系。
Σ(X(樣本值)—X(均值))(Y(樣本值)—Y(均值))
r=—————————————————————————————
[Σ(X(樣本值)—X(均值))2Σ(Y(樣本值)—Y(均值))2]1/2
r=±[r2]1/2并且r的符號(hào)與回歸系數(shù)β1的符號(hào)相同。
相關(guān)系數(shù)與判定系數(shù)在概念上仍有明顯區(qū)別:前者建立在相關(guān)分析的理論基礎(chǔ)上,研究的是兩個(gè)隨機(jī)變量之間的線性相關(guān)的關(guān)系,不僅反映變量之間的因果關(guān)系;后者建立在回歸分析的理論基礎(chǔ)上,研究的是一個(gè)普通變量(X)對(duì)另一個(gè)隨機(jī)變量的定量解釋程度。
24、相關(guān)系數(shù)的檢驗(yàn)(t檢驗(yàn))
一般說(shuō)來(lái),相關(guān)系數(shù)可以反映X與Y之間的線性相關(guān)程度。r的絕對(duì)值越接近于1,X與Y之間的線性關(guān)系就越密切。但相關(guān)系數(shù)通常是根據(jù)樣本數(shù)據(jù)得到的,因而帶有一定的隨機(jī)性,且樣本越小其隨機(jī)型就越大。因此,我們有必要依據(jù)樣本相關(guān)系數(shù)r對(duì)總體相關(guān)系數(shù)ρ進(jìn)行統(tǒng)計(jì)檢驗(yàn)。可構(gòu)造t統(tǒng)計(jì)量:
r(n—2)1/2
t=—————— 其中r為相關(guān)系數(shù),n為樣本數(shù),服從(n-2)的t分布;查t分布得
(1—r2) 1/2 相應(yīng)的臨界值tα/2如果有:|t|≥tα/2則認(rèn)為X與Y之間存在顯著的線性相關(guān)關(guān)系。反之若有|t|≤tα/2則認(rèn)為X與Y之間不存在顯著的線性相關(guān)關(guān)系。
25、在一元線性回歸模型中Y=β0+β1X+μi,β1代表解釋變量X對(duì)被解釋變量Y的線性影響。如果X對(duì)Y的影響是顯著的,則有β1≠0;若X對(duì)Y的影響不顯著,則有β1=0。由于真實(shí)參數(shù)β1是未知的,我們只能依據(jù)樣本估計(jì)值對(duì)β1進(jìn)行統(tǒng)計(jì)檢驗(yàn)。
26、多重判定系數(shù)R2:為了說(shuō)明二元回歸方程對(duì)樣本觀測(cè)值擬合的優(yōu)劣,需要定義多重判定系數(shù)。多重判定系數(shù)與簡(jiǎn)單判定系數(shù)r2一樣,R2也定義為有解釋的變差(ESS)與總變差(TSS)之比。顯然,R2也是一個(gè)在0與1 之間的數(shù)。R2的值越接近1,擬合優(yōu)度就越高。R2=1時(shí),RSS=0,表明被解釋變量Y的變化完全由解釋變量X1和X2決定;當(dāng)R2=0,表明Y的變化與X1,X2無(wú)任何關(guān)系。同時(shí)對(duì)于兩個(gè)被解釋變量相同而解釋變量個(gè)數(shù)不同的模型,包含解釋變量多的模型就會(huì)有較高的R2值。