第四節(jié) 參數(shù)估計
根據(jù)樣本對總體進行推斷是數(shù)理統(tǒng)計的核心,參數(shù)估計與假設檢驗是統(tǒng)計推斷的兩個基本內容。本節(jié)著重討論參數(shù)估計問題。
這里所說的參數(shù)主要是指如下幾類:
①分布中的未知參數(shù),如二項分布b(n,p)中的p,正態(tài)分布 中的 , 或 。
②分布的均值E(x)、方差Var(x)等未知特征數(shù)。
③其他未知參數(shù),如某事件的概率P(A)等。
上述未知參數(shù)都需要根據(jù)樣本和參數(shù)的統(tǒng)計含義選擇適宜的統(tǒng)計量并作出估計,這一統(tǒng)計推斷過程通稱為參數(shù)估計。未知參數(shù)通常用 表示。
參數(shù)估計有兩種基本形式:點估計與區(qū)間估計。
一、點估計
(一) 點估計的概念
設 是總體的一個未知參數(shù),記與總體對應的隨機變量為X,從中抽取樣本量為n的一個樣本 。根據(jù)這個樣本,構造一個統(tǒng)計量 ,用 來對 進行估計,稱 為 的點估計量。對一個具體的樣本 ,可計算 的一個具體的數(shù)值,稱為 的估計值。在本教材中,除討論統(tǒng)計量的分布及性質外,不嚴格區(qū)分估計量及具體估計值,通稱為估計。
(二)點估計優(yōu)良性標準
點估計量 是隨所抽取的樣本不同而不同的,它是一個隨機變量。評價一個估計量 的優(yōu)劣不能從一個具體樣本獲得的估計值來評判,應該從多次使用中來評定。
對于一個特定的樣本,估計值 與 的真值之間總是有偏差的,但由于 未知,因此偏差 也未知。但是我們可以通過多次抽樣,對不同樣本, 不同的具體估計值,對實際偏差 進行“平均”。當然這種平均不能直接進行,因為 有正有負,直接平均由于正負抵消反而不能反映誤差。與以前對方差處理的方法相仿,用估計偏差的平方 來代替,并對其求均值,于是用 來表示估計量 的優(yōu)劣。這個量稱為 的均方誤差,簡記為MSE( ),均方誤差實際上是平均平方誤差的意思。雖然由于 是未知的,MSE( )也并不是總能求得的。但是經(jīng)過簡單的推導,總有
MSE( )= 。 (交叉乘積項為零)
(1.4-1)
(1.4-1)式中的第一項 = 表示的是 的均值E( )與未知參數(shù) 的差,稱為偏倚;當 =0時,也即:
E( )= 或 時,稱估計量 是無偏的,否則稱為有偏的。無偏性是表示估計量優(yōu)良性的一個重要標準。只要有可能,應該盡可能選用無偏估計量,或近似無偏估計量。應該注意,使用無偏估計 估計 時,每次使用是有偏差的,只是多次使用時其平均偏差為零。
(1.4-1)式中的第二項表示的是 對其均值E( )差的平方的均值,它是估計量的方差。對于無偏估計量,當然方差愈小愈好。方差 愈小,稱估計量更有效。有效性是判定估計量優(yōu)良性的另一個標準。
根據(jù)樣本對總體進行推斷是數(shù)理統(tǒng)計的核心,參數(shù)估計與假設檢驗是統(tǒng)計推斷的兩個基本內容。本節(jié)著重討論參數(shù)估計問題。
這里所說的參數(shù)主要是指如下幾類:
①分布中的未知參數(shù),如二項分布b(n,p)中的p,正態(tài)分布 中的 , 或 。
②分布的均值E(x)、方差Var(x)等未知特征數(shù)。
③其他未知參數(shù),如某事件的概率P(A)等。
上述未知參數(shù)都需要根據(jù)樣本和參數(shù)的統(tǒng)計含義選擇適宜的統(tǒng)計量并作出估計,這一統(tǒng)計推斷過程通稱為參數(shù)估計。未知參數(shù)通常用 表示。
參數(shù)估計有兩種基本形式:點估計與區(qū)間估計。
一、點估計
(一) 點估計的概念
設 是總體的一個未知參數(shù),記與總體對應的隨機變量為X,從中抽取樣本量為n的一個樣本 。根據(jù)這個樣本,構造一個統(tǒng)計量 ,用 來對 進行估計,稱 為 的點估計量。對一個具體的樣本 ,可計算 的一個具體的數(shù)值,稱為 的估計值。在本教材中,除討論統(tǒng)計量的分布及性質外,不嚴格區(qū)分估計量及具體估計值,通稱為估計。
(二)點估計優(yōu)良性標準
點估計量 是隨所抽取的樣本不同而不同的,它是一個隨機變量。評價一個估計量 的優(yōu)劣不能從一個具體樣本獲得的估計值來評判,應該從多次使用中來評定。
對于一個特定的樣本,估計值 與 的真值之間總是有偏差的,但由于 未知,因此偏差 也未知。但是我們可以通過多次抽樣,對不同樣本, 不同的具體估計值,對實際偏差 進行“平均”。當然這種平均不能直接進行,因為 有正有負,直接平均由于正負抵消反而不能反映誤差。與以前對方差處理的方法相仿,用估計偏差的平方 來代替,并對其求均值,于是用 來表示估計量 的優(yōu)劣。這個量稱為 的均方誤差,簡記為MSE( ),均方誤差實際上是平均平方誤差的意思。雖然由于 是未知的,MSE( )也并不是總能求得的。但是經(jīng)過簡單的推導,總有
MSE( )= 。 (交叉乘積項為零)
(1.4-1)
(1.4-1)式中的第一項 = 表示的是 的均值E( )與未知參數(shù) 的差,稱為偏倚;當 =0時,也即:
E( )= 或 時,稱估計量 是無偏的,否則稱為有偏的。無偏性是表示估計量優(yōu)良性的一個重要標準。只要有可能,應該盡可能選用無偏估計量,或近似無偏估計量。應該注意,使用無偏估計 估計 時,每次使用是有偏差的,只是多次使用時其平均偏差為零。
(1.4-1)式中的第二項表示的是 對其均值E( )差的平方的均值,它是估計量的方差。對于無偏估計量,當然方差愈小愈好。方差 愈小,稱估計量更有效。有效性是判定估計量優(yōu)良性的另一個標準。