Akademisyenler öncülüğünde matematik/fizik/bilgisayar bilimleri soru cevap platformu
1 beğenilme 0 beğenilmeme
10.2k kez görüntülendi
Bir popülasyonda varyans ile bu popülasyon içerisinden seçilen bir örneklem grubunun varyanslarını karşılaştırınca, bi şekilde hesap kitap gösteriyor ki örneklem varyansında  $\frac{n}{n-1}$ katsayili bir sapma var. Bu durumun, hesap kitap bir yana, sezgisel açıklaması nedir?
Akademik Matematik kategorisinde tarafından 
tarafından yeniden etikenlendirildi | 10.2k kez görüntülendi

1 cevap

1 beğenilme 0 beğenilmeme

Sorunuza yanıt olur mu bilmiyorum ama deneyeyim. Populasyonun ortalaması $\mu$, varyansı $\sigma^2$ olsun. Diyelim ki populasyonun ortalamasını biliyoruz ama varyansını bilmiyoruz.

Bu varyansı şöyle kestirebiliriz: $\displaystyle\hat{\sigma^2}=\frac{1}{n}\sum_{i=1}^n (x_i-\mu)^2$

Bu kestirim yansızdır, yani $\displaystyle \frac{n}{n-1}$ katsayısına gerek yoktur.

Bir başka deyişle, $E(\hat{\sigma^2})=\sigma^2$ dir.

Ama genelde ortalamayı da bilmeyiz. O zaman onu da kestirmemiz gerekir:

$\displaystyle \hat{\mu}=\frac{1}{n}\sum_{i=1}^n x_i$ 

Bu kestirim de yansızdır, yani $E(\hat{\mu})=\mu$ olur. Ortalamayı bilmediğimizden, varyans kestiriminde de bunu kullanacağız, yapacak daha iyi birşey yok. Yani,

$\displaystyle\hat{\sigma^2}=\frac{1}{n}\sum_{i=1}^n (x_i-\hat{\mu})^2$

Bu kestirimin yanlı olduğu görülür, yani  $E(\hat{\sigma^2})\neq\sigma^2$ olur. Eğer illa yansız kestirim istiyorsak $\displaystyle\hat{\sigma^2}=\frac{1}{n-1}\sum_{i=1}^n (x_i-\hat{\mu})^2$ kullanmalıyız.

Bu da kestirimde gerçek ortalamayı değil, örneklem ortalamasını kullandığımız için ortaya çıkar. 

Çünkü, $E(\hat{\mu}-\mu)=0$ dır ama $E[(\hat{\mu}-\mu)^2]=0$ değildir.

Bu $n-1$ li kestirimin de başka problemleri var tabii. Örneğin bu şekilde kestirdiğimiz varyans mean square hata açısından bir öncekinden daha kötüdür. Yani yansız diye illa bunu kullanmak zorunda değiliz.

(236 puan) tarafından 

Dogru anliyorsam $E(\hat{\sigma^2})=\sigma^2$ olmasini istedigimiz durumlarda bu kestirimi kullaniyoruz ve bunun sebebi sezgisel bir temelden cok hesabin kitabin dikte etmesi. Ayni zamanda bu kestirim ile herseyi cok guzel yapmis olmuyoruz `ortalama kare hata` gibi. Soylediklerinizi tekrar ettim muhtemelen ama, anlamis miyim diye kontrol etmek icin yaziyorum. 

Evet doğru. Ama sezgisel temeli de var. Gerçek ortalamayı değil, kestirdiğimiz ortalamayı kullandığımız için bu oluyor.

Tesekkurler!

İstatistikte "bağımsızlık derecesi" (degree of freedom) ne demektir?
20,280 soru
21,813 cevap
73,492 yorum
2,480,176 kullanıcı