12 Nisan 2013 Cuma

Testin Gücü (Power Test)


Güç analizi, hipotez testlerinde genellikle göz ardı edilen Beta hatası üzerinden hesaplanan bir analizdir. İstatistiksel karar aşamasında verilen kararın doğruluğunu, güvenirliğini denetlemek için kullanıldığı gibi örneklem büyüklüğünü belirlemek içinde kullanılır. Güç analizini anlamak için önce biraz hipotez testinden bahsetmek gerekiyor.

Hipotez testi (ön sav) çıkarımsal istatistik yöntemleri altında incelenir. Anakütle parametrelerini örneklem yardımıyla belirli bir güven düzeyiyle(1-α) test etmemizi sağlar. Anakütle parametrelerine değerlerine dair tam ve kesin bilgiye sahipsek zaten hipotez testleri gereksizdir. Sadece örnekleme olduğu durumlarda kullanılır. İstatistiksel hipotez testleri H0 ve alternatifi H1 şeklinde birlikte ifade edilir. H0 sıfır hipotezi yada yokluk hipotezi olarak adlandırılır. H1 ise; alternatif hipotez olarak adlandırılır. H0’ın tam tersi diyebiliriz.


Örnek vermek gerekirse, yeni bulunan bir ilacın etkili olup olmadığını araştırmak istiyoruz. Hipotezimizi yazarsak;
H0: Yeni bulunana ilacın tedavide iyileştirici bir etkisi yoktur. ( Yokluk hipotezi )
H1: Yeni bulunan ilacın tedavide iyileştirici bir etkisi vardır. ( Alternatif hipotez, araştırma hipotezi )

Araştırmacının amacı burada  H0 hipotezini reddetmek olacaktır. Doğruluğunu araştırdığı ve inandığı hipotez alternatif hipotezdir.

Hipotezi araştırmak ve genel geçer bir sonuç koymak yani anakütleye ait tahminde bulunmak için örneklem üzerinden hipotezini test edecektir. Örnekleme yapıldığında ise iki tür hata riski karşımıza çıkar.

1.       H0 doğru iken reddetmek. Yeni bulunan ilacın tedavide iyileştirici bir etkisi yokken reddederek etkisi varmış hatasına düşmek. Bu I. Tip hata dediğimiz α (alfa) hatasıdır. Maksimum I. Tip hata yapma olasılığına anlamlılık düzeyi denir.
2.   H0 yanlışken reddedememek. Yeni bulunan ilacın tedavide iyileştirici bir etkisi varken etkisinin olmadığı yanlışına düşmek. Bu ise II. Tip hata β (beta) hatasıdır.
Sanırım biraz karışık oldu. Tabloda incelersek daha anlaşılır olacaktır.

                   

Gerçek Durum
H0 doğru
H0 yanlış

Karar
H0 reddedilemez
Doğru karar
II. tip hata β
H0 red
I. tip hata α
Doğru karar

Hipotez testlerinin uygulama aşamaları:

1.       Sıfır hipotezi ve alternatif hipotez yazılır.
2.       α anlamlılık düzeyi seçilir.
3.       Örnekleme yapılır.
4.       Uygun test istatistiği seçilir.
5.       Red bölgesi belirlenir.
6.       Karar aşaması.

Hipotez testi karar aşamasında P-değerine bakılır. P-değeri α anlamlılık düzeyiyle karşılaştırılır. Eğer p değeri α anlamlılık düzeyinden küçükse H0 hipotezi reddedilir. Aksi durumda reddedilemez. Fark ettiyseniz H0 kabul edilir yerine reddedilemez diyorum. Bunun sebebi II. Tip hatadan kaçınmak içindir. Bu birazda matematikte kanıtlanmamış teoreme benzer. Doğruluğunu ispat edemiyorsunuz fakat yanlışlığını da ispat edemiyorsunuz. Bu sebeple de p-değeri red bölgesini aştığında H0 reddedilemez denmesi daha doğru bir söylemdir.


Daha fazla uzatmadan testin gücü (power test) nedir ona gelelim. Testin gücü 1- β olarak ifade edilir. İki sebeple çokça kullanılır. İlki araştırmada örneklem sayısının belirlenmesi için kullanılır.  İkincisi ise, verilen kararın doğruluğunu, güvenirliğini ölçmek için kullanılır. Hesaplanması zor olmakla beraber hazır yazılımlar sayesinde çok hızlı hesaplanabilir. Genellikle testin gücünün(1- β) 0.80’den yüksek olması, araştırmanın sağlığı açısından, istenir. α’nın belirlenmesi araştırmacının elindeyken β değişkenlik gösterir. Örneklem büyüklüğüne, α değerine, örneklemin dağılımına bağlıdır. Burada bir noktaya daha dikkat çekmek gerekiyor. α değeri her ne kadar araştırmacıya bağlı olsa da hatayı küçültmek için α değerinin küçültülmesine karar vermek β hatasının büyümesine sebep olur. Aralarında ters yönlü bir ilişki vardır. Bu nedenle optimum düzeyde belirlenmesi gerekir.  Bu iki tip hatanın aynı anda düşürülmesi örneklem sayısının arttırılmasına bağlıdır.

Sıfır hipotezinin reddi ve reddedilmeme karar aşamasında sadece p-değerine bakmak yeterli değildir. Fakat karar aşamasında önemli bir ilk adımdır. Yapılan çalışmanın güvenirliğini ve doğruluğunu ölçmek için α ile karşılaştırma yapılmasının yanı sıra testin gücüne bakılması, güven aralıklarının incelenmesi ve etki büyüklüğünün hesaplanmasının da fayda vardır.


Sözün özü:
Hipotez testleri araştırılan konunun istatistiksel olarak doğruluğunun kanıtlanmasında kullanılır. Örnekleme yapıldığından α ve β olmak üzere iki tip hata yapma olasılığı vardır. Bu iki tip hatanın da incelenmesi hipotez testinin sonucunun doğruluğu ve güvenilirliği açısından gereklidir.