p değeri hesaplama



p değeri





P-değeri, boş bir hipotezin (veya iddia edilen hipotezin) doğru olup olmadığını belirlememizi sağlayan niceliksel bir değerdir.

P değerinin belirlenmesi, iddia edilen bir hipotezi reddetmemiz gerekip gerekmediğini belirlememize olanak tanır.

Bir hipotezin reddedilip reddedilmeyeceğini belirlemek için kesme seviyesi olarak hizmet eden anlamlılık seviyesini belirleriz. Bu kesme noktası aynı zamanda alfa seviyesi (α) olarak da adlandırılır.

Alfa seviyeleri için tipik değerler %0.1, %0.5, %1, %2.5, %5, %10, %20, %25 ve %40.

P değeri, anlamlılık düzeyinden düşükse, bu istatistiksel olarak anlamlı bir p değerini temsil eder. Bu, iddia edilen hipotezi reddedebileceğimiz anlamına gelir.

P değeri, anlamlılık düzeyinden büyük veya ona eşitse, iddia edilen hipotezi reddedemeyiz.

P değerini hesaplamak için, bu hesap makinesinin 4 parça veriye ihtiyacı vardır: test istatistiği, örnek boyutu, hipotez test türü (sol kuyruk, sağ kuyruk veya çift kuyruk) ve anlamlılık seviyesi (α).

Verilerle çalışırken, verilerin bireysel sayıları standartlaştırılmadıkları için çok önemli değildir. Belirli bir senaryo için bir dizi veri noktası türetebilirsiniz, ancak bundan bir anlam çıkarmanız gerekir. Burası test istatistiklerinin önemli bir rol oynadığı yerdir.

Test istatistiği, gerçek numune sonuçları ile standart hatalar açısından talep edilen değer arasındaki mesafeyi temsil eder. Standart hatalar, gerçek veri sonuçlarının iddia edilen verilerden (sıfır hipotezinden) ne kadar uzakta olduğunu bize söyleyen standartlaştırılmış bir ölçüdür. Talep edilen değer ile elde edilen gerçek sonuçlar arasındaki mesafe standart hatalar açısından küçükse, veriler iddiadan uzak değildir ve iddia edilen hipotez (veriler) olasılığı doğrudur. Mesafe daha büyükse, gerçek veriler boş hipotezi reddetmemiz gerektiğini gösterir (H0).

Bu nedenle test istatistiği çok önemlidir çünkü bize gerçek sonuçların iddia edilen verilerden ne kadar uzakta veya yakın olduğunu gösteren standart bir ölçü verir.

Örnek boyutu, p değerini hesaplamamız gereken başka bir değişkendir. Örneklem boyutu çok önemlidir, çünkü p-değerini aramak için standart normal dağılımı (Z-dağılımı) mı yoksa p-değerini aramak için t-dağılımını mı kullandığımızı belirler.

Örneklem büyüklüğü 30'dan küçükse (n <30), küçük bir örnek boyutu olarak kabul ederiz. Örneklem boyutu küçük olduğunda, p-değerini hesaplamak için t dağılımını kullanırız. Bu durumda, serbestlik derecesini = n-1 serbestlik derecesini hesaplıyoruz. Daha sonra p değerini hesaplamak için test istatistiği ile birlikte serbestlik derecesini kullanırız.

Örnek 30'dan büyükse (n> 30), bunu büyük bir örnek boyutu olarak kabul ederiz. Örneklem boyutu büyük olduğunda, p değerini hesaplamak için Z dağılımını kullanırız.

Bu nedenle örneklem büyüklüğü çok önemlidir. T dağılımını mı yoksa Z dağılımını mı kullanmamız gerektiğini belirler.

Ardından, hipotez test türünü bilmeliyiz. Bu, sol kuyruk (Ha: μ H0) veya çift kuyruk (Ha: μ ≠ H0) testi olabilir.

Hipotez test türü bize bir referans çerçevesi verir. Test türü sol kuyruk yerine sağ kuyruk ise, o zaman p değeri, 1- p değeridir. Test türü çift kuyrukluysa, test istatistiğinden elde edilen p değerini ikiye katlamamız gerekir. Bu, hem sol kuyruk hem de sağ kuyruk olasılıkları hesaba katar. Bu yüzden iki katına çıkarılması gerekiyor.

Anlamlılık düzeyi, α, boş bir hipotezi reddedip reddetmediğimiz için kesme noktası olarak belirlediğimiz değerdir. Anlamlılık seviyesi ne kadar düşükse, sıfır hipotezini kabul etmek için sahip olduğumuz aralık o kadar dar olur. Anlamlılık seviyesi ne kadar yüksek olursa, sıfır hipotezini kabul etme aralığımız o kadar geniş olur. En sık kullanılan anlamlılık düzeyi muhtemelen %5. Bu, p-değeri %5 anlamlılık seviyesinden düşükse, bu, boş hipotezi %95 güvenle kabul edebileceğimiz anlamına gelir. Anlamlılık seviyesi% 1 ise ve p değeri% 1'den az ise, bu, boş hipotezi% 99 güvenle kabul edebileceğimiz anlamına gelir. Anlamlılık seviyesi %0,1 ise ve p değeri bu miktardan düşükse, bu boş hipotezi %99,9 güvenle kabul edebileceğimiz anlamına gelir. Anlamlılık seviyesi %10 ise ve p değeri bu miktardan düşükse, bu, boş hipotezi ile kabul edebileceğimiz anlamına gelir %90 güven.

Dolayısıyla anlamlılık seviyesi, seçtiğimiz kesme noktasını temsil eder ve sonuçları hangi güven düzeyiyle kabul edebileceğimizi belirler.

P değerini hesaplamak için birkaç örnek inceleyelim.

Bir şirketin, müşterilerin işlem başına harcadıkları ortalama dolar tutarının $32 (H0: μ = 32) olduğu şeklindeki boş hipotezin iddia ettiğini varsayalım. Ancak, ortalamanın bundan çok daha az olduğuna inanıyorsunuz (Ha: μ <32). 100 (n = 100) örneklem büyüklüğüne göre test istatistiğinin -2,5 olduğunu hesaplarsınız. P değeri nedir?

İlk şey, bunun bir sol kuyruk hipotez testi olmasıdır. Örneklem büyüklüğü 30'dan büyük olduğu için büyük bir örneklem büyüklüğü olarak kabul edilir. Bu nedenle, Z dağılım tablosundaki p değerine bakarız. Test istatistikleri zaten sağlanmıştır. Bunu grafikte aradığınızda, 0,0062 veya% 0,62'lik bir p değeri elde edersiniz.

Başka bir Örnek: Bir şirketin yılda ortalama 4 müşteri şikayeti aldığını söylediğini varsayalım (μ = 4). Bununla birlikte, onlarla birkaç korkunç deneyim yaşadınız ve gerçek miktarın çok daha fazla olduğuna inandınız (μ> 4). Deneyimlerini öğrenmek ve 1,96 değerinde bir test istatistiği elde etmek için 10 müşteri (n = 10) bulduğunuzu varsayalım. P değeri nedir?

Yani bu bir sağ kuyruk hipotez testidir. Örnek boyutu 10'dur, bu nedenle p-değerine T dağılım grafiğine göre bakacağız. Serbestlik derecelerinin hesaplanması, serbestlik derecesi= 10 - 1 = 9. Bu bize 0,95'lik bir p değeri verir. Bununla birlikte, bu bir sağ kuyruk hipotez testi olduğu için, p değerini hesaplamak için 1 almalı ve 0,95'ten çıkarmalıyız ki bu da bize 0,025 değerini verir.

Başka Bir Örnek: Bir şirketin günde 200 sipariş aldığını söylediğini, ancak bu sayının doğru olmadığını düşündüğünüzü varsayalım (Ha: μ ≠ 200). 400 örnek büyüklüğünü temel alarak 0,5'lik bir test istatistiği hesaplarsınız. P değeri nedir?

Dolayısıyla bu çift kuyruklu bir hipotez testidir çünkü alternatif hipotez μ ≠ 200'dür. Örneklem büyüklüğü büyük olduğu için Z dağılımı tablosundaki p değerine bakarız. Karşılık gelen p değeri 0,6915'tir. Ama bunun ötesindeki alanı bulmak istiyoruz. Yani 1'i alıp p değerini ondan çıkarıyoruz. Bu bize 0.3085 verir. Bu çift kuyruklu bir hipotez testi olduğu için bu değeri ikiye katlıyoruz ve 0.617 veya% 61.7 elde ediyoruz.

Bilinmesi gereken bir nokta, p değerlerinin olasılıklar olmasıdır; bu nedenle, 0 ile 1 arasında olmalıdırlar. 1'den büyük veya 0'dan küçük bir p değeri hatalı bir sonucu temsil eder.

Alakalı kaynaklar








Ana sayfa