Site Loader

Merhaba arkadaşlar, bu hafta pythonearth.com istatistik eğitim serisinde varyans analizi ile birlikteyiz.  İstatistik eğitim serisindeki diğer konulara buradan ulaşabilirsiniz. Keyifli okumalar 🙂

Varyans Analizi(Anova) Nedir?

Varyans analizi (veya anova) istatistik bilim dalında grup ortalamaları ve bunlara bağlı olan işlemleri analiz etmek için kullanılan bir istatistiksel modeller koleksiyonudur. Varyans analizi, iki ya da daha fazla ortalamanın eşitliğini, varyansları kullanarak test etmeye yarayan bir yöntemdir. Tamamen rassal deney tasarımı modellerini analiz etmekte kullanılır. Birkaç varsayımdan bahsedelim:

  • Örneklemlerin elde edildiği popülasyonlar normal ya da yaklaşık olarak normal dağılış (bakınız: normal dağılım) gösterir.
  • Örneklemler bağımsızdır.
  • Popülasyon varyansları eşittir.

Varyans analizi tek yönlü ve iki yönlü analiz olarak ikiye ayrılır. İlk olarak tek yönlü varyans analizinden başlayarak açıklayalım.

 

Tek Yönlü Varyans Analizi (One-Way ANOVA)

Varyans analizi, bağımsız örneklemler gerektirmektedir ve bağımsız gruplarda eşit varyanslı iki ortalama arasındaki farkın “t testinin” genelleştirilmiş şeklidir. Tek yönlü varyans analizinde, bir bağımlı ve bir de bağımsız değişken vardır. Bağımsız değişken sınıflayıcı ölçekle ölçülmüş olabilir fakat bağımlı değişken sürekli olmalıdır. Bir başka ifade ile açıklayacak olursak, varyans analizi, “k” adet anakütleden “n” hacimli bağımsız örneklem tesadüfi örneklem seçildiğinde bu örneklemlerin ortalamalarından hareketle anakütle ortalamalarının birbirinden farklı olup olmadığı test edilir. Öncelikle “k” adet anakütleyi belirli kriterlere göre farklı işlem gruplarına ayırmak gerekir. Bu sınıflama şeklinde, veriler farklı işlem gruplarına ayrılırken işlem grubu içerisindeki veriler birbirinden bağımsız olmalıdır. Tek yönlü sınıflama durumunda verileri aşağıdaki gibi gösterebiliriz:

 

Test Hipotezleri

Kurabileceğimiz sıfır hipotezi ve alternatif hipotez şöyle olur;

En az iki anakütle ortalaması birbirine eşit değildir

 Tek Yönlü Varyans Analizi Neden Tercih Edilmeli ?

Tek yönlü varyans analizini tercih etmemizi gerektiren bazı önemli durumlar vardır. Çok sayıda yapılan t-testi, en az bir kez Tip 1 hata ( gerçekte doğru olan bir sıfır hipotezini reddetme olasılığı) yapma olasılığını arttırır. Bu durumda bir çok gruba ait ortalamaları bir tek adımda eş zamanlı olarak karşılaştırılabilecek varyans analizi tercih edilmelidir. Örneğin, 4 grubu (A, B, C ve D grupları) bağımlı bir değişken (x) üzerinden karşılaştırmak için aşağıdaki gibi bir hipotez test edilebilir:

 

 Tek Yönlü Varyans Analizinin Varsayımları

  • En az bir bağımlı değişken (x)  ve bir bağımsız değişken ( k sayıda grup barındıran, tercihen k>2 ) olmalıdır
  • Bağımlı değişkenin ölçüm düzeyi k sayıdaki her bir grup için oransal veya en az aralıklı olmalıdır.
  • Bağımlı değişkenin bütün gruplarda normal dağılıma ve homojen ( yaklaşık olarak eşit ) varyanslara sahip olmalıdır.

Test İstatistiği

Varyans analizinde temel amaç, ikiden fazla örnek için lerin genel ortalama ‘ dan sapmalarının kareler toplamını, bu sapmalara sebep olan unsurlar itibari ile kısımlara ayırmak ve analiz etmektir.  Bu analiz sonunda, örnekler arasında uygunluk olup olmadığı, yani söz konusu örneklerin aynı anakütleye ait birer şans örneği olup olmadıkları da ortaya konulmuş olacaktır.

değerinin, yani örneklemlerdeki bütün değerlerinin genel ortalamadan gösterdikleri sapmaların kareler toplamının iki kaynağı vardır:

 

 

Eşitliğin sol tarafındaki ifadeye genel kareler toplamı (GKT) denir. Eşitliğin sağ kısmındaki ifadelerin birincisi örnek ortalamalarının genel ortalamadan gösterdiği sapmalar, diğeri ise her bir örnekteki değerlerin kendi örnek ortalamalarından gösterdiği sapmalardır. Birincisine, gruplar arası kareler toplamı ( GAKT ), ikincisine grup içi kareler toplamı (  GİKT ) denir.

Eşit örnekler durumunda

 

 

 

 

olur.

Gruplar arası kareler ortalaması , gruplar içi kareler ortalaması bölünerek varyans analizinin test istatistiği olan “F” değeri elde edilir.
Eşit örnek hacimleri durumunda varyans analizi tablosu;

k: örnek sayısı

N: örneklem büyüklüğü

Eşit olmayan örneklemler durumunda, toplam gözlem sayısı N ile gösterilirse;

Bu eşitliklerdeki üç varyasyon kaynağının her biri uygun bir serbestlik derecesi ile bölünerek birer varyans elde edilir.

 

Kritik Değer

Çeşitli önem seviyeleri ve örneklem büyüklükleri için nin hangi noktaya kadar şansa verilebileceği, hangi noktadan sonra önemli kabul edilerek örneklerin farklı anakütlelere ait olduklarına hükmedilebileceği “F” cetvelleriyle tespit edilmiştir.

Hesaplanan  “F” değeri, “F” tablosundan elde edilen kritik değerden küçükse örnek ortalamaları arasındaki farklılık tesadüfi; yani şanstan ileri gelmiştir ve örnekler aynı anakütleye aittir.

Hesaplanan test istatistiği , kritik değerden büyükse örnek ortalamaları arasındaki farklılığın önemli olduğuna hükmedilir ve bu örneklerin farklı anakütlelere ait olduklarına karar verilir.

“F” değeri, iki varyansın birbirine bölümü olduğu için negatif değer almaz. Bu yüzden “F” dağılımı sağa çarpıktır.

hipotezinin red bölgesi eğrinin sağ ucunda yer alır.

 

Örnek: Bir üretimden n=5 büyüklüğündeki k = 4 örnekten aşağıdaki sonuçlar elde edilmiştir.  % 5 önem seviyesine göre örnek ortalamaları arasındaki farkın önemli olup olmadığını ; bir başka deyişle, üretimin kontrol altında olup olmadığını varyans analizi ile kontrol ediniz.

 

Çözüm:

En az iki anakütle ortalaması birbirine eşit değildir

 

 

Test istatistiği , kritik değerden(3.24 ) büyük olduğu için % 5 önem seviyesinde H0 hipotezini  reddederek en az iki örnek ortalamasının birbirinden farklı olduğuna karar verilir. Bu durum üretimin kontrol altında olmadığı kanaatini uyandırır.

 

İki Yönlü Varyans Analizi

İki-yönlü varyans analizi iki faktörün (değişkenin) bağımlı değişken üzerine ortak etkisini ölçmek için kullanılır. Faktörler (bağımsız değişkenler) kategorik, bağımlı değişken ise süreklidir. Karşılaştırılacak grup sayısı faktörlerin kaç kategorili oldukları ile ilgilidir. İki yönlü anovanın asıl amacı faktörler arasındaki etkileşim (ortak) etkisini incelemektir.

Her iki faktörün ana etkisiyle ilgilenmek istediğimizde tek yönlü varyans analizine başvururuz.

İki Yönlü Varyans Analizinin Varsayımları

  • İki bağımsız değişken kategoriktir ve her birinin en az iki kategorisi vardır.
  • Bağımlı değişken süreklidir.
  • Veriler birbirinden bağımsız gözlemlerden elde edilmiştir. Yani, gruplardaki katılımcılar arasında bir ilişki yoktur. Tesadüfi (rastgele) seçilmişlerdir.
  • Bağımlı değişkenin her bir gruptaki dağılımı normaldir.
  • Bağımlı değişken hiçbir grupta üç değer göstermemektedir.
  • Bağımlı değişkenin tüm gruplardaki varyansları eşittir (homogeneity of variances).

İstatistik Eğitim Serisinin Varyans Analizi  (ANOVA) yazısının sonuna geldik.  Eksik veya yanlış gördüğünüz yerler için lütfen iletişime geçin. Bir sonraki yazıda görüşmek üzere 🙂

 

Post Author: Emel Bulut

Uludağ Üniversitesi - ekonometri

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir