Site Loader

Merhaba arkadaşlar, pythonearth.com İstatistik eğitim serisinde Merkezi Eğilim Ölçüleri yazısı ile birlikteyiz. Bu yazıda Merkezi Eğilim Ölçüleri; Aritmetik  Ortalama, Mod , Medyan, Çeyreklikler ve Geometrik Ortalama konuları ele aldım. Bir önceki derste İstatistiğin ne olduğunu detaylı bir şekilde inceledik buradan bakabilirsiniz.

 Verileri anlamamız, onların bize ne söylediğini bilmemiz önemlidir. Doğru veri, doğru analiz demektir. Bu açıdan istatistiğin önemi ise kaçınılmazdır. İstatistik, veri toplama, özetleme, sonuçları yorumlama, sonuçların güven derecesini açıklama, veriler arasındaki ilişkiyi açıklama ve geleceğe yönelik tahmin yapmamızı sağlar. Veri, ham gerçek enformasyon parçacığına verilen addır. Veriler, ölçüm, sayım, deney, gözlem ya da araştırma yolu ile elde edilir. Ölçüm ya da sayım yolu ile toplanan sayısal değer içeren verilere “nicel veri” denir. Sayısal değer içermeyen verilere ise “nitel veri” denir.

 Veri ve istatistik hakkında kısaca bilgi verdikten sonra veri hakkında genel durumu yansıtacak bir takım önemli ölçülere değinelim.  Merkezi eğilim ölçüleri kümeye ilişkin bir değişkenin bütün farklı değerleri çevresinde toplayan bir merkezi değeri gösterir. En sık kullanılan merkezi eğilim ölçüleri; aritmetik ortalama, tepe değer, ortanca(medyan), çeyreklikler ve geometrik ortalamadır.

 Aritmetik Ortalama

Merkezi eğilim ölçülerini etraflıca ele alalım. İlk olarak aritmetik ortalamayla başlayalım. Aritmetik ortalama, en çok kullanılan merkezi eğilim ölçüsüdür.  Birimlerin belirli bir değişken açısından aldıkları değerlerin toplamının birim sayısına bölümü olarak tanımlanır. Eşit aralıklı ve oransal ölçme düzeyinde ölçülen değişkenler için kullanılır. Eşit aralıklı ölçme düzeyi, ölçülen özelliğin belirli bir başlangıç noktasına ve belirli bir özelliğe sahip oluş miktarına göre eşit aralıklarla sıralanır. Ölçekte bulunan tüm birimler birbirine eşittir ve bağıl bir sıfır noktası vardır. Oranlı ölçek ise eşit aralıklı ölçeğin tüm özelliklerine sahip olup ek olarak gerçek bir sıfır noktasına sahiptir ve başlangıç noktası sabit bir nokta olarak belirlenebilir.

Aritmetik ortalamanın bazı önemli dezavantajları vardır. Aritmetik ortalama aşırı değerlere duyarlı bir merkezi eğilim ölçüsüdür. Eğer veri dizisi için asimetrik olarak sadece bir uçsal değer aşırı büyük veya aşırı küçük olduğunda aritmetik ortalama aşırı değere yaklaşma eğilimi gösterir. Aritmetik ortalama nicel veri düzeyinde olan ölçekler için kullanılırken nitel veri düzeyinde olan ölçekler için kullanıldığında anlamsızdır.

Aritmetik ortalamanın avantaj ve dezavantajlarından da bahsettikten sonra açıklamaya devam edelim. Aritmetik ortalama hem ana kütle hem de örneklem için hesaplanır.

 

 µ: ana kütle aritmetik ortalaması

x̄ : örneklem aritmetik ortalaması

Basit serilerin aritmetik ortalaması, terimlerin toplamının toplam terim sayısına bölümüne eşittir. Sınıflanmış serilerin aritmetik ortalaması hesaplanırken gözlem değerleri ile frekanslarının çarpımlarının toplamı frekanslar toplamına bölünmesi ile oluşur.

Gruplanmış serilerde aritmetik ortalama hesabının yapılabilmesi için öncelikle sınıf orta noktalarının (m) bulunması gerekmektedir. Sınıf orta noktalarının hesaba katılmasında gruba dahil birimlerin tamamının sınıf orta noktasında toplanmış olduğu varsayımdan hareket edilmektedir.

Tablo: Aritmetik Ortalama Formülleri

 

Aritmetik ortalamanın özellikleri

  • Bir veri seti için sadece bir aritmetik ortalama vardır.
  • Nicel verilere uygulanabilir.
  • Birim değerlerinde meydana gelen değişim çok küçük olsa bile aritmetik ortalamayı etkiler.
  • Aritmetik ortalama ile birim değerleri arasındaki farkların toplamı sıfırdır.
  • Aritmetik ortalama ile birim değerleri arasındaki farkların kareleri toplamı minimum bir değerdir.
  • Aritmetik ortalamanın terim sayısı ile çarpımı seri toplamına eşittir.
  • Bir serinin bütün terimlerine aynı sayıyı eklersek (çıkarırsak) aritmetik ortalama eklenen (çıkarılan) sayı kadar artar (azalır).

  • İki serinin bütün terimleri karşılıklı olarak toplanarak(çıkarılarak) elde edilen serinin aritmetik ortalaması bu                   serilerin aritmetik ortalamalarının toplamına (farkına) eşittir.

 

 

Aritmetik ortalama ve özelliklerini anlattıktan sonra birer örnek ile pekiştirelim.

 Örnek: Ankara Üniversitesi Tıp Fakültesi Hastanesi kardiyoloji servisinde yatan hastaların hastanede kalış süreleri hakkında bilgi sahibi olunmak istenmektedir. Rastgele seçilen 15 hastanın hastanede kalış süreleri aşağıdaki gibi saptanmıştır.

20 40 10  10 26 17 17 15 22 12 12  5 5 14 15

Hastaların hastanede kalış sürelerine ilişkin aritmetik ortalamayı hesaplayınız.

Çözüm:

 

Örnek : Aşağıdaki sınıflanmış serinin aritmetik ortalamasını bulunuz.

40 60 70 80 100

5 4 5 4 2

Çözüm: 

 

Örnek: Aşağıda gruplanmış olarak verilen serinin aritmetik ortalamasını bulunuz.

 

 

 

 

 

Çözüm:

Tepe Değer (Mod)

Bir diğer merkezi eğilim ölçüsü olan tepe değer,  bir veri grubundaki en çok tekrarlanan değerdir. Tepe değerin hesaplanmasında birimlerde büyüklük sıralaması yapmak şart değildir fakat büyüklük sıralaması yapmak tepe değerin bulunması açısından kolaylık sağlar.

Aynı zamanda mod oldukça kaba bir merkezi eğilim ölçüsü olup, ortalama ve ortancanın hesaplanamadığını durumlarda kullanılabilir. Sınıflama ölçeği verileri ile kullanılabilen tek merkezi eğilim ölçüsüdür.

Basit serilerde mod hesabı yapılamaz. Çünkü basit serilerde mod bir diğer deyiş ile tepe değere karşılık gelen tüm frekanslar 1 olduğu için sınıflandırılmamış verilerde tepe değer en çok tekrarlanan değerdir.

Sınıflandırılmış serilerde ( gruplandırılmış serilerde) ise tepe değeri hesaplayabilmek için öncelikle tepe değer sınıfının belirlenmesi gerekir.  Frekansı en yüksek olan sınıf tepe değer sınıfıdır. En yüksek frekansa sahip iki veya daha fazla değer varsa, birden fazla mod olabilir. Bu dağılımlara çoklu modlu dağılım denir. Mod değeri, mod sınıfının alt sınırından küçük ve üst sınırından büyük olamaz.

Bu sınıf içerisinde yer alan tepe değeri bulmak için aşağıdaki formülü kullanırız ve buradan bulunacak mod yaklaşık bir değere sahip olur.

 

Bu formülde;

TD: Tepe değer

: En büyük sınıfın bulunduğu sınıfın alt sınırı

c : Sınıf aralığı

En büyük frekans ile bir önceki sınıfın frekansı arasındaki fark

En büyük frekans ile bir sonraki sınıfın frekansı arasındaki fark

 

Örnek: Bir grup öğrencinin ağırlıklarına ilişkin veriler sırasıyla şöyledir:

56, 57, 57, 58, 69, 69, 69, 80, 81, 82

Öğrencilerin ağırlıklarına ilişkin tepe değeri hesaplayınız.

Çözüm: Veri gurubunda en çok tekrarlanan değer 69 olduğundan , TD: 69’dur.

 

Örnek: 12 hastanın kan basınçları 90, 80,100, 110, 100, 120, 100, 90, 100, 110, 120, 110 olarak ölçülmüştür. Kan basınçlarına ilişkin tepe değeri hesaplayınız.

Çözüm: Kolaylık sağlaması açısından veriler büyüklük sırasına dizilir.

80, 90, 90, 100, 100, 100, 100, 110, 110,110, 120, 120

Veri grubunda en çok tekrarlanan kan basınç değeri 100 olduğundan, TD: 100 olur.

 

Örnek: Aşağıda tablo ile verilen frekans tablosundan yararlanarak 120 erkek bebeğin ağırlıklarına ilişkin tepe değeri hesaplayınız.

 Çözüm:

 

Tepe değerin (modun) özellikleri

  • Ortalamalar arasında tepe değer (mod) en temsili olandır. Çünkü kütledeki birimlerin önemli bir kısmına uyar.
  • Sınıflanmış serilerde modun tam sayı olması gerçeği daha iyi yansıtır. Örneğin bir bölgedeki ailelerin ortalama çocuk      sayıları hesaplandığında kesirli bir rakam elde edilebilir. Oysa ortalama olarak mod alınırsa bu değer tam sayı çıkacaktır.
  • Mod anormal değerlerin etkisi altında kalmaz. Örneğin çok zengin bir kişinin köye taşındığını köye taşındığını  varsayalım. Bu kişinin gelir düzeyi tek ve serinin sonunda olduğundan modu etkilemez.
  • Mod uygulamalarda en çok başvurulan ortalamalardan biridir. Örneğin, hazır giyim eşyası üretiminde en çok satılan değerler dikkate alınır ve bu değer moddur.
  • Modun güvenilirliği azdır. Yani örnekten elde edilen mod popülasyon modundan çok daha farklı olabilir.
  • Mod üzerinde cebirsel işlemler yapılamaz.
  • Bazen verilerin ortalaması ve ortancası olduğu halde modu olmayabilir. Bütün değerler farklı ise mod yoktur.

 Ortanca (Medyan)

Büyüklük sırasına dizilmiş bir ölçüm ya da veri setinin orta puanını gösteren ya da gözlenen ölçümlerin üst yarısını alt yarısından ayıran bir değerdir. Örneğin, 3,5,8,9,12 puan dağılımının ortanca değeri 8’dir.  8 değeri ölçümlerin %50’sini altında, %50’sini de üstünde bulunduran bir değerdir.  Tek sayıda gözlem değeri varsa ortanca değer veri setinin en ortasında ki değerdir. Eğer çift sayıda gözlem değeri varsa en ortadaki iki değerin yarısı ortanca değer olacaktır (N+1/2).

Ortanca ortalamaya göre uç değerlere karşı daha az duyarlıdır.  Bu nedenle çarpık dağılımlarda, ortalamaya göre daha iyi bir merkezi eğilim ölçüsüdür.  Simetrik dağılımlarda ortalama, ortanca ve mod eşittir. Sağa çarpık bir dağılımda, ortalama ortancadan daha büyük, sola çarpık bir dağılımda ise ortalama ortancadan küçüktür. Ortanca, sınıflama ölçme düzeyi ile ölçülen değişkenler için kullanılmaz. Eşit aralıklı, oran ve sıralama ölçme düzeyinde ölçülen değişkenler için kullanılır.

Ortanca değerin, birim sayısının tek veya çift olmasına göre değişeceğine değinmiştik. Sınıflandırılmamış serilerde ortanca değeri hesaplarken her iki durum için de ilk olarak eldeki veriler büyüklük sırasına göre sıraya konulur. Birim sayısı n ile gösterilmek üzere,

 

 

 

formülü ile hesaplanır.

Sınıflandırılmış serilerde ortanca değerin hesaplanması farklılık gösterir. Birikimli frekans tablosunda bulunan sınıf ara değeri ve den daha az frekans sütunları kullanılır. İlk olarak veri sayısının tek ya da çift oluşuna göre “j” değeri bulunur. Daha sonra aşağıdaki eşitlik kullanılarak ortanca değer hesaplanır.

 

Burada,

j. Değerin bulunduğu sınıfın alt sınıf ara değeri

j. Değerin bulunduğu sınıfın alt den daha az frekansı

j. Değerin bulunduğu sınıfın üst den daha az frekansı

c: Sınıf aralığı

n : Birim sayısıdır.

Burada, aslında j. değerin bulunduğu sınıfın frekansıdır.

 

Örnek: Aynı hastalığa sahip 12 kişilik bir gruba yapılan ilaç tedavisi sonucu iyileşme süreleri gün olarak aşağıdaki gibi verilmiştir.

15,16,18,14,12,17,18,20,19,14,15,18

İyileşme sürelerinin ortancasını bulunuz.

Çözüm: Öncelikle veriler büyüklük sırasına dizilir:

12,14,14,15,15,16,17,18,18,18,19,20

Veri sayısı, n=12 çift olduğu için ortaya düşen iki değerin ortalaması ortanca olacaktır. ve j+1 =7 olmak üzere,

 

olarak bulunur.

 

Örnek: Bir bulaşıcı hastalığın kuluçka dönemi gün olarak aşağıdaki gibi gözlenmiştir.

5,6,5,3,7,9,6,4,8

Ortancayı bulunuz.

Çözüm: Veri sayısı, n=9 tek olduğu için veriler sıralandığında ortaya düşen değer ortanca olacaktır. olmak üzere verilerin küçükten büyüğe sıralanmış hali ve ortanca değer aşağıdaki gibidir.

 

Örnek: Aşağıdaki frekans tablosundan yaralanarak 120 erkek bebeğe ilişkin ortancayı hesaplayınız.

Çözüm: c=0.11 ve n=120’dir. Burada, olup den daha az frekans sütununda bu değer
yoktur. Bu durumda bu değeri içeren aralık belirlenir. Buna göre yukarıda belirtilen ve bu sınıfı içine alan ve ‘dur. Burada, ‘ e karşılık gelen ‘tir. Bu değerler ortanca formülünde yerine konulduğunda,

olarak hesaplanır.

Eğer, j  değeri den daha az frekans sütununda bulunabilirse ortanca, den daha az frekansına karşılık gelen sınıfın sınıf ara değeri olarak alınır.

Ortancanın (medyanın) özellikleri

  • ∙Terimden mutlak sapmalarının toplamı minimumdur.

  • Basit bir sıralama ile bulunması mümkün olduğundan, ortanca birçok durumda pratiktir. Örneğin bir grup  öğrencinin boy uzunluğunu teker teker ölçmeye gerek yoktur. Öğrenciler küçükten büyüğe doğru sıralanıp ortadaki öğrenci (ler) ölçülerek ortanca boy uzunluğu bulunabilir.
  • Seride açık (alt sınırı veya üst sınırı belli olmayan) sınıfların varlığı halinde ortanca hesabı önem kazanır. Ortanca  sınıfı serinin ilk sınıfı olduğunda, sınıfın alt sınırı tahminsel olarak ele alınır.
  • Diğer ortalamaların aksine, gruplanmış serinin ortanca hesabında sınıf genişliklerinin tamamının eşit olması gerekmez.
  • Ortanca serdeki anormal terimlerden etkilenmez.
  • Ortancanın standart hatası aritmetik ortalamadan daha büyüktür.
  • Ortanca üzerinde cebirsel işlemler yapılamaz.
  • Farklı alt grupların ortancaları biliniyorsa bu gruplar birleştiğinde ortanca nedir sorusu hesaplama ile bulunamaz.

 

Buraya kadar anlattığım aritmetik ortalama, tepe değer ve ortanca arasındaki ilişkiyi grafik üzerinde görelim.

 

 

 

 

Çeyreklikler

Küçükten büyüğe doğru sıralanmış verileri dört eşit parçaya bölen değerlere çeyrek değerler denir. Birinci çeyreklik (Q1), veriler küçükten büyüğe sıralandığında verilerin %25’ ini sağında, %75’ ini solunda bırakan değerdir. İkinci çeyreklik ortancaya denk gelmektedir. Üçüncü çeyrek değer (Q3), veriler küçükten büyüğe sıralandığında verilerin %75’ ini sağında %25’ ini solunda bırakan değerdir. Yani sıralı verilerde, ortancadan küçük olan değerlerin ortancası birinci çeyrek değer, ortancadan büyük olan verilerin ortancası üçüncü çeyrek değerdir.

Örnek: İlaçla tedavi edilen 8 hastanın iyileşme süreleri gün olarak aşağıda verilmiştir. Çeyrek değerleri hesaplayınız.

30, 20, 24, 40, 65, 70, 10, 62

Çözüm: İlk olarak verilerin sıralanması gerekir,

n=8 çift olduğu için ‘ dir.  Ortancadan küçük olan değerlerin
ortancası birinci çeyrek değere, ortancadan büyük değerlerin ortancası üçüncü çeyrek değerdir.

 Geometrik Ortalama

N sayıdaki ölçümler setinin geometrik ortalaması, dizideki ölçümlerin çarpımının N. Kareköküdür.

Geometrik ortalama, ölçümler arasındaki değişme oranını, gelişme ve büyüme hızı ile indeks hesaplamada kullanılır. Geometrik ortalama çoğu kez sağa çarpık dağılımlarda bir merkezi eğilim ölçüsü olarak kullanılır.

Tablo: Geometrik Ortalama Formülleri

Geometrik ortalama, terimlerinin logaritmalarının aritmetik ortalamasının antilogaritmasına eşittir. Geometrik ortalama, terimlerin logaritmalarının aritmetik ortalamasının antilogaritmasına eşittir. Geometrik ortalama özellikle aynı oranda artma veya azalma eğilimi gösteren olaylarla ilgili serilere uygulanır (Örneğin, nüfus).

Örnek: geometrik ortalamasını hesaplayınız.

Çözüm:

 

Örnek: Aşağıdaki sınıflanmış serinin geometrik ortalamasını bulunuz.

Çözüm:

 

Örnek: Aşağıda verilen gruplanmış serinin geometrik ortalamasını bulunuz.

Çözüm=

Geometrik ortalamanın özellikleri

  • Herhangi bir veri sıfır veya negatif değerli ise geometrik ortalama hesaplanamaz.
  • Uç değerlerden aritmetik ortalama kadar etkilenmez.
  • Aritmetik ortalamadan küçüktür.
  • Gözlem sonuçlarının geometrik ortalamaya oranlarının çarpımları 1’dir.

Merkezi Eğilim Ölçüleri dersinin sonuna geldik eksik veya yanlış gördüğünüz yerler için iletişime geçebilirsiniz. Bir sonraki derste görüşmek üzere 🙂

 

Post Author: Emel Bulut

Uludağ Üniversitesi - ekonometri

2 Replies to “Merkezi Eğilim Ölçüleri”

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir