Normal Dağılım nerden gelmiş?

Matematik doğanın dili olarak tanımlanır. Fizik problemleri matematik ile çözülebilir. Biyoloji, sosyoloji, ekonomi gibi alanlarda matematik kuralları uygulanabilir mi?

İnsan kendi başına karmaşık, kaotik bir varlık iken insanla ilişkili hiç bir bilim dalı da matematiksel kurallara tamamen oturtulamadı dolayısıyla. 16yy’da bilim insanları belirsizlik üzerine çalışmalar yaptı. Örneğin, kuantum fiziği tamamen belirsizlik üzerine kuruludur. Madem gerçek değer hesaplanamıyor, işte o noktada olasılık ve istatistik devreye giriyor.

Olasılık ve İstatistik, Matematiksel olguların insan ile ilişkili bir bilim dalında kullanımına olanak veren bir pencere oldu.

İlk istatistik analiz yapan kişi 17yy’da Londra’da tezgahtarlık yapan ve gazetedeki haftalık ölüm raporlarını takip eden John Graunt tarafından yapılmış. Bu raporları derleyip, hastalıklar ve o hastalıktan ölen kişilerin sayısı, yeni doğanlardaki cinsiyet dengesi, bölgelere göre yaş dengesi vb. istatistikler çıkarmış. O yıllarda yaşamış olan Elmond Halley, kendi oluşturduğu hayat tablosunu analiz ederek ölüm yaşlarına göre kişi sayısını hesaplamış ve  şöylee bir felsefik çıkarım yapmış:

“İnsanların neredeyse yarısı 17 yaşından önce ölüyor. Şikayet etmek yerine, her yılın bize verilmiş bir hediye olduğunu düşünmeliyiz.”

Modern istatistik Belçikalı bilim adamı Lambert Adolphe-Jacques Quetelet tarafından kurulmuş. Lambert kişilerin boy, kilo, uvuz uzunlukları ve bunların yanında psikolojik testler ile entellektüel özelliklerini ölçmüş. Ve görmüş ki çoğu insan için bu ölçümler benzer dağılım gösteriyor. Veriler grafiğe dökülünce de işte bu normal dağılım eğrisi ortaya çıkmış:normal-dagilim

Bu dağılımın matematiksel fonksiyonlara uyan bir çok özelliği var.  Örneğin, normal dağılım için şu her zaman doğru olan bir gerçek: örneklemin %99’u 3-standart sapma aralığına, %95’i 2-standart sapma aralığına, %68’i 1-standart sapma aralığına düşüyor. Tabi bazı ölçümler normal dağılıma uymamış. Mesela gelir dağılımı. Madem insanların doğasıyla ilgili tüm ölçümler normal dağılım gösterirken, neden gelir değerleri normal dağılım göstermiyor? Neden çünkü para mevzusu doğamıza aykırı, doğal olmayan bir durum mu acaba? Lidyalılar bile pişman olurlar belki parayı bulduklarına para için insanların düştüğü durumları görseler. İşte istatistik,sosyal olguların nedenleri üzerine bu tür yorumlara altyapı oluşturuyor. Yine normal dağılım eğrisine bakarak görülecek ve yorumlanacak birşey daha var. Outlier lar. Outlier, herkes normale uyarken normalin dışına çıkan yaramaz verilerdir. Bu veriler çok değerli olabilir fakat genelde göz ardı edilme eğilimi yüksektir. Detaylı inceleme başka bir blog yazısında olur.

Astronottan mühendise, fizikçiden psikologa, ilaç şirketlerinden genetikçilere herkes olasılık matematiği kullanmak zorunda.

İlk olasılık kuramı kumarhanelerde ortaya çıkmış. Karl Peason delirmiş olmalı ki gerçekten 24.000 kez bozuk parayı havaya atmış ve gelenin yazı mı tura mı olduğunu yazmış. Ve görmüş ki yazı tura yarı yarıya.

Şu bir gerçek ki olasılık ve istatistik büyük veri olduğu zaman anlamlı. Bir deneyi ne kadar fazla tekrar edilirse sonuçlar o kadar çok gerçeğe yaklaşacaktır. İlk yazımda bahsettiğim gibi bir olayı etkileyen tüm değişkenleri bilmenin imkanı olmayacağı için ne kadar fazla tekrar, ne kadar fazla verir o kadar gerçeğe yakınlık.

Büyük Veri – Big Data çağındayız ve ben  veri analisti olma yolunda olasılık ve istatistiksiz olmayacağının farkındayım. Dolayısıyla bir istatistik kategorisi açmak şart oldu.

Hiç bir şey olasılıksız değildir. Olasılıksız bırakmayın kendisini efendim sağlıcakla..

Referanslar
https://en.wikipedia.org/wiki/Edmond_Halley
https://en.wikipedia.org/wiki/Karl_Pearson
http://www.dr.com.tr/Kitap/Tanri-Matematikci-Mi/Mario-Livio/Bilim/Bilim-Tarihi-ve-Felsefesi/urunno=0000000632232

814 total views, 1 views today

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir