Son zamanlarda sosyal medyada (X) paylaştığımız makalelerin (Deleuze ve Ben) “nedenselliklerinin” tam anlaşılmadığını düşünüyorum. Türkiye’deki sosyal bilimlerde de nedensellik eğitiminin zayıf olduğunu bir sosyal bilimci (U. İlişkiler) olarak biliyorum. Bunları düşünerek bu iki yazıyı yazmaya karar verdim. Belki de üçe çıkartabilirim, şimdilik bilmiyorum. Yine de gelin bir giriş yapalım!
Sosyal bilimlerdeki modellerde iki değişkenden bahsederiz: bağımsız değişken ve bağımlı değişken. Bağımsız değişken, açıklayıcı değişkendir. Bağımsız değişkenin bağımlı değişken (açıkladığımız şey) üzerinde etkisi olduğunu varsayarız. Örneğin, suç ve gelir. Modelimiz gelirin suça neden olduğunu söylüyorsa bağımlı değişkenimiz suç (açıklanan değişken) ve bağımsız değişkenimiz gelir (açıklayan değişkendir). Peki bu ikisi arasındaki ilişki her zaman varsaydığımız şekilde mi gerçekleşir? Gelirin, gerçekten suça neden olduğunu mu düşünüyoruz? Yoksa ikisi arasında korelasyon olduğunu mu? Korelasyon, değişkenler arasında istatistiksel bir ilişki olduğu anlamına gelir; nedensellik, bağımsız değişkendeki bir birim değişikliğin bağımlı değişkende bir değişikliğe neden olması anlamına gelir.
Örnek: Gelirin suça neden olduğunu varsayıyoruz, ceteris paribus. Geliri iki gruba böldük: yüksek gelir ve düşük gelir. Eğer varsayımımız doğruysa geliri artırıp yüksek gelire yükselttiğimizde suçun düşmesini bekleriz. Bağımsız değişkende yarattığımız değişikliğin bağımlı değişkende anlamlı bir değişiklik yaratmasını bekleriz. Yine de gerçek hayat bu kadar basit değildir…
Sosyal bilimlerdeki bir araştırmanın amacı tipik olarak sonuçları açıklamak, trendleri veya olayları gözlemlemektir; lâkin sosyal dünya ve insanlar oldukça karmaşıktır. Bu nedenle sosyal bilimciler tarafından araştırılan olguların çoğu, birkaç bağımsız değişkene sahiptir. Hayal edelim.
Çocuğunuz 4. sınıfa gidiyor ve okulunuzda 6 tane 4.sınıf var (4-A, 4-B, 4-C, 4-D, 4-E, 4-F). 4. sınıfa giden çocukların matematik dersinden aldığı notları bir sütuna, matematik ödevlerini yapmak için harcadıkları vakti diğer sütuna yazdınız (Rastgele yazdım, 4. sınıf öğrencileri tabii ki hep 50 alacak değil)
Hipotez 1: Matematik ödevlerini yapmak için harcanan saat artıkça, alınan not artıyor.
Bu da gayet iyi görünüyor sanki? Harcanan saat artıkça alınan notlar gerçekten yükselmiş. Kızınızın odasına gidiyorsunuz ve diyorsunuz ki “Kızım bak, matematik ödevlerine daha çok vakit ayırırsan notun yükselir.” Kızınız da size hemen itiraz ediyor “Baba, peki ya ebeveynler? Bazı çocukların ebeveynleri daha eğitimli ve o çocukların matematik notları daha yüksek! Hatta bazı çocukların anne-babaları boşanmış, onların notları daha düşük!”. Gayet makul bir itiraz, demek ki tek bir değişken her şeyi açıklayabilecek durumda değil. Bir başka faktör olan aileyi de ölçümünüze katmanız gerektiğini düşünüyorsunuz. Çocuğunuzun ilk söylediği şey değil ama ikinci söylediği şey aklınıza takıldı: boşanmış ailelerin çocukları. Masanıza tekrar oturdunuz, bilgiyardan exceli açtınız, listeyi önünüze getirdiniz ve boşanmış ailelerin çocuklarına baktınız. Kızınız haklı görünüyor, anne-babası boşanmış çocukların matematik notları diğer çocuklardan ortalamada daha düşük. Bunun neden olabildiğiyle ilgili düşünmeye başladınız:
Hipotez 2: Boşanmış ailelerin çocukları daha istikrarsız bir evde yaşıyor, kendilerini çok uzun süre etkileyecek duygusal sorunlar yaşıyorlar.
Hipotez 3: Boşanmış anne-baba çocuğuna daha az vakit ayırıyor, çocuklarının eğitimine önem vermiyor.
Bu sebeplerin gerçek hayatta karşlığı var, aklınıza ve sezgilerinize yatıyor. Yine de, en azından nedensellik* konuşurken, yukarıda yaptığınız çıkarımlar tamamen yanlış oluyor çünkü bu nedenselliği cross-sectional (enlemesine) bir veri seti üzerine yaptınız. Enlemesine veri belirli bir zamansal noktada* (veriyi sınav sonuçları açıklandıktan sonraki gün topladınız diyelim) sadece bir kere toplanılan veridir. Yaptığınız çıkarımın neden hatalı olduğunu sadece 30 saniye düşünmenizi istiyorum.
Düşünmeniz bittiyse devam edelim. Siz hâlihazırda aileleri boşanmış çocukların skorlarının ortalamada düşük olduğunu gördünüz; hatta bu düşüklük matematik ödevlerine ayırdıkları vakti sabit tuttuğunuzda da görünen bir şeydi. Ölçmediğiniz şey ne? Bu çocukların aileleri boşanmadan önceki matematik notları. Eğer boşanmanın çocukların ders notlarında etki ettiğini göstermek istiyorsanız, bu çocukların matematik notlarını, aileleri boşanmadan önce ve boşanmadan sonra, toplamamız gerekiyor. Bir şekilde elinize çocukların aileleri boşanmadan önceki matematik notları geçti. Elinizde yaklaşık 3 yılı kapsayan veriler var. Bir şey dikkatinizi çekti: bu çocukların notları aileleri boşanmadan önce de zaten ortalamadan daha düşükmüş. Varsayımlarınız yalanlandı. Tersini de bulabilirdiniz, elbette. Çocukların matematik notları aileleri boşanmadan önce ortalamaya yakın/ortalamanın üstündeyken, boşandıktan sonra çok hızlı bir şekilde düşmüş. Sosyal bilimlerde bu verilere boylamsal veri diyoruz. Boylamsal veriler veya panel veriler, her bir varlığın (çocukların) iki veya daha fazla (örneğin çocukların matematik notlarının yazılı olduğu karneler, her yıl elinize 1 kere geçiyor ve 3 yılın karnesine sahipsiniz) zaman diliminde gözlemlendiği birden fazla varlık için verilerdir.
Panel veriler yukarıda bahsettiğim örnekten dolayı nedenselliğin kurulmasında çok önemlidir. Birincisi, zaman önceliğine dikkat etmeliyiz. Nedensellik zamanda geriye doğru işlemez, dolayısıyla zaman içinde bir değişkenin diğerinden önce gerçekleştiğini/oluştuğunu tespit edebilirsek nedenselliği kurmamız kolaylaşır. Boylamsal verilere araştırmada bu kadar değer verilmesinin bir nedeni de budur; sonuçlarımız (matematik notları) nedenlerimizden (alınan notlar) sonra ölçüldüğünde, sebep-sonuç çıkarımı (yani burada bir nedensellik olduğunu söylerken) yapmamız kolaylaşır. Yine de enlemsel verilerle bile mantıksal zaman önceliğini belirlemek çoğu zaman mümkündür. Nasıl mı? Örneğin “cinsiyet” değişkenini düşünelim.
Hipotez 4: “Erkekler, ortalamada, kız öğrencilerden matematik konusunda daha başarılıdır”.
Hemen hemen herkes için biyolojik cinsiyet, döllenmeden itibaren sabittir. Böylece, Cinsiyet ne zaman ölçülürse ölçülsün, onu mantıksal olarak döllenmeden sonraki değişkenlerin önüne koyarak nedenselliği gerçekten iyi bir şekilde tartışabiliriz. 2016 yılındaki Matematik notlarınızın 2016 yılındaki “cinsiyetinizi” belirlediğinizi düşünüyorsanız, bir IQ testi yaptırmanızı öneririm.
İkincisi, ilgili araştırma hakkında yetkin bir anlayışa sahip olmalısınız. Önceki araştırmalar doğru nedensel çıkarımları göstermiş olabilir. Öyle olmasa bile - diğer araştırmacıların da aynı çıkarımları yapmak zorunda kaldığını bulsanız bile - önceki araştırmalar, B'nin A'yı etkilemesi yerine A'nın B'yi etkilediği gayet iyi şekilde size gösterebilir. Üçüncüsü de mantıktır. A'nın B'yi nasıl etkileyebileceğini hayal edin ve sonra B'nin A'yı nasıl etkileyebileceğini hayal edin. Düşündüğünüz olguya aşinaysanız, onları dikkatli bir şekilde gözlemlediyseniz, nedenini kolayca hayal edebilirsiniz. O halde bu mantıksal alıştırma, çoğu zaman nedenselliğin bir yönünün diğerine göre çok daha makul olduğunu ortaya koyacaktır.
Nedensellik ve Zorlukları
Panel verinizi çıkarttınız. Verinizde bazı şablonlar buldunuz ve artık nedensellik sorusunu derinlemesine inceleyebilirsiniz. Spoiler: Nedensellik kurmak çok ciddi bir iddiadır ve sosyal bilimlerde nadiren başarılabilir.
Nedensel çıkarımdan bahsettiğimizde X'in (bağımsız/açıklayıcı değişkenimiz) Y'ye (bağımlı/sonuç değişkenimiz/açıklanan değişken) neden olduğunu söylüyoruz. Başka bir deyişle bu, X olmazsa Y'nin de olmayacağı anlamına gelir. Buna karşı olgusal denir: bağımsız değişkenimizin varlığı veya yokluğu dışında her şeyin tamamen aynı kaldığı bir senaryo. Basit bir örnekle açıklayalım:
Aspirin almanın baş ağrımı hafifletip hafifletmeyeceğini bilmek istiyorum. Aspirini (bağımsız değişken) alıp baş ağrımın (bağımlı değişken) geçip geçmediğine bakabilirim. Ama zamanda geriye gidip baş ağrısının yine de geçip geçmeyeceğini görmek için aspirin alamam. Bir dahaki sefere başım ağrıdığında bunun tersini (hap almamayı) test edebilirim, ancak bu iki durumu asla karşılaştıramayacağım çünkü her şey değişti: aldığım uyku miktarı, o gün yediğim şeyler, yaptığım aktiviteler ve ilk baş ağrısının olduğu günün tam olarak aynı senaryosunu yansıtacak şekilde kontrol edemediğim onlarca ayrıntı var. Bu aynı zamanda diğer her şeyi eşit tutma ikilemi ("ceteris paribus") olarak da bilinir ve nedensel çıkarımın temel sorunudur.
Karşı olguyu hayata geçirerek nedensel bir iddiayı test etmeye asla erişemeyeceğimiz için, neden-sonuç ilişkilerini düşünmek - hem teoriler üretmek hem de onları test etmek - çok karmaşık bir konudur. Nedensellik hakkında düşünme sürecinde aklımızda tutmamız gereken birkaç şey var.
Medya tüketimi ve partizanlık örneğini ele alalım. Diyelim ki A Haber izlemenin, izleyicilerin Cumhur İttifakı adaylarına daha yüksek oranda oy vermesine neden olduğunu öne sürüyorsunuz. Sorun burada başlıyor.
Öncelikle X (A Haber izlemek) ve Y (Cumhur İttifakına oy vermek) arasında herhangi bir ilişki olup olmadığını belirlememiz gerekiyor. Bunu yapmanın, basit tanımlayıcı istatistiklerden regresyon gibi daha karmaşık yöntemlere kadar birçok yolu var. Örneğin insanlara hem izleme alışkanlıklarını hem de seçim tercihlerini soran bir anket yapabilirsiniz. Diyelim ki A Haber izleyicilerinin gerçekten de Cumhur İttifakı’ndan olan adaylara daha yüksek oranda oy verdiğini gördünüz. Not: Kullandığımız (anket), X ve Y'nin ilişkili olup olmadığını söylemenize olanak tanır, ancak bu, X'in Y'nin nedeni olduğu anlamına gelmez, yalnızca bunların bir şekilde ilişkili olduğu anlamına gelir. Aslında yaygın olarak kullandığımız birçok araçta durum böyledir.
İkinci olarak bu ilişkinin yönünün ne olduğunu iyi düşünmemiz gerekiyor. X, Y'ye "neden oluyor" mu, yoksa tam tersi mi? İkinci seçenek ters nedensellik olarak bilinir ve hem teorinizi geliştirirken hem de verilerinizi test ederken dikkate alınması gerekir. Belki Cumhur seçmenleri A Haber’den daha çok hoşlanıyorlar çünkü kanal diğer kanallara göre İttifakları hakkında daha olumlu haberler sunuyor.
Üçüncüsü, değişkenleri karşılaştırarak ele almamız gerekiyor. Karıştırıcı değişken, X ve Y arasında gözlemlenen dağıtan - yani karıştıran - bir değişkendir (Z). Ancak bu değişkeni gözlemlemediğimiz için sonuçlarımızı yanlış yorumlayabiliriz. Örneğin, bir Z değişkeni hem X'i hem de Y'yi etkileyebilir. Ancak biz sadece X'i gözlemliyoruz, dolayısıyla Z'nin bu ilişkide oynadığı rolün evrenine katmıyoruz. Bu, nedensel bir arıza hatalı bir şekilde tanımlamalarımıza veya ilgili arızanın hatalı bir şekilde şişirmemize yol açabilir
Bu durumda, daha fazla A HABER izleyenler Cumhur İttifakını daha çok destekleyenler, daha az izleyenler daha düşük destek gösteriyor: değişkenler birlikte hareket ediyor. Ancak az önce de belirttiğimiz gibi bu hareket üçüncü bir faktörden (YAŞ) kaynaklanıyor olabilir. Bu faktörü dikkate aldığımızda izlenme ve oy arasındaki ilişki ortadan kalkabilir.
İhmal (Omitted) edilen değişkenlere ve daha genel anlamda kafa karıştırıcı değişkenlere (a spurious variable) dikkat etmezsek, tüm değişkenleri dikkate almadığımız için nedensel bir ilişki olduğunu iddia edebiliriz. Pratikte bu zor bir iştir. Özellikle sonucumuzu etkileyebilecek her bir değişkenin ölçümlerine sahip olmadığımızda, yalnızca bir değişkeni izole etmek zordur. Aslında bazı durumlarda olası tüm karıştırıcı değişkenleri düşünemiyoruz bile…
Nedensellik ile uğraşırken akılda tutulması gereken bir diğer unsur nedensel mekanizmaya (causal mechanism) atıfta bulunmaktadır. X'i Y'ye bağlayan makul bir mekanizma düşünebilir miyiz? Neden daha fazla A HABER izlemek insanların Cumhur Adaylarına oy vermesine neden olsun ki? Belki kanal insanların adaylar hakkındaki bilgisini arttırabilir veya açıkça partiyi destekleyen belirli bakış açılarını teşvik edebilir. Her durumda, iki değişkenin neden ilişkili olduğuna dair bir fikre sahip olmak, nedensel ilişkinin var olduğuna dair bize daha fazla güven verir.
-Peki panel veri burada nasıl işimize yarardı? Örneğin, 1000 kişinin 30 yıl boyunca hangi haber kanallarını izlediğini ve hangi partilere (ideolojik yakınlıklarını temel alarak) oy attığını gözlemeyebilirsiniz. İzledikleri kanallar yıllar içinde (yaşla birlikte) değiştiği halde oy vermelerinin değişmediğini/değiştiğini görmeniz bu ilişkinin yanlış veya doğru olduğunu doğrudan size gösterebilir. Peki cross-sectional veri neden işimize yaramaz? 20 ve 50 yaşlarında olan iki grubun hangi kanalları izleyip hangi partiye oy verdiğini ölçtünüz. Bu veri nedensellik çıkarımı yapmakta sizi zorlayacak çünkü 50 yaşındaki grubun genç yaşlarında hangi kanalları izlediğini veya partiye oy attığını bilmiyorsunuz.-
Bu soruları yanıtlarsak neden-sonuç ilişkisini tespit etme şansımız olabilir. Bazı yöntemler bu sorunları çözmede diğerlerinden daha iyidir. Nedensel çıkarım niceliksel yöntemlerle sınırlı değildir. Nedensel ilişki, Süreç Takibi (process-tracing) ve Karşı Olgular gibi nitel yöntemlerle de ortaya çıkarılabilir. Bu araçlar, örneğin tarihi belgeleri inceleyerek ve röportajlar yaparak belirli vakaların derinlemesine analizine dayanır.
Nicel yöntemler arasında nedensel çıkarıma ulaşmaya çalışan iki tür yöntem vardır: deneysel çalışmalar (observational) ve gözlemsel (experimental) çalışmalar. Deneysel çalışmalar nedensel çıkarım için en güçlü araçtır. Neden? Randomizasyondan dolayı. Deneyleri bu kadar güçlü kılan temel özellik, tedaviyi (bağımsız değişkenimizi) birimlerimize rastgele atayabilmemizdir. Görünüşte basit olan bu eylem sayesinde yukarıda bahsedilen sorunların çoğunun üstesinden gelebiliyoruz. Nedensel çıkarımın temel sorununun, karşı olgusallığı hiçbir zaman test edemememiz olduğunu hatırlayın; Bağımsız değişkenimizin manipülasyonu dışında her şeyi eşit tutmanın bir yolu yoktur. Bununla birlikte, randomizasyon yoluyla tedavi ve kontrol grubu genelinde ortalama olarak diğer tüm koşulları eşit hale getirebiliriz. Tedaviyi birimlere rastgele atayarak, tedavi ile kontrol arasındaki tek farkın tedavinin varlığı/yokluğu olduğunu söyleyebiliriz. Bu, bu iki grubun gözlemleyemediğimiz değişkenler açısından bile benzer olduğu ve dolayısıyla kafa karıştırıcı bir değişken sorunuyla karşılaşma olasılığımızın daha düşük olduğu anlamına gelir.
Deneyler nedensel çıkarım için tercih edilen araç olmasına rağmen, kaynak eksikliği, etik sorunlar ya da araştırma konumuz göz önüne alındığında ulaşılamaz olmaları nedeniyle her zaman kullanıma uygun olmayabilirler. Deneyler ayrıca bireylerle uğraşırken en yaygın olanıdır. Ülkeler arası karşılaştırmalarda deney yapmak neredeyse imkansızdır (Siyaset Bilimi & U. İlişkiler).
Örneğin: Ülkelerin savaşlardan nasıl etkilendiğini anlamak için ülkelerde rastegele savaş çıkartamıyoruz. Savaşta olan veya savaşmış ülkeleri gözlemleyip bir çıkarım yapabiliyoruz.
Çoğu zaman, doğası gereği gözlemsel olan verileri almamız ve az ya da çok karmaşık istatistiksel prosedürler kullanarak bir deneye yaklaşmaya çalışmamız gerekir. Gözlemsel terimini kullanmamızın nedeni, tedaviyi (bağımsız değişkenleri) manipüle etmediğimiz gerçeğinden kaynaklanmaktadır; bunun yerine yalnızca toplanan verileri gözlemliyoruz. Bu yöntemler Farktaki Fark, Regresyon Süreksizliği, Eşleştirme ve Araçsal Değişkenleri içerir. Bunları daha sonra açıklayacağımdır.
Tarihsel olarak birçok bilim insanı basit regresyonlar kullanarak nedensel iddialarda bulunmuştur. Regresyonlarla "diğer her şey eşit" yaklaşımına yaklaşma şeklimiz, olası kafa karıştırıcı değişkenleri kontrol etmektir. Regresyon analizlerinde, kafa karıştırıcı değişkenleri kontrol ettiğimizde geriye sadece sebep-sonuç ilişkisinin kaldığını varsayıyoruz. Ancak daha önce de belirtildiği gibi ilgili tüm değişkenleri kontrol etmek neredeyse imkansızdır. Bu ve diğer nedenler, bazı bilim adamlarının gözlemsel verilerle nedensel iddialarda bulunmanın imkansız olduğuna inanmalarının nedenidir. Aslında, regresyon analizlerinizden nedensel ilişkiler çıkarırken çok dikkatli olmalısınız. Yine de, regresyon analizleri verilerdeki ilgili ilişkileri ve eğilimleri tanımlamak için çok yararlı bir araçtır.
Sosyal Bilimler için konuşmak gerekirse, genel olarak dünyada, özel olarak ise ülkemizde matematiksel mantık ve istatistik disiplininden uzak çok kişinin olduğunu gözlemleyen (ki bu çıkarımı bile aslında bir yanılgı ve hatta safsata olabilir), bir sosyal bilimcinin bu konulara değinmesi epey güzel.
Kaleminize sağlık.