11.3.18

Doğru ve Yanlış Haberlerin İnternette Yayılımı


Soroush Vosoughi, Deb Roy , Sinan Aral




"Doğru ve yanlış söylentilerin yayılımını incelediğimizde, tüm malumat kategorilerinde yalanın doğrudan önemli ölçüde daha uzak, daha derin ve daha geniş biçimde yayıldığını gördük."


Science  09 Mar 2018:
Vol. 359, Issue 6380, pp. 1146-1151
DOI: 10.1126/science.aap9559

Karar alma (1-3), şirket (4), iletişim (5) ve pazarın (6) esasi teorilerinin tümü, hakikat veya hassasiyetin kavramsallaştırılmasını neredeyse her insani uğraşın faaliyet merkezinin bir parçası olarak görüyor. Şuan, hem doğru hem yanlış malumat internet ortamları vasıtasıyla hızla yayılıyor. Neyin doğru, neyin yanlış olduğunun belirlenmesi ortak politik strateji haline gelerek, hemfikir olunan olgular üzerine kurulu tartışmaların yerini aldı. Ekonomilerimizin de yanlışlıklara bağışıklığı yok. Söylentiler borsa fiyatlarını ve geniş ölçekli yatırımların teşviklerini etkiledi. Örneğin, Barack Obama’nın bir patlamada yaralandığını iddia eden tweet’in ardından borsa değeri 130 milyar dolar düşüş yaşadı(7). Aynı şekilde, afetlerden (8,9) terör saldırılarına (10) kadar, her şeye tepkimiz internette yayılan yanlış haberlerce altüst oldu.

Süratle malumat paylaşma ve geniş ölçekli malumat basamaklarını kolaylaştıran yeni sosyal teknolojiler, yanlış malumatın (yani kusurlu veya yanıltıcı) yayılmasına olanak tanıyabilir. Fakat gittikçe daha çok malumat ve habere ulaşımımız bu yeni teknolojiyle yönlendirilmesine karşın (11) yanlışlıkların internette yayılmasına katkılarını çok az biliyoruz. Yine de medya, yanlış haber yayılımının sistematik olmayan analizlerine önemli ölçüde ilgi gösterdi. Geniş ölçekte deneysel, yanlış malumatın yayılım veya sosyal kökenlerinin incelemesi az sayıda mevcut. Yanlış malumatın yayılım çalışmaları halen özel amaçlı, küçük örneklerin analiziyle sınırlı ve en önemli bilimsel iki soruyu reddetmekte: Doğruluk ve yanlışlık nasıl farklı biçimde yayılmakta ve bu farklılıkları hangi insani etkenler açıklar?

Mevcut çalışma, Higgs bozonunun keşfi (13) veya 2010’daki Haiti depremi (14) gibi tekil ve 2013 Boston Maraton bombalanması (10) gibi tekil felaketteki çoklu söylentilerin yayılımını inceler veya söylenti yayılımı için teorik modeller (15), söylenti tespiti (16), itibar değerleme (17, 18) veya söylentilerin yayılımını engelleme girişimleri (19) için yöntemler geliştirir. Ancak neredeyse hiçbir çalışma, konular arasında doğruluk veya yanlışlığın yayılım farklılığını kapsamlı biçimde değerlendirmez veya yanlış haberlerin neden doğrulardan farklı olarak yayıldığını irdelemez. Örneğin, Del Vicario ve arkadaşları (20) ve Bessi ve arkadaşları (21) bilimsel ve komplo teorisi öykülerinin yayılımını çalıştılar, gerçekliğini değerlendirmediler. Bilimsel ve komplo teorisi öykülerinin her ikisi de doğru veya yanış olabilir ve yayılımları için önemli ama geçerliliklerine dikey olan biçimsel ölçülerinde farklılık gösterirler. Yanlış haberlerin yayılımını anlamak için, doğru ve yanlış bilimsel öykülerin ve doğru ve yanlış komplo teorisi öykülerinin ayrışmasından ve konuyla ilgili ve biçimsel farklılıklar arasındaki kategorilerin kontrolünün ardından yayımı incelemek gereklidir. Bugüne kadar, söylentileri doğruluğuna göre bölümleyen tek çalışma Friggeri ve arkadaşlarının (19), Facebook’ta yayılan yaklaşık 4000 söylentiyi inceleyen ve yanlışlığın doğruluktan farklı olarak nasıl dağıldığından daha çok (19), doğruluk kontrolünün söylenti yayılımına etkisinin nasıl olduğunu inceleyen çalışmadır.

Mevcut politik iklimimiz ve akademik literatürümüzde, “sahte haber” (fake news), sosyal medya aracılığıyla Birleşik Devletler politikasında yabancı girişimleri ve haber, sahte haber, yanlış haber, söylenti, söylenti basamakları ve diğer ilişkili terimlerin nelerden teşkil ettiğini anlayışımız etrafında akışkan bir terminoloji ortaya çıktı. Yine de zamanında sahte haberin, bir haber öyküsünün doğruluğuna istinat edildiğini düşünmek uygun olmuş olabilir, şimdi inanıyoruz ki bu ifade, mevcut politik ve medya ikliminde telafisi mümkün olmayacak biçimde kutuplaştırılmıştır. Siyasiler, kendi konumlarını desteklemeyen haber kaynaklarını güvenilmez veya sahte haberler, destekleyenleriyse güvenilir veya sahte olmayan haberler diye etiketleme siyasetini uygulayınca, sunulan malumatın asli doğruluğuyla olan tüm bağını yitiren kavram, anlamsızlığını akademik tasnifteki kullanımla sahnelemekte. Bu çalışma sürecinde, sahte haber kavramını kullanmaktan açıkça kaçındık ve bunun yerine daha nesnel olan kanıtlanabilir “doğru” veya “yanlış” haber kavramlarını kullandık.
Ayrıca, haber kavramının geniş tanımını kasten kullandık. Bir öyküde, iddiaların kurumsal kaynak temellerini neyin oluşturduğunu tanımlamaktan ziyade, Twitter’da haber olarak ileri sürülen herhangi savı ifade ettik. Haberi, herhangi bir öykü veya içeriğinde iddia edilen sav ve haber öyküsünün sosyal fenomeni olarak söylentiyi veya Twitter ağında yayılan veya dağılan sav olarak tanımladık. Söylenti tabiatı gereği sosyaldir ve insanlar arasında iddiaların paylaşımını içerir. Diğer yandan, paylaşılsa da paylaşılmasa da haber, iddiası olan savdır.

Söylenti basamağı Twitter’da, yazılı metin, fotoğraf veya internetteki başlıklara bağlantı içerebilen Tweet’te, bir kullanıcının bir konu hakkında iddiada bulunmasıyla başlar. Daha sonra diğerleri, söylentiyi Retweet ederek çoğaltırlar. Bir söylentinin yayılım süreci, ortak, tekil kaynakla kırılmamış Retweet zinciri olarak sergilendiği söylenti-yayılma modelinin örnekleri olarak tanımladığımız bir veya daha çok basamağa sahip olup olmadığıyla nitelendirilebilir. Örneğin, biri içinde iddiası bulunan savı veya öyküyü Tweet atarak bir söylenti basamağını başlatabilir ve diğer kişiler, aynı öykü veya sava uygun olması dışında ilk basamaktan tamamen bağımsız, aynı söylentinin ikinci basamağını müstakilen başlatabilir. Eğer müstakil kalmaya devam ederlerse, aynı söylentinin iki basamağını temsil ederler. Basamağın büyüklüğü en az birdir (orijinal Tweet’i kimsenin Retweet etmediği anlamına gelir). Bir söylentiyi oluşturan basamakların sayısı, kullanıcı tarafından bağımsız olarak öykünün veya savın Tweet’lendiği sayıya eşittir (Retweet’lenmesine değil). Yani, Eğer “A” söylentisi birbirinden ayrı 10 kişi tarafından tweet’lenirse, her birinin boyutu bir olan 10 basamağa sahip olur. Tam tersi, ikinci bir “B” söylentisi iki kişi tarafından müstakilen tweet’lenirse ve her bir Tweet 100 kez retweet’lenirse, söylenti her birinin boyutu 100 olan, iki basamaktan oluşur.

Burada, 2006’daki başlangıcından 2017’ye kadar Twitter’da yayılan doğruluk kontrolü yapılmış söylenti basamaklarının kapsamlı veri kümelerini kullanarak, doğru, yanlış ve karma (yarı doğru, yarı yanlış) haber öykülerinin farklı yayılımlarını inceliyoruz. Veri, yaklaşık 3 milyon kişi tarafından 4,5 milyon kereden fazla yayılan yaklaşık 126 bin söylenti basamağını içermekte. Sitelerinde incelemeleri yayınlanan her bir söylentinin başlık, gövde ve doğruluğunu (doğru, yanlış, karma) ayrıştıran ve otomatik olarak Twitter’daki benzer basamakları toplayan, 6 bağımsız teyit organizasyonu tarafından incelenmiş tüm söylenti basamaklarını örnekledik (snopes.com, politifact.com, factcheck.org, truthorfiction.com, hoax-slayer.com, ve urbanlegends.about.com). Sonuç, geçerliliğine bu organizasyonlar tarafından %95-98 oranında hemfikir olunan söylenti basamakları örneklemleri oldu. 2006’dan 2017’ye kadar bahsi geçen sitelerin herhangi birine bağlantı içeren tweet’lere, tüm İngilizce cevapları toplayarak söylenti basamaklarının yayılımını katalogladık ve gereklilik halinde resimlerden metinleri alabilmek için, optik karakter tanımlamayı kullandık. Her bir cevap Tweet’inde, cevaplanan orijinal Tweet’i ve orijinal Tweet’in tüm retweet’lerini çıkarttık. Twitter’da yayılan bir söylentiyi temsil eden her bir Retweet basamağı, teyit organizasyonları tarafından doğru veya yanlış olarak onaylanmıştır. Daha sonra basamakların derinliğini, boyutunu, azami genişliğini ve yapısal viralliğini (23) ölçtük.

Bir söylenti retweet’lendiğinde, basamağın derinlik, boyut, azami genişlik ve yapısal viralliği artar (Şekil 1A). Yanlış söylentilerin daha büyük kısmı, 1 ve 1000 basamakları arasında gerçekleşirken, doğru söylentilerin daha büyük kısmı, 1000 basamaktan fazla gerçekleşmiştir (Şekil 1B); Aynı zamanda bu durum, politik söylentiler için de geçerlidir (Şekil 1D). Yanış söylentilerin toplamı, 2013 ve 2015’in sonlarında ve tekrar 2016’nın sonunda, Birleşik Devletler’deki başkanlık seçimiyle uyumlu biçimde zirve yapmıştır (Şekil 1C). Veri aynı zamanda, 2012 ve 2016 Birleşik Devletler başkanlık seçimleri sürecinde yanlış siyasi söylentilerin toplam sayısındaki açık artışı (Şekil 1E) ve 2014’de Rusya’nın Kırım’ı ilhakı esnasındaki yarı doğru yarı yanlış malumatı içeren söylentilerdeki ani artışı göstermekte (Şekil 1E). Siyaset, verilerimizde yaklaşık 45 bin en geniş söylenti basamağıyken, onu şehir efsaneleri, iş, terörizm, bilim, eğlence ve doğal afetler izlemekte (Şekil 1F).
Doğru ve yanlış söylentilerin yayılımını incelediğimizde, tüm malumat kategorilerinde yalanın doğrudan önemli ölçüde daha uzak, daha derin ve daha geniş biçimde yayıldığını gördük. Yanlış basamaklarının, doğru basamaklarından bariz daha büyük kısmı 10 derinliğine ulaşmış ve yanlış basamaklarının üst % 0.01’i Twitter Dünyasında, kaynak tweet’ten 19 sekme daha derine yayılan doğrudan 8 sekme daha derine yayıldığı görülmüştür (Şekil 2A). Aynı zamanda yalan, doğrudan daha çok kişiye ulaşmış. Doğru, nadiren 1000’den fazla kişiye dağılırken, yanlış haber basamaklarının üst %1’i her zaman 1000 ile 100,000 kişiye dağılmakta (Şekil 2B). Yalan, basamağın her derinliğinde doğrudan daha çok kişiye ulaşmıştır, bunu anlamıysa kişilerin doğrudan oldukça fazla sayıda yalanı Retweet etmesi demektir (Şekil 2C). Yalanın yayılımı viralliğinden yardım almış, yani yalan basit biçimde yayın dinamikleriyle değil, viral dallanma süreciyle nitelenmiş uçtan-uca yayılım aracılığıyla yayılmıştır (Şekil 2D).


Şekil 1


Doğrunun, yalanın ulaştığı 1500 kişiye ulaşması 6 kat uzun (Şekil 2F) ve yalanın ulaştığı 10 basamak derinliğine ulaşması 20 kat uzun sürmüştür (Şekil 2E). Doğru 10 derinliğinin ötesine asla erişemezken, yalanın 19 derinliğine ulaşmasının neredeyse doğrunun 10 derinliğine ulaşmasından 10 kat hızlı gerçekleştiğini gördük (Şekil 2E). Aynı zamanda, yalan bariz olarak daha geniş alana yayılmış (Şekil 2H) ve her basamak derinliğinde doğrudan daha fazla tekil kullanıcı retweet’lenmiş (Şekil 2G).

Şekil 2


Yanlış politik haberler (Şekil 1D), daha derine (Şekil 3A), daha geniş alana (Şekil 3C) ve daha çok insana (Şekil 3B) ulaşmış ve herhangi başka yanlış malumat kategorisinden daha viral olmuştur(Şekil 3D). Bununla beraber, yanlış siyasi haberler, daha derine daha hızlı yayılmıştır (Şekil 3E) ve 10.000 insana ulaşan tüm diğer yanlış haberlerden, neredeyse 3 kat hızlı biçimde 20.000 ‘den fazla kişiye ulaşmıştır (Şekil 3F). Yanlış haberlerin diğer kategorileri 1 ve 10 arasındaki derinlikte benzer sayıdaki tekil kullanıcıya ulaşmasına karşın, yanlış politik haberler her zaman 10’dan daha büyük derinliklerdeki en tekil kullanıcıya ulaşmıştır (Şekil 3G). Yanlış haberlerin diğer tüm kategorileri daha sığ derinliklerde kısmen daha geniş alanda gezinse de, yanış politik haberler daha büyük derinliklerde daha geniş alanlara ulaşmakta, bu da daha popüler yanlış politik haber öğelerinin daha yaygın ve daha hızlandırılmış yayılma dinamikleri sergilediğini belirtmektedir (Şekil 3H). Tüm haber kategorilerinin incelemesi göstermiştir ki siyaset, şehir efsaneleri ve bilim haberleri çoğu insana yayılırken, en hızlı yayılanlar ve yapısal viralliklerinin koşullarına göre en viral olanlar siyaset ve şehir efsaneleridir.

Şekil 3

Ağın yapısal unsurları veya kullanıcıların şahsi karakterlerinin basamaklara karışmasının, yanlışlığın niçin doğrudan daha büyük süratle izlediğini açıklamasından şüphe duyulabilir. Belki, yanlışlığı yayan kişiler daha çok kişiyi “takip” eden, daha çok takipçiye sahip, daha sık Tweet atan, çoğunlukla “onaylanmış” kullanıcılar veya daha uzun süredir Twitter’da olanlardır. Fakat doğru ve yanlış söylentilere dâhil olan kullanıcıları karşılaştırdığımızda, her durumda bu durumun tam tersini bulduk. Yalan haberleri yayan kullanıcılar açıkça daha az takipçiye sahip, daha az kişi tarafından takip edilen, Twitter’da daha az aktif olan, daha nadir onaylı ve Twitter’da daha kısa süredir bulunanlardı (Şekil 4A). Yalanın daha uzağa, daha hızlı yayılması bu farklılıklara rağmen gerçekleşiyor,  bunlar sebebiyle değil.

Şekil 4

Olası Retweet’leme modelini kurduğumuzda, yalanın doğrudan %70 daha fazla retweet’lendiğini bulduk, hatta hesap yaşı, aktiflik seviyesi, takipçi sayısı ve takip edilenleri kontrol etmemize rağmen (Şekil 4B). Çünkü kullanıcı niteliği ve ağ yapısı doğruluk ve yanlışlığın yayılım farklılığını açıklayamadı, biz de yayılma dinamiklerindeki farklılığı anlamak için alternatif açıklamalardan yararlandık.

Bir alternatif açıklama, malumat teorisi ve Bayesian karar teorisinden ortaya çıkıyor. Tuhaflık, insan ilgisini çekiyor (24), üretken karar almasına katkı sağıyor (25) ve malumat paylaşmaya teşvik ediyor (26) çünkü tuhaflık dünya algımızı güncelliyor. Malumat tuhaf olduğunda, sadece şaşırtıcı değil, fakat aynı zamanda daha değerli, hem malumat teorisi açısından hem de sosyal bakış açısından. Bu yüzden, yanlışlığın doğrudan daha tuhaf olup olmadığını ve Twitter kullanıcılarının daha tuhaf malumatı daha çok Retweet etmeye eğilimli olup olmadıklarını test ettik.

Tuhaflığı ölçmek için doğru ve yanlış söylentiler yayan, gelişi güzel yaklaşık 5 bin kullanıcı seçtik ve rastgele örneğini çıkarttığımız yaklaşık 25 bin tweet’in, bir söylenti retweet’lemeye karar vermelerinden önce 60 gün maruziyetine bıraktık. Daha sonra, söylenti tweet’leri ve kullanıcıların söylenti tweet’lerini retweet’lemeden önce maruz kalacakları tüm öncelikli tweet’lerin arasındaki malumat mesafesini hesaplamak için 200 konu ve 10 milyon İngilizce tweet’le çalıştırdığımız Latent Dirichlet Allocation Topic modeli belirledik (27). Bu da veri kümemizde, her bir Tweet için 200’ün üzerinde dağıtım ihtimalini ortaya çıkardı. Ardından, doğru ve yanlış söylentilerdeki malumatın tuhaflığını, tweet’lerin konu dağılımlarıyla söylenti tweet’lerinin konu dağılımlarını karşılaştırarak ölçtük. Bulduğumuza göre, yanlış söylentiler açıkça tüm tuhaflık ölçümleri arasında doğrudan daha tuhaf duruyor, daha yüksek teklik gösteriyor (28)…

Yanlış söylentilerin doğrulardan ölçülebilir şekilde daha tuhaf olmasına karşın, kullanıcılar bu şekilde algılamamış olabilirler. Bu sebeple, doğru ve yanlış söylentilere verilen cevapların hissi içeriğinin karşılaştırmasıyla, doğru ve yanlış söylentilerdeki malumat içeriğinin kullanıcı algısını hesapladık. Yaklaşık 140 bin İngilizce kelimenin kapsamlı listesini ve bunların Plutchik’in (31) temel his çalışması üzerine temellenen sekiz hisle (öfke, korku, beklenti, güven, şaşkınlık, üzüntü, neşe ve iğrenme(32)) bağlantısını sunan National Research Council Canada tarafından düzenlenen önde gelen sözlüğü ve 32 bin Twitter etiketini içeren bir listeyi ve benzer hislerin onlarla bağının tesirini kullanarak cevaplardaki duyguları kategorize ettik (33). Gereksiz kelimeleri ve URL’leri cevap tweet’lerinden çıkarttık ve her bir sekiz hisle bağlantılı olan,  her bir cevaba etki eden hisler içinde birinde toplanan hissin vektörünü yaratan tweet’lerdeki kelime kısımlarını hesapladık. Bulduğumuza göre, yanlış söylentiler büyük şaşkınlık içeren cevaplar yaratıp, tuhaflık hipotezini doğrulayıp ve büyük iğrenme oluştururken, doğruluk büyük üzüntü, beklenti, neşe ve güven hislerini doğurmuş (Şekil 4D ve F). Yalana cevaplarda gösterilen duygular, insanları yanlış haberleri paylaşmaya iten şeyin tuhaflığın ötesindeki ek etkenlerini aydınlatabilir. Tüm bunlara karşın, tuhaflığın retweet’lere neden olduğu veya tuhaflığın yanlış haberlerin daha sık paylaşılmasındaki tek sebep olduğunu iddia edemeyiz, bulduğumuz şu ki yanlış haberler daha çok tuhaf olanlar ve bu tuhaf malumat daha çok Retweet alıyor.

Sayısız tanılayıcı istatistik ve manipülasyon kontrolleri sonuçlarımızı geçerli kılarak, sağlamlıklarını onayladı. İlk olarak…

İkinci olarak, 6 organizasyona bağlı kalarak teyit ettiğimiz Tweet örneklerimizin kısıtlılığı seçim yanlılığının doğmasına neden olabilir. Teyit, söylentilerin belirli tiplerini seçebilir veya onlara fazladan ilgi çekebilir. Analizimizin sağlamlığını geçerli kılmak ve tüm doğru ve yanlış söylenti basamaklarının sonuçlarının genellenebilirliği için, herhangi bir organizasyon tarafından onaylanmayan söylenti basamağının ikinci bir örneğini müstakilen onaylattık. Bu söylentiler, Massachusettes Institute of Technology (MIT) ve Wellesley Collage’daki 3 öğrenci tarafından teyit edildi. Söylentileri tespit ve incelemeleri için öğrencileri, 2016’dan beri 3 milyon İngilizce Tweet üzerinde çalışan otomatik söylenti-tespit algoritmamızla eğittik (34). Öğrenci yorumcular, internet üzerinde yer alan basit arama sorgularını kullanarak tespit edilen söylentilerin geçerliliklerini incelediler. İncelemelerin temeli olarak, söylentileri doğru, yanlış ve karma olarak etiketlemelerini ve daha önce teyit organizasyonlarınca incelenenleri ayırmalarını istedik. Bağımsız çalışan ve birbirlerinden haberleri olmayan yorumcular 13,240 söylenti basamağının %90’ının geçerliliğinde hemfikir oldular…

Üçüncü olarak, yanlışlık ve doğruluğun farklı yayılmasının robot veya botların faaliyetiyle olup olmadığının ilginçliğine karşın, kişiler insana dair kanımız hakkındaki sonuçlarımızın analizimizdeki botların mevcudiyetiyle etkilenmiş olabileceği hakkında endişeye düşebilirler. Bu sebeple, analizimizi çalıştırmadan önce tüm botları tanımlayarak kaldıracak karmaşık bir bot-tespit algoritması kullandık. Analizimize bot trafiğini geri yüklediğimizde, esas sonuçlarımızdan hiç birinin değişmediğini gördük. Botlar tarafından başlatılan tüm Tweet basamaklarını, orijinal bot tweet’inin insan retweet’lerini de içerecek biçimde kaldırdığımızda da sonuç aynı kalmayı sürdürdü ve ikinci bir bağımsız bot-tespit algoritması kullandığımızda da sonuç değişmedi. Botların mevcudiyeti, analizlerimizde kullandığımız son model bot-tespit algoritmaları tarafından hesap edilerek, hem doğru hem yanlış söylentilerin yayılım hızını neredeyse eşit biçimde etkilemiştir. Bu da gösteriyor ki, yanlış haberler robotlar yüzünden değil, insanlar yüzünden daha hızlı, uzak ve derine yayılmaktalar.

Son olarak, doğru ve yanlış haberlerin yayılmasındaki farklılığın davranışsal açıklaması hakkında daha çok araştırmaya ihtiyaç olduğu ortadadır. Özellikle, internette doğru ve yanlış haberlerin yayılmasına neden olan insana dair etkenlerin daha güçlü tanımlanması, kullanıcılarla röportaj, anket, laboratuvar deneyi ve hatta beyin görüntüleme araçlarıyla daha doğrudan ilişkiyi gerektiriyor.

Yanlış haberler, terör saldırısı ve doğal afetlerde kaynakların yanlış yönlendirilmesine, iş yatırımlarının yanlış yapılmasına ve seçimlerin yanlış yönlendirilmesine neden olabilir. Maalesef, internetteki yanlış haberlerin miktarı açıkça artıyor (Şekil 1C ve E), yanlış haberlerin nasıl ve niçin yayıldığını bilimsel olarak anlamak şuan sadece geniş ölçekli sistematik analizlerden çok özel amaçlara yönelik yapılmakta…

Ek Materyaller

Referanslar ve Notlar

Tercüme: Utku Cem. 

Hiç yorum yok:

Yorum Gönder