Soroush Vosoughi, Deb Roy , Sinan Aral
Science 09 Mar 2018:
Vol. 359, Issue 6380, pp. 1146-1151
DOI: 10.1126/science.aap9559
Karar alma (1-3), şirket (4), iletişim (5) ve pazarın (6)
esasi teorilerinin tümü, hakikat veya hassasiyetin kavramsallaştırılmasını neredeyse
her insani uğraşın faaliyet merkezinin bir parçası olarak görüyor. Şuan, hem
doğru hem yanlış malumat internet ortamları vasıtasıyla hızla yayılıyor. Neyin
doğru, neyin yanlış olduğunun belirlenmesi ortak politik strateji haline
gelerek, hemfikir olunan olgular üzerine kurulu tartışmaların yerini aldı.
Ekonomilerimizin de yanlışlıklara bağışıklığı yok. Söylentiler borsa
fiyatlarını ve geniş ölçekli yatırımların teşviklerini etkiledi. Örneğin,
Barack Obama’nın bir patlamada yaralandığını iddia eden tweet’in ardından borsa
değeri 130 milyar dolar düşüş yaşadı(7). Aynı şekilde, afetlerden (8,9) terör
saldırılarına (10) kadar, her şeye tepkimiz internette yayılan yanlış
haberlerce altüst oldu.
Süratle malumat paylaşma ve geniş ölçekli malumat
basamaklarını kolaylaştıran yeni sosyal teknolojiler, yanlış malumatın (yani
kusurlu veya yanıltıcı) yayılmasına olanak tanıyabilir. Fakat gittikçe daha çok
malumat ve habere ulaşımımız bu yeni teknolojiyle yönlendirilmesine karşın (11)
yanlışlıkların internette yayılmasına katkılarını çok az biliyoruz. Yine de medya,
yanlış haber yayılımının sistematik olmayan analizlerine önemli ölçüde ilgi
gösterdi. Geniş ölçekte deneysel, yanlış malumatın yayılım veya sosyal
kökenlerinin incelemesi az sayıda mevcut. Yanlış malumatın yayılım çalışmaları
halen özel amaçlı, küçük örneklerin analiziyle sınırlı ve en önemli bilimsel
iki soruyu reddetmekte: Doğruluk ve yanlışlık nasıl farklı biçimde yayılmakta
ve bu farklılıkları hangi insani etkenler açıklar?
Mevcut çalışma, Higgs bozonunun keşfi (13) veya 2010’daki
Haiti depremi (14) gibi tekil ve 2013 Boston Maraton bombalanması (10) gibi tekil
felaketteki çoklu söylentilerin yayılımını inceler veya söylenti yayılımı için
teorik modeller (15), söylenti tespiti (16), itibar değerleme (17, 18) veya
söylentilerin yayılımını engelleme girişimleri (19) için yöntemler geliştirir.
Ancak neredeyse hiçbir çalışma, konular arasında doğruluk veya yanlışlığın
yayılım farklılığını kapsamlı biçimde değerlendirmez veya yanlış haberlerin
neden doğrulardan farklı olarak yayıldığını irdelemez. Örneğin, Del Vicario ve
arkadaşları (20) ve Bessi ve arkadaşları (21) bilimsel ve komplo teorisi
öykülerinin yayılımını çalıştılar, gerçekliğini değerlendirmediler. Bilimsel ve
komplo teorisi öykülerinin her ikisi de doğru veya yanış olabilir ve
yayılımları için önemli ama geçerliliklerine dikey olan biçimsel ölçülerinde farklılık
gösterirler. Yanlış haberlerin yayılımını anlamak için, doğru ve yanlış
bilimsel öykülerin ve doğru ve yanlış komplo teorisi öykülerinin ayrışmasından
ve konuyla ilgili ve biçimsel farklılıklar arasındaki kategorilerin kontrolünün
ardından yayımı incelemek gereklidir. Bugüne kadar, söylentileri doğruluğuna
göre bölümleyen tek çalışma Friggeri ve arkadaşlarının (19), Facebook’ta
yayılan yaklaşık 4000 söylentiyi inceleyen ve yanlışlığın doğruluktan farklı
olarak nasıl dağıldığından daha çok (19), doğruluk kontrolünün söylenti
yayılımına etkisinin nasıl olduğunu inceleyen çalışmadır.
Mevcut politik iklimimiz ve akademik literatürümüzde, “sahte
haber” (fake news), sosyal medya aracılığıyla Birleşik Devletler politikasında
yabancı girişimleri ve haber, sahte haber, yanlış haber, söylenti, söylenti
basamakları ve diğer ilişkili terimlerin nelerden teşkil ettiğini anlayışımız etrafında
akışkan bir terminoloji ortaya çıktı. Yine de zamanında sahte haberin, bir
haber öyküsünün doğruluğuna istinat edildiğini düşünmek uygun olmuş olabilir,
şimdi inanıyoruz ki bu ifade, mevcut politik ve medya ikliminde telafisi mümkün
olmayacak biçimde kutuplaştırılmıştır. Siyasiler, kendi konumlarını
desteklemeyen haber kaynaklarını güvenilmez veya sahte haberler,
destekleyenleriyse güvenilir veya sahte olmayan haberler diye etiketleme
siyasetini uygulayınca, sunulan malumatın asli doğruluğuyla olan tüm bağını
yitiren kavram, anlamsızlığını akademik tasnifteki kullanımla sahnelemekte. Bu
çalışma sürecinde, sahte haber kavramını kullanmaktan açıkça kaçındık ve bunun
yerine daha nesnel olan kanıtlanabilir “doğru” veya “yanlış” haber kavramlarını
kullandık.
Ayrıca, haber kavramının geniş tanımını kasten kullandık.
Bir öyküde, iddiaların kurumsal kaynak temellerini neyin oluşturduğunu
tanımlamaktan ziyade, Twitter’da haber olarak ileri sürülen herhangi savı ifade
ettik. Haberi, herhangi bir öykü veya içeriğinde iddia edilen sav ve haber
öyküsünün sosyal fenomeni olarak söylentiyi veya Twitter ağında yayılan veya
dağılan sav olarak tanımladık. Söylenti tabiatı gereği sosyaldir ve insanlar
arasında iddiaların paylaşımını içerir. Diğer yandan, paylaşılsa da
paylaşılmasa da haber, iddiası olan savdır.
Söylenti basamağı Twitter’da, yazılı metin, fotoğraf veya
internetteki başlıklara bağlantı içerebilen Tweet’te, bir kullanıcının bir konu
hakkında iddiada bulunmasıyla başlar. Daha sonra diğerleri, söylentiyi Retweet
ederek çoğaltırlar. Bir söylentinin yayılım süreci, ortak, tekil kaynakla
kırılmamış Retweet zinciri olarak sergilendiği söylenti-yayılma modelinin
örnekleri olarak tanımladığımız bir veya daha çok basamağa sahip olup
olmadığıyla nitelendirilebilir. Örneğin, biri içinde iddiası bulunan savı veya
öyküyü Tweet atarak bir söylenti basamağını başlatabilir ve diğer kişiler, aynı
öykü veya sava uygun olması dışında ilk basamaktan tamamen bağımsız, aynı
söylentinin ikinci basamağını müstakilen başlatabilir. Eğer müstakil kalmaya
devam ederlerse, aynı söylentinin iki basamağını temsil ederler. Basamağın
büyüklüğü en az birdir (orijinal Tweet’i kimsenin Retweet etmediği anlamına
gelir). Bir söylentiyi oluşturan basamakların sayısı, kullanıcı tarafından
bağımsız olarak öykünün veya savın Tweet’lendiği sayıya eşittir
(Retweet’lenmesine değil). Yani, Eğer “A” söylentisi birbirinden ayrı 10 kişi
tarafından tweet’lenirse, her birinin boyutu bir olan 10 basamağa sahip olur.
Tam tersi, ikinci bir “B” söylentisi iki kişi tarafından müstakilen
tweet’lenirse ve her bir Tweet 100 kez retweet’lenirse, söylenti her birinin
boyutu 100 olan, iki basamaktan oluşur.
Burada, 2006’daki başlangıcından 2017’ye kadar Twitter’da
yayılan doğruluk kontrolü yapılmış söylenti basamaklarının kapsamlı veri
kümelerini kullanarak, doğru, yanlış ve karma (yarı doğru, yarı yanlış) haber
öykülerinin farklı yayılımlarını inceliyoruz. Veri, yaklaşık 3 milyon kişi
tarafından 4,5 milyon kereden fazla yayılan yaklaşık 126 bin söylenti
basamağını içermekte. Sitelerinde incelemeleri yayınlanan her bir söylentinin
başlık, gövde ve doğruluğunu (doğru, yanlış, karma) ayrıştıran ve otomatik
olarak Twitter’daki benzer basamakları toplayan, 6 bağımsız teyit organizasyonu
tarafından incelenmiş tüm söylenti basamaklarını örnekledik (snopes.com,
politifact.com, factcheck.org, truthorfiction.com, hoax-slayer.com, ve
urbanlegends.about.com). Sonuç, geçerliliğine bu organizasyonlar tarafından
%95-98 oranında hemfikir olunan söylenti basamakları örneklemleri oldu. 2006’dan
2017’ye kadar bahsi geçen sitelerin herhangi birine bağlantı içeren tweet’lere,
tüm İngilizce cevapları toplayarak söylenti basamaklarının yayılımını
katalogladık ve gereklilik halinde resimlerden metinleri alabilmek için, optik
karakter tanımlamayı kullandık. Her bir cevap Tweet’inde, cevaplanan orijinal Tweet’i
ve orijinal Tweet’in tüm retweet’lerini çıkarttık. Twitter’da yayılan bir
söylentiyi temsil eden her bir Retweet basamağı, teyit organizasyonları
tarafından doğru veya yanlış olarak onaylanmıştır. Daha sonra basamakların
derinliğini, boyutunu, azami genişliğini ve yapısal viralliğini (23) ölçtük.
Bir söylenti retweet’lendiğinde, basamağın derinlik, boyut,
azami genişlik ve yapısal viralliği artar (Şekil 1A). Yanlış söylentilerin daha
büyük kısmı, 1 ve 1000 basamakları arasında gerçekleşirken, doğru söylentilerin
daha büyük kısmı, 1000 basamaktan fazla gerçekleşmiştir (Şekil 1B); Aynı
zamanda bu durum, politik söylentiler için de geçerlidir (Şekil 1D). Yanış
söylentilerin toplamı, 2013 ve 2015’in sonlarında ve tekrar 2016’nın sonunda,
Birleşik Devletler’deki başkanlık seçimiyle uyumlu biçimde zirve yapmıştır
(Şekil 1C). Veri aynı zamanda, 2012 ve 2016 Birleşik Devletler başkanlık
seçimleri sürecinde yanlış siyasi söylentilerin toplam sayısındaki açık artışı
(Şekil 1E) ve 2014’de Rusya’nın Kırım’ı ilhakı esnasındaki yarı doğru yarı
yanlış malumatı içeren söylentilerdeki ani artışı göstermekte (Şekil 1E).
Siyaset, verilerimizde yaklaşık 45 bin en geniş söylenti basamağıyken, onu
şehir efsaneleri, iş, terörizm, bilim, eğlence ve doğal afetler izlemekte
(Şekil 1F).
Doğru ve yanlış söylentilerin yayılımını incelediğimizde,
tüm malumat kategorilerinde yalanın doğrudan önemli ölçüde daha uzak, daha
derin ve daha geniş biçimde yayıldığını gördük. Yanlış basamaklarının, doğru
basamaklarından bariz daha büyük kısmı 10 derinliğine ulaşmış ve yanlış
basamaklarının üst % 0.01’i Twitter Dünyasında, kaynak tweet’ten 19 sekme daha
derine yayılan doğrudan 8 sekme daha derine yayıldığı görülmüştür (Şekil 2A).
Aynı zamanda yalan, doğrudan daha çok kişiye ulaşmış. Doğru, nadiren 1000’den
fazla kişiye dağılırken, yanlış haber basamaklarının üst %1’i her zaman 1000
ile 100,000 kişiye dağılmakta (Şekil 2B). Yalan, basamağın her derinliğinde
doğrudan daha çok kişiye ulaşmıştır, bunu anlamıysa kişilerin doğrudan oldukça
fazla sayıda yalanı Retweet etmesi demektir (Şekil 2C). Yalanın yayılımı
viralliğinden yardım almış, yani yalan basit biçimde yayın dinamikleriyle
değil, viral dallanma süreciyle nitelenmiş uçtan-uca yayılım aracılığıyla
yayılmıştır (Şekil 2D).
Şekil 1 |
Doğrunun, yalanın ulaştığı 1500 kişiye ulaşması 6 kat uzun
(Şekil 2F) ve yalanın ulaştığı 10 basamak derinliğine ulaşması 20 kat uzun
sürmüştür (Şekil 2E). Doğru 10 derinliğinin ötesine asla erişemezken, yalanın
19 derinliğine ulaşmasının neredeyse doğrunun 10 derinliğine ulaşmasından 10
kat hızlı gerçekleştiğini gördük (Şekil 2E). Aynı zamanda, yalan bariz olarak
daha geniş alana yayılmış (Şekil 2H) ve her basamak derinliğinde doğrudan daha
fazla tekil kullanıcı retweet’lenmiş (Şekil 2G).
Şekil 2 |
Yanlış politik haberler (Şekil 1D), daha derine (Şekil 3A),
daha geniş alana (Şekil 3C) ve daha çok insana (Şekil 3B) ulaşmış ve herhangi
başka yanlış malumat kategorisinden daha viral olmuştur(Şekil 3D). Bununla
beraber, yanlış siyasi haberler, daha derine daha hızlı yayılmıştır (Şekil 3E)
ve 10.000 insana ulaşan tüm diğer yanlış haberlerden, neredeyse 3 kat hızlı
biçimde 20.000 ‘den fazla kişiye ulaşmıştır (Şekil 3F). Yanlış haberlerin diğer
kategorileri 1 ve 10 arasındaki derinlikte benzer sayıdaki tekil kullanıcıya
ulaşmasına karşın, yanlış politik haberler her zaman 10’dan daha büyük
derinliklerdeki en tekil kullanıcıya ulaşmıştır (Şekil 3G). Yanlış haberlerin
diğer tüm kategorileri daha sığ derinliklerde kısmen daha geniş alanda gezinse
de, yanış politik haberler daha büyük derinliklerde daha geniş alanlara
ulaşmakta, bu da daha popüler yanlış politik haber öğelerinin daha yaygın ve
daha hızlandırılmış yayılma dinamikleri sergilediğini belirtmektedir (Şekil
3H). Tüm haber kategorilerinin incelemesi göstermiştir ki siyaset, şehir
efsaneleri ve bilim haberleri çoğu insana yayılırken, en hızlı yayılanlar ve
yapısal viralliklerinin koşullarına göre en viral olanlar siyaset ve şehir
efsaneleridir.
Şekil 3 |
Ağın yapısal unsurları veya kullanıcıların şahsi
karakterlerinin basamaklara karışmasının, yanlışlığın niçin doğrudan daha büyük
süratle izlediğini açıklamasından şüphe duyulabilir. Belki, yanlışlığı yayan
kişiler daha çok kişiyi “takip” eden, daha çok takipçiye sahip, daha sık Tweet
atan, çoğunlukla “onaylanmış” kullanıcılar veya daha uzun süredir Twitter’da
olanlardır. Fakat doğru ve yanlış söylentilere dâhil olan kullanıcıları
karşılaştırdığımızda, her durumda bu durumun tam tersini bulduk. Yalan
haberleri yayan kullanıcılar açıkça daha az takipçiye sahip, daha az kişi
tarafından takip edilen, Twitter’da daha az aktif olan, daha nadir onaylı ve
Twitter’da daha kısa süredir bulunanlardı (Şekil 4A). Yalanın daha uzağa, daha
hızlı yayılması bu farklılıklara rağmen gerçekleşiyor, bunlar sebebiyle değil.
Şekil 4 |
Olası Retweet’leme modelini kurduğumuzda, yalanın doğrudan
%70 daha fazla retweet’lendiğini bulduk, hatta hesap yaşı, aktiflik seviyesi,
takipçi sayısı ve takip edilenleri kontrol etmemize rağmen (Şekil 4B). Çünkü
kullanıcı niteliği ve ağ yapısı doğruluk ve yanlışlığın yayılım farklılığını
açıklayamadı, biz de yayılma dinamiklerindeki farklılığı anlamak için
alternatif açıklamalardan yararlandık.
Bir alternatif açıklama, malumat teorisi ve Bayesian karar
teorisinden ortaya çıkıyor. Tuhaflık, insan ilgisini çekiyor (24), üretken
karar almasına katkı sağıyor (25) ve malumat paylaşmaya teşvik ediyor (26)
çünkü tuhaflık dünya algımızı güncelliyor. Malumat tuhaf olduğunda, sadece
şaşırtıcı değil, fakat aynı zamanda daha değerli, hem malumat teorisi açısından
hem de sosyal bakış açısından. Bu yüzden, yanlışlığın doğrudan daha tuhaf olup
olmadığını ve Twitter kullanıcılarının daha tuhaf malumatı daha çok Retweet
etmeye eğilimli olup olmadıklarını test ettik.
Tuhaflığı ölçmek için doğru ve yanlış söylentiler yayan,
gelişi güzel yaklaşık 5 bin kullanıcı seçtik ve rastgele örneğini çıkarttığımız
yaklaşık 25 bin tweet’in, bir söylenti retweet’lemeye karar vermelerinden önce
60 gün maruziyetine bıraktık. Daha sonra, söylenti tweet’leri ve kullanıcıların
söylenti tweet’lerini retweet’lemeden önce maruz kalacakları tüm öncelikli
tweet’lerin arasındaki malumat mesafesini hesaplamak için 200 konu ve 10 milyon
İngilizce tweet’le çalıştırdığımız Latent Dirichlet Allocation Topic modeli
belirledik (27). Bu da veri kümemizde, her bir Tweet için 200’ün üzerinde
dağıtım ihtimalini ortaya çıkardı. Ardından, doğru ve yanlış söylentilerdeki
malumatın tuhaflığını, tweet’lerin konu dağılımlarıyla söylenti tweet’lerinin
konu dağılımlarını karşılaştırarak ölçtük. Bulduğumuza göre, yanlış söylentiler
açıkça tüm tuhaflık ölçümleri arasında doğrudan daha tuhaf duruyor, daha yüksek
teklik gösteriyor (28)…
Yanlış söylentilerin doğrulardan ölçülebilir şekilde daha
tuhaf olmasına karşın, kullanıcılar bu şekilde algılamamış olabilirler. Bu
sebeple, doğru ve yanlış söylentilere verilen cevapların hissi içeriğinin
karşılaştırmasıyla, doğru ve yanlış söylentilerdeki malumat içeriğinin kullanıcı
algısını hesapladık. Yaklaşık 140 bin İngilizce kelimenin kapsamlı listesini ve
bunların Plutchik’in (31) temel his çalışması üzerine temellenen sekiz hisle
(öfke, korku, beklenti, güven, şaşkınlık, üzüntü, neşe ve iğrenme(32))
bağlantısını sunan National Research Council Canada tarafından düzenlenen önde
gelen sözlüğü ve 32 bin Twitter etiketini içeren bir listeyi ve benzer hislerin
onlarla bağının tesirini kullanarak cevaplardaki duyguları kategorize ettik
(33). Gereksiz kelimeleri ve URL’leri cevap tweet’lerinden çıkarttık ve her bir
sekiz hisle bağlantılı olan, her bir
cevaba etki eden hisler içinde birinde toplanan hissin vektörünü yaratan tweet’lerdeki
kelime kısımlarını hesapladık. Bulduğumuza göre, yanlış söylentiler büyük
şaşkınlık içeren cevaplar yaratıp, tuhaflık hipotezini doğrulayıp ve büyük
iğrenme oluştururken, doğruluk büyük üzüntü, beklenti, neşe ve güven hislerini
doğurmuş (Şekil 4D ve F). Yalana cevaplarda gösterilen duygular, insanları
yanlış haberleri paylaşmaya iten şeyin tuhaflığın ötesindeki ek etkenlerini
aydınlatabilir. Tüm bunlara karşın, tuhaflığın retweet’lere neden olduğu veya
tuhaflığın yanlış haberlerin daha sık paylaşılmasındaki tek sebep olduğunu
iddia edemeyiz, bulduğumuz şu ki yanlış haberler daha çok tuhaf olanlar ve bu tuhaf
malumat daha çok Retweet alıyor.
Sayısız tanılayıcı istatistik ve manipülasyon kontrolleri
sonuçlarımızı geçerli kılarak, sağlamlıklarını onayladı. İlk olarak…
İkinci olarak, 6 organizasyona bağlı kalarak teyit ettiğimiz
Tweet örneklerimizin kısıtlılığı seçim yanlılığının doğmasına neden olabilir.
Teyit, söylentilerin belirli tiplerini seçebilir veya onlara fazladan ilgi
çekebilir. Analizimizin sağlamlığını geçerli kılmak ve tüm doğru ve yanlış
söylenti basamaklarının sonuçlarının genellenebilirliği için, herhangi bir
organizasyon tarafından onaylanmayan söylenti basamağının ikinci bir örneğini
müstakilen onaylattık. Bu söylentiler, Massachusettes Institute of Technology
(MIT) ve Wellesley Collage’daki 3 öğrenci tarafından teyit edildi. Söylentileri
tespit ve incelemeleri için öğrencileri, 2016’dan beri 3 milyon İngilizce Tweet
üzerinde çalışan otomatik söylenti-tespit algoritmamızla eğittik (34). Öğrenci
yorumcular, internet üzerinde yer alan basit arama sorgularını kullanarak
tespit edilen söylentilerin geçerliliklerini incelediler. İncelemelerin temeli
olarak, söylentileri doğru, yanlış ve karma olarak etiketlemelerini ve daha
önce teyit organizasyonlarınca incelenenleri ayırmalarını istedik. Bağımsız
çalışan ve birbirlerinden haberleri olmayan yorumcular 13,240 söylenti
basamağının %90’ının geçerliliğinde hemfikir oldular…
Üçüncü olarak, yanlışlık ve doğruluğun farklı yayılmasının
robot veya botların faaliyetiyle olup olmadığının ilginçliğine karşın, kişiler
insana dair kanımız hakkındaki sonuçlarımızın analizimizdeki botların
mevcudiyetiyle etkilenmiş olabileceği hakkında endişeye düşebilirler. Bu
sebeple, analizimizi çalıştırmadan önce tüm botları tanımlayarak kaldıracak
karmaşık bir bot-tespit algoritması kullandık. Analizimize bot trafiğini geri
yüklediğimizde, esas sonuçlarımızdan hiç birinin değişmediğini gördük. Botlar
tarafından başlatılan tüm Tweet basamaklarını, orijinal bot tweet’inin insan
retweet’lerini de içerecek biçimde kaldırdığımızda da sonuç aynı kalmayı
sürdürdü ve ikinci bir bağımsız bot-tespit algoritması kullandığımızda da sonuç
değişmedi. Botların mevcudiyeti, analizlerimizde kullandığımız son model
bot-tespit algoritmaları tarafından hesap edilerek, hem doğru hem yanlış
söylentilerin yayılım hızını neredeyse eşit biçimde etkilemiştir. Bu da
gösteriyor ki, yanlış haberler robotlar yüzünden değil, insanlar yüzünden daha
hızlı, uzak ve derine yayılmaktalar.
Son olarak, doğru ve yanlış haberlerin yayılmasındaki
farklılığın davranışsal açıklaması hakkında daha çok araştırmaya ihtiyaç olduğu
ortadadır. Özellikle, internette doğru ve yanlış haberlerin yayılmasına neden
olan insana dair etkenlerin daha güçlü tanımlanması, kullanıcılarla röportaj,
anket, laboratuvar deneyi ve hatta beyin görüntüleme araçlarıyla daha doğrudan
ilişkiyi gerektiriyor.
Yanlış haberler, terör saldırısı ve doğal afetlerde
kaynakların yanlış yönlendirilmesine, iş yatırımlarının yanlış yapılmasına ve
seçimlerin yanlış yönlendirilmesine neden olabilir. Maalesef, internetteki
yanlış haberlerin miktarı açıkça artıyor (Şekil 1C ve E), yanlış haberlerin
nasıl ve niçin yayıldığını bilimsel olarak anlamak şuan sadece geniş ölçekli
sistematik analizlerden çok özel amaçlara yönelik yapılmakta…
Ek Materyaller
Referanslar ve Notlar
Hiç yorum yok:
Yorum Gönder