Yapay zeka dünyadaki bilgi akışını yönlendirmeye henüz başlamış durumda. Bundan çeşitli sektörlerde faaliyet gösteren birçok yer giderek yapay zekanın ‘nimetlerinden’ faydalanıyor. Yapay zekanın ortaya çıkışı onlarca yıl öncesine dayansa da bugün öğrenme, akıl yürütme ve uyum sağlama becerileriyle donatılmış akıllı makinelerin büyük önem taşıdığı konusunda açık bir fikir birliği var. Bu yetenekler sayesinde yapay zeka yöntemleri giderek daha karmaşık hale gelen hesaplama görevlerini çözmeyi öğreniyor. Diğer yandan benzeri görülmemiş performans seviyelerine ulaşarak toplumun gelecekteki gelişimi için kritik bir işleve bürünüyor.
Yapay zeka araçları deneyimleri kişiselleştirmek için bireysel davranışlardan, tercihlerden, inançlardan ve ilgi alanlarından yararlanacak şekilde eğitiliyor ve bu araçlar çeşitli faaliyetlerin etkinliğini otomatikleştirmek ve geliştirmek için farklı endüstrilerce kullanılıyor. Aynı zamanda yapay zeka algoritmaları, bireyler ve toplum üzerinde geniş kapsamlı etkileri olan kararlar almak için işletmeler, hükümetler ve diğer kuruluşlar tarafından da yaygın olarak kullanılıyor.
Diğer taraftan yapay zeka sosyal medya platformlarına da sirayet ediyor. Bu noktada sosyal medya, “insanların birbirleriyle etkileşime girdiği bir platform” olma şeklindeki geleneksel rolünden kısmen uzaklaştı. Günümüzde birçok şirket ve kuruluş sosyal medyayı e-ticaret, müşteri hizmetleri, pazarlama, halkla ilişkiler ve daha fazlası için kullanıyor. Dolayısıyla, yapay zekanın sosyal medya şirketlerindeki rolü de oldukça fazla. Yapay zeka sosyal medyadaki metin analizi, nefret söylemi ve cinsiyet önyargıları tespiti, veri toplama ve gerçek zamanlı sosyal medya analizi gibi birçok konuda neredeyse temel belirleyici statüsünde.
Günümüzde tüketiciler Facebook, Twitter, LinkedIn ve Instagram gibi platformlarla sürekli etkileşim halindedirler. Hal böyle olunca yapay zekanın yardımıyla sosyal medyadaki faaliyetlerinize ilişkin veriler sürekli olarak derleniyor ve analiz ediliyor. Mevzubahis platform ve şirketler büyük veri (big data) analiz araçlarıyla birlikte kullanıcıların sosyal davranışlarını ölçüyor ve eğilimleri türetiyor. Böylece yapay zekanın sosyal medyadaki belirleyici etkisi teknolojinin ticariliğini daha da görünür kılıyor.
Tüm bu süreç şöyle şekilleniyor: Makineler önce doğal dili işliyor, işledikten sonra öğreniyor ve ardından belli bir planlama yapıyor; bu sayede yeni görevlerin akıllı sistemler tarafından gerçekleştirilmesi de mümkün hale geliyor. Bu süreç sosyal ağların işleyişinin temel bir bileşimi haline geldi. Temel amaçsa insanın bilişsel işlevini taklit etmek ve bir insan tarafından yerine getirilen etkinlikleri tekrar gerçekleştirmektir. Kişisel asistanlar, otomatikleştirilmiş toplu taşıma, havacılık, bilgisayar oyunları, pasaport kontrolünde yüz tanıma, sanal asistanlarda ses tanıma, sürücüsüz arabalar, refakatçi robotlar da bunun en açık göstergesi.
Tüm bu pozitif gelişmelerin elbette bir bedeli olacak. Bu teknolojilerin tasarımında ve kullanımında geleneksel algının aşırı temsili, nefret söylemi ve cinsiyet eşitliği gibi konularda onlarca yıldır kaydedilen ilerlemeleri sessizce geri alabilir. Son zamanlarda yapılan bazı çalışmalar, öğrenilmiş algoritmalardaki önyargıları ortadan kaldırmaya çalışıyor. Buna karşın cinsiyet ideolojisinin dile nasıl tahakküm ettiğine dair yıllardır yapılan araştırmalar da büyük ölçüde görmezden geliniyor.
Galatasaray Üniversitesi Bilgisayar Mühendisliği Bölümü’nde öğretim üyesi olan Dr. Uzay Çetin ile bu gelişmeler ışığında yapay zeka, doğal dil işleme yöntemlerini, sosyal medya analizini, yapay zekadaki cinsiyet ön yargılarını ve big datayı konuştuk.
“Erken müdahale fayda sağlar”
Gerçek zamanlı sosyal medya analizi nasıl bir fayda sağlıyor?
Gerçek zamanlı sosyal medya analizi genel anlamda şirketlerin o kadar da çok farkında olduğu ve istediği bir şey değil. Ama bunun fark edilmeyen bazı avantajları var ve bu avantajları biraz kaçırıyorlar. Mesela sosyal linç başladığı anda gerçek zamanlı bir analiz ile erken müdahale yapılabiliyorsa süreci yönetmek çok daha kolay olabilir. Dolayısıyla sosyal medya analizinin gerçek zamanlı olması, sosyal linç girişimlerinin erken müdahale ile önlenmesi konusunda fayda sağlayacaktır. Fakat burayı biraz atlıyorlar ve çok önemli değilmiş gibi görüyorlar.
Mesela, siyasi bir lider tartışma programına katıldı ve televizyonda konuşuyor. O sırada da söylememesi gereken bir şeyi canlı yayın kazası olarak söyledi ve belki söylediğinin farkında bile değil. Dili sürçtü, bir şey söyledi ve anında sosyal medyada onunla ilgili “Ne kadar yanlış söyledi?” ya da “Ne kadar yanlış konuşuyor?” gibi negatif sesler yükselmeye başladı. Tam bu anda bir reklam arasına girilebilir. Bunu reji özel bir yazılım ile takip edebilir. Bu özel yazılım sosyal medyayı gerçek zamanlı olarak da takip ediyordur. Reji o esnada reklam arasına girebilir ve konuğuna reklam arasında der ki “Sayın kişi! Az önce söylediğiniz şey, toplumda bir infial yarattı, isterseniz bir düzeltin, tekrar bir düşünün isterseniz” der ve toparlama şansı verebilir. Bunun gibi gerçek zamanlı erken müdahale ve de özellikle sosyal medyada canlı yayın akışında olan kazalarda çok faydalı olacaktır diye düşünüyorum.
Teleskop nasıl makro evreni, mikroskop nasıl mikro evreni incelemeye yararsa, sosyoskop dediğimiz yazılımlar da sosyo-dijital evreni incelemeye yarar. Bu tür bir yazılımı biz Tübitak 1512 desteği ile kurduğumuz Summarify şirketinde gerçekleştirdik. Burada tabii Türkçe Doğal Dil İşleme yöntemlerini kullanıyoruz.
“Domain’in spesifik olması başarı oranını artırıyor”
Doğal dil işleme yöntemi söylem ve içerik analizinde ne kadar başarılı?
Duygu analiz modelleri oldukça başarılılar fakat bu modellerin domain’e spesifik olması gerektiği de biraz ortaya çıktı. Yani duygu analizi yapıyorsunuz, söylem analizi yapıyorsunuz ama sektörden sektöre bu söylem analizi ya da duygu analizinin performansı değişebilir. Mesela diyelim ki “Tarkan son performansıyla sahneyi yaktı” diyorsunuz. Eğlence sektöründen bir ifade kullanıyorsunuz, “sahneyi yaktı”. Bunu genel bir duygu analizi modeline verirseniz gelecek cevap negatif olacak. Buradaki ‘yakmak’ negatif anlam içeriyor. O yüzden daha doğru bir sonuç almak için buna ekstra bir sektör bilgisi eklemek gerekiyor. Diyelim ki “Ne kadar ucuzsun” ya da “Ne kadar ucuz birisi” dediğin zaman, ‘ucuz’ e-ticaret sektörü için iyi olabilir ama medya sektöründe ya da başka bir alanda ucuz olmak kötüdür ve negatiftir. Yani sektörden sektöre değişiyor. Dolayısıyla bir sektöre spesifik olarak ya da bir alana bir domain’i spesifik olarak eğittiğimiz zaman başarı yüzde 90’lara varıyor.
Fakat bazen alan değişebiliyor. Bir alana uyguladığınız, e-ticarette eğittiğiniz şeyi medya sektörüne uyguladığınız zaman o yüzde 90 başarı sadece kendi sektöründe geçerli oluyor. Ama o yüzde 90 başarıyı başka bir yerde uyguladığınız zaman yüzde 70’lere kadar düşüyor. Bu arada insanların duygu analizinde pozitif, negatif ve nötr uyuşma oranı da yüzde 70’ler civarında. Yani bana göre pozitif olan bir şey başkasına göre nötr olabiliyor.
Orada insanların uyuşması bile yüzde 70. Dolayısıyla yüzde 70’i yakalamak iyidir. Araştırmacılar modelleri için diyor ki, “Ben yüzde 90 başarılıyım ama aslında model sadece kendi alanında yüzde 90 başarılı.” Başka bir alana geçtiği zaman çuvallıyor. O yüzden mümkün olduğunca fazla alanda veri üzerinden gitmek lazım. Yani ne kadar çok veri olursa o kadar iyi ya da alanlara özel olarak söylem analizleri ve metotlar geliştirilebilir.
“Datayı önyargılardan temizlemek gerekebilir”
Yapay zeka algoritmaları, nefret söylemi ve cinsiyet önyargısı gibi konuların tespitinde insanın yerini alabilir mi?
Yapay zeka algoritmaları tabii ki veriden öğreniyor. Biz bu algoritmalara hangi veriyi verirsek onu öğretmiş oluruz. Girdi verisinde bizim hangi önyargılarımız varsa (nefret söylemi gibi) yapay zekaya da öğretmiş oluyoruz. Buna insanlığın ortak oluşturduğu önyargılar da dâhil. Örneğin, bugün Google Çeviri’de klasik bir örnek olarak, “O bir doktor, o ise bir hemşire” deyip ifadeyi İngilizceye çevir dediğiniz zaman “He is a doctor, she is a nurse” (Erkek olan kişi bir doktor, kadın olan ise bir hemşire) diyor.
Bizde, yani Türkçede cinsiyetlendirme olmuyor. Bu örnekte kullanılan “o” (he) ve “o” (she) ifadelerinde cinsiyeti gösteren bir işaret yok. Ama İngilizcede cinsiyetlendirme var. Doktor olana “he”, hemşire olana “she” diyor, çünkü beslendiği datada onu görmüş. Fakat bu demek değildir ki bundan sonra da böyle olacak. Geçmiş öyle diye gelecek de öyle olacak diye bir durum yok. Toplumsal cinsiyet arasındaki eşitsizlik, benim bir mühendis olarak bilmediğim nedenlerden dolayı, topluma böyle gelmiş ama bundan sonra da böyle olacak diye bir şey yok. Fakat dikkatli olmazsak, bu insanlığın oluşturduğu ortak önyargıyı yapay zeka modellerine de öğretebiliriz. Bu yüzden önyargılardan bağımsız bir şekilde datadaki dağılımı eşitlemek ya da anonim hale getirmek gerekebilir. Datayı önyargılardan temizlemek gerekebilir. Bu da, bizler için yapay zeka ve etik gibi özel bir interdisipliner alanın kapısını aralıyor.
“Tek bilgisayara sığmayan veri: Big data”
Big data nedir bize özetleyebilir misiniz?
Evet, big data özet cümle olarak tek bilgisayara sığmayan dataya diyoruz. Yani bir bilgisayarımızın diyelim ki 16 GB’lık RAM’i var. Eğer biz bir veriyi alıp tek bilgisayardaki bu 16 GB’lık RAM’e sığdıramıyorsak, demek ki tek bilgisayara sığmayacak kadar büyük bir veri üzerinde çalışıyoruz. O zaman ne yapıyoruz bu veriyi? Ya parça parça alacağız ya da birden fazla bilgisayarla bu verinin yönetimini yapacağız. Dolayısıyla mühendislik tabiriyle tek bilgisayara sığmayan dataya, big data diyoruz. Her yerde big data var artık. Çünkü her yerde dijital iz bırakıyoruz. Bu izler çok fazla birikiyor ve bunları analiz etmek istediğimiz zaman daha büyük bir donanım altyapısına, yani bilgisayarlar kümesine ihtiyaç duyuyoruz.
Verinin büyüklüğü oranında, modelin kapasitesi artıyor. Fakat tabii burada ‘Garbage in, garbage out’ dediğimiz, pis ve işe yaramaz verinin temizliği konusu tekrar gündeme geliyor.
“Büyük veriler ancak yapay zeka ile analiz edilebilir”
Büyük veri analizinde yapay zekanın önemi nedir bundan da biraz bahsedebilir misiniz?
Eskiden verilerin küçük olduğu anketler yapardı insanlar. Yaptığı anketlerde “Yüz kişiye sorduk, böyle cevap verdi” derlerdi ve böylece veriyi yönetebilirdi. Ama artık sosyal medya sayesinde belki de yüz binlerce kişiye sorabilir ve yüz binlerce kişinin verisini, bir konuda ne düşündüğünü analiz etme gücüne sahip olabilirsiniz. O yüzden yüz binlerce veri içinde insanların tek tek ne dediğine artık bakamazsınız. Bunun otomatikleştirilmesi lazım ve orada ne denildiğinin anlaşılması lazım. Onu da ancak yapay zekayla yapabiliriz. Bu da hesaplamalı sosyal bilimlerin (computational social science) zorunlu hale gelmesi gerektiğini ortaya çıkarıyor. Çünkü çok fazla veri var ve yapay zeka teknikleriyle biz bu fazla veriyi ancak o şekilde analiz edebiliriz. İnsanlar tek tek verilere bakamaz, çünkü zamanları yetmez.
Son olarak şöyle söyleyeyim; hesaplamalı sosyal bilimler ile devam edecek olursak bugün artık çok daha iyi. Disiplinler arası çalışmalar yaygınlaşmış durumda ve bunun önemi de artıyor.
Biz mühendisler olarak işin sadece bir tarafına bakabiliyor olabiliriz ama önemli araştırma soruları (research questions) genellikle sosyal bilimciler tarafından soruluyor. Öbür taraftan sosyal bilimcilerin de bu büyük datayı işleme yetenekleri yok. Dolayısıyla da bilgisayar mühendisleri ve sosyal bilimcilerin bir araya gelmeleri gerekiyor. Zaten böyle bir disiplin de dünyada oluştu, Türkiye’de de oluştu. Bu disiplinin adı hesaplamalı sosyal bilimler. Hesaplamalı sosyal bilimler, yeni nesil Rönesans insanları için oldukça uygun bir alan. Gençlerin bu interdisipliner alana göz atmalarında fayda görüyorum.
Uzay Çetin kimdir?
Paris Pierre ve Marie Curie Üniversitesi’nde yapay zeka alanında yüksek lisans, Boğaziçi Üniversitesi Bilgisayar Mühendisliği Bölümü’nde karmaşık sistemler alanında çalışmalar yürüterek doktora derecesini aldı. Galatasaray Üniversitesi Bilgisayar Mühendisliği bölümünde öğretim üyesi olarak çalışıyor. Ayrıca doğal dil işleme (NLP) ile gerçek zamanlı sosyal medya analizi yapan Summarify adlı şirketin kurucu ortağı. Hesaplamalı sosyal bilimler, veri bilimi, yapay zeka, karmaşık sistemler ve karmaşık ağlar ile ilgileniyor.