25 Mayıs 2024 04:39

Geniş dil modelleri ve yağmaya dayalı iş modeli

Görsel: Gerd Altman/Pixabay

Paylaş

İsmail Gökhan Bayram

Tüm yazıları

Wall Street Journal ve The Times gibi büyük yayınların sahibi olan News Corp, birkaç gün önce içeriklerinin kullanım hakları için OpenAI ile 250 milyon dolar değerinde bir anlaşmaya imza attığını duyurdu. News Corp’un anlaşması türünün ilk örneği değil. Son altı ay içinde Financial Times gibi bazı büyük yayıncılar benzer anlaşmalar imzaladıklarını duyurmuştu. Başta New York Times olmak üzere bazı yayıncılar ise tam tersi yönde hareket ederek içeriklerinin izinsiz kullanımı nedeni ile geniş dil modeli geliştiricisi şirketlere dava açmıştı. OpenAI veya diğer geniş dil modeli geliştiricisi şirketlerle anlaşma yapan yayıncıların neden bu yolu seçtiğini tahmin etmek güç değil. Çünkü OpenAI’ın şu anki iş yapma şekli oldukça bilindik bir model: yasaların kendilerine işlemediğini varsayarak ve mevzuattaki boşluklardan yararlanarak bir an önce yasaların işletilmesini umursamayacak kadar para kazanmaya dayalı bir model bu. Yayıncılar içeriklerinin OpenAI ve diğer geniş dil modeli geliştiricisi şirketler tarafından lisansı alınarak ya da alınmadan yağmalanacağını/yağmalandığını biliyor ve bir kısmı “Bu yağmadan ne kadar para alabilirsek kârdır” yaklaşımını benimsiyor.

Geniş dil modeli geliştiricisi şirketlerin bu yağmacılığı sadece haber yayıncılarını ilgilendiren bir durum değil. Fotoğrafçılardan görsel sanatçılara, seslendirme sanatçılarından oyunculara, yazarlara ve hatta sıradan kullanıcılarca üretilmiş her türden içeriğe uzanan bir yağma bu. Sosyal medya şirketleri kullanıcıları tarafından üretilmiş içerikleri ya kendileri geniş dil modellerinde kullanıyor ya da kullanabilecek bir şirkete pazarlıyor. Kullanıcıların kendi üretimlerinin kullanılmasını ve pazarlanmasını kabul ettiği bir ön kabul olarak varsayılıyor ve bu ön kabulü “Hayır, kabul etmiyorum”a çevirmek isteyen kullanıcıların önüne olanca zorluk çıkarılıyor.

Varsayalım Instagram içeriklerinizin Meta AI’nın eğitiminde kullanılmasını istemiyorsunuz. Bunu yapabilmek için öncelikle eğer Instagram hesabınız Facebook hesabınıza bağlı değilse bağlamanız gerekiyor. Ardından sırasıyla Ayarlar > Yardım > Yardım Merkezi > Instagram’da AI’lar hakkında > Meta üretken AI modelleri için bilgiyi nasıl kullanıyor alt menü patikasını izleyerek uzun bir metnin sonlarında itiraz formuna ulaşabileceğini bağlantıyı buluyorsunuz. İtiraz formunu doldurduktan sonra verilerinizin kullanılmaya devam edip etmediği konusunda ise elinizdeki tek veri o formu menülerinin en gizli köşesine saklayan şirketin size söyledikleri.

Bu genel yağmacılık haline daha yüksek sesli itirazlar da olduğundan yazının başında bahsetmiştik. Bu ay, biri Sony Music’ten diğeri ise Oyuncu Scarlett Johansson’dan olmak üzere böyle iki yüksek sesli itiraza tanıklık ettik. Sony Music; Open AI, Google ve Microsoft da dahil olmak üzere geniş dil modeli geliştiricisi 700 şirkete yolladığı yazıda “Kendilerine ait içeriklerin izinsiz bir şekilde model eğitiminde kullanıldığına inanmak için gerekçeleri olduğunu” belirterek “Modellerin eğitiminde hangi eserlerin kullanıldığı”, “Kullanılan eserlere ne şekilde erişildiği”, “Eserlerin kaç kopyasının çıkartıldığı” ve “Kopyaların hâlâ kullanımda olup olmadığı” gibi sorulara yanıt talep etti. Henüz ihtar düzeyinde olsa da davaya dönüşüp Sony Music’in telif ihlallerini kanıtlaması halinde doğacak tazminat astronomik miktarlara ulaşabilir.

Johansson’un itirazı ise geniş dil modeli şirketlerin çalışma şekillerinin teşhiri açısından dikkate değer. Johansson’un iddiasına göre OpenAI’ın son model sesli asistanının kullandığı ses kendi sesinin, spesifik olarak da 2013 yapımı Her filminde canlandırdığı yapay zekâ karakterin sesinin yeniden üretimi. Johansson’un iddiasına göre biri dokuz ay diğeri ise tanıtım etkinliğinden iki gün önce olmak üzere OpenAI kendisine sesini lisanslamak için başvurdu ve Johansson bu teklifleri reddetti. Altman ve OpenAI buna rağmen Johansson’un sesine fazlasıyla benzer bir ses kullanmakta bir sıkıntı görmedi. Tanıtım etkinliğinin ardından OpenAI CEO’su Sam Altman’ın X/Twitter’da sadece “Her” yazan bir gönderi paylaşmış olması meselenin basit ve tesadüfi bir benzerlik olmadığının da kanıtı. Johansson açıklamada bulunmadan önce OpenAI ilgili ses modelini -Johansson yasal bir ihtarda bulunduğundan- kullanımdan kaldırdı. Johansson’un açıklamasının ardından Altman, “Sky modelinin sesinin Johansson olmadığını”, “Johansson’un sesine benzetmeyi asla amaçlamadığını” ve “Ses verilerinin kaynağının ismini açıklamadıkları başka bir seslendirme sanatçısı olduğunu” iddia etti. Tanıtımdan sonra ses benzerliği medya tarafından sorulduğunda OpenAI CTO’su Mira Murati de benzer ifadelerle Johansson’un sesinin taklit edildiği iddialarını reddetmişti.

OpenAI ve Altman söz konusu olduğunda oldukça belirgin bir örüntüden bahsetmek gerekiyor. Kasım ayında yaşanan yönetim krizinde Altman’ı yönetimden almaya çalışan ekibin gerekçelerinden biri Altman’ın “Sürekli olarak samimi olmaması” idi. Oluşturulduğunda kendilerine eldeki işlem gücünün yüzde 20’sini kullanabilme sözü verilen, yapay zekanın uzun erimli risklerini araştıracak ekibe vaat edilen işlem gücünün çeyreğinin bile verilmediği ortaya çıktı. Kısa süre önce ekip dağıtıldı, üyeleri OpenAI’dan istifa ettiklerini duyurdu. Geçen hafta Vox Media, OpenAI’den ayrılanların, ihlal ettiklerinde şirketteki tüm kazanılmış hisse senetlerini kaybedecekleri şirketi eleştiri yasağını da kapsayan kısıtlayıcı bir gizlilik sözleşmesi imzalamak zorunda kaldıklarını ortaya çıkarttı. Altman durumdan haberdar olmadığını ve haberdar olur olmaz düzelttiklerini iddia etti ancak Vox’un ortaya çıkarttığı belgelerin altındaki imzalar Altman ve hemen altındaki yönetici katmanına aitti.

Bu sürekli ve arsızca yalan söyleme hali, pratikte şirket politikası. Johansson vakasına dair açıklamaların farklı ya da dürüst olduğunu düşündürecek tek bir veri yok. Ses modelini geri çekmiş olmaları da açılacak bir davayı büyük olasılıkla kaybedeceklerini bilmelerinden. Ses benzetiminin açık izin gerektirdiğini ortaya koyan Midler v. Ford ve Waits v. Frito-Lay gibi eski ama çokça benzerlik taşıyan davalar mevcut. Olası ya da mevcut davalardan birinin kaybedilmesi bile henüz hukuki çerçevesi bulanık olan bu denklemi biraz daha berraklaştırır. OpenAI ve diğer yağmacılar ile “Yağmadan payımızı biz de alalım”cıları en zora sokacak sonuçlardan biri açılan çeşitli davaları kaybetmeleri olacaktır.