Yapay zeka modelleri ChatGPT, Gemini ve Claude’un eğitimi için kullanıcıların internetteki hareketleri, CAPTCHA testleri ve oyun verileri kullanılıyor. Uzmanlar gizlilik endişeleri taşıyor.
Büyük dil modelleri (LLM) ChatGPT, Gemini ve Claude gibi yapay zeka teknolojileri, her gün milyonlarca kullanıcı tarafından interrogatediliyor. Bu modellerin eğitimi için kitaplar, internet siteleri ve makalelerden elde edilen metinler kullanılıyor. Ancak son dönemde tartışmalar, bu eğitim sürecinin internet kullanıcılarının çevrimiçi hareketlerinden de veri topladığı yönünde yoğunlaşıyor.
İnternet hizmetlerine erişimden önce kullanıcıların robot olmadığını teyit eden CAPTCHA ve reCAPTCHA testleri, teknoloji firmaları için güvenlik önleminin ötesine geçiyor. Kullanıcılardan görseldeki harfleri yazması veya belirli nesneleri ayırt etmesi istenen bu testlerin, yapay zeka araçlarının eğitiminde kullanıldığı iddia ediliyor. Google’ın kullandığı testlerde sıkça sorulan yaya geçitleri, trafik lambaları ve taşıtlar gibi nesnelerden elde edilen verilerin, yapay zeka destekli insansız araçlar için kullanıldığına dair iddialar mevcut.
Bir Google Cloud sözcüsü, reCAPTCHA kullanıcı verilerinin sadece hizmeti iyileştirmek amacıyla kullanıldığını ve bu durumun hizmet şartlarında açıkça belirtildiğini ifade etti. Bu verilerin başka hiçbir amaç için kullanılmadığı vurgulandı.
Yapay zeka eğitiminde gündelik kullanımların rolü, oyunlar gibi farklı alanlara da yayıldı. 2016’da piyasaya sürülen ve popüler olan “Pokemon Go” oyunu, oyuncuların cep telefonlarındaki GPS ve kameralar aracılığıyla gerçek dünyada karakterleri aradığı bir yapıya sahip. Bu süreç, sokak görüntülerinden oluşan büyük bir veri havuzu oluşturdu.
MIT Technology Review’a göre, Niantic’in yapay zeka şirketi Niantic Spatial, oyuncuların topladığı 30 milyar görseli kullanarak gerçek dünyanın sanal bir modelini üretti. Firma, bu teknolojiyle kişilerin etrafındaki görüntüleri yükleyerek konumlarını haritada görmesini sağladığını belirtti. Niantic, bu modellemeyi GPS’in güvenilir olmadığı yerlerde robotların hareketini kolaylaştırmak için de kullanmayı hedefliyor.
Niantic, Kasım 2024’te yaptığı açıklamada, oyuncuların gerçek dünyayı tarayarak sunduğu verilerin kullanıldığını doğruladı ancak bu özelliğin tamamen opsiyonel olduğunu vurguladı.
İsviçre Lozan Üniversitesi’nden Profesör Christian Peukert, yapay zeka eğitiminde kullanılan materyaller ile kullanıcı güvenliği ve mahremiyeti arasındaki dengeyi değerlendirdi. Peukert, CAPTCHA testlerinin eski versiyonlarında, kullanıcılara sorulan kelimelerden birinin sistem tarafından bilindiğini, diğerinin ise bilinmediğini belirtti. Sistem tarafından tanınan kelime kullanıcının insan olduğunu doğrulamak için kullanılırken, bilinmeyen kelimeye verilen yanıtın veri olarak depolandığını anlattı.
Bu durumun, kullanıcıların metin tanıma sistemlerinin iyileştirilmesine doğrudan katkıda bulunduğu anlamına geldiğini vurgulayan Peukert, yapay zekanın eğitiminin büyük kısmının, kullanıcıların fark etmeden internette ürettiği pasif verilere dayandığını söyledi.
Peukert, Reddit ve Twitter gibi sosyal medya platformlarının dil modellerini eğiten metinler sağladığını, Instagram gibi görsel platformlarda açıklama ve etiketlerin görsel verinin etiketlenmesine katkı sağladığını belirtti. Google aramalarının dil anlama ve sıralama sistemlerini, Google Haritalar ve Waze gibi navigasyon uygulamalarının ise hareket verilerini topladığını ekledi. Ayrıca, sohbet robotları ve sesli asistanlarla yapılan görüşmelerin de genellikle kayıt altına alınıp sistemleri iyileştirmede kullanıldığına dikkat çekti.
Profesör Peukert, büyük ölçekli veri birikiminin
Türkiye’nin en güçlü ve en iddialı haber teması: Seobaz Haber Teması. Hız, SEO uyumu ve modern tasarımıyla rakiplerinizi geride bırakın, haber sitenizi zirveye taşıyın.
Yorum Yap