Yapay zekada ‘akıl yürütme’ modelleri tıkanmanın eşiğinde

Yapay zekada ‘akıl yürütme’ modelleri tıkanmanın eşiğinde
Mühendisler zekayı makinelere öğretmeye çalışırken, yapay zeka araştırmaları adeta bir satranç oyununa dönüştü: her atak daha akıllı modeller üretirken, oyun tahtası daralıyor. Akıl yürütme (reasoning) yeteneğine sahip modeller giderek daha karmaşık hale gelse de, bu ilerlemenin yakıtı olan işlem gücü ve araştırma kaynakları sonlu. Yeni bir tahlil, bu stratejik oyunda, yakında gelişimin değil süreç gücü sonlarının konuşulacağını söylüyor.

Bilindiği üzere yapay zeka dünyasının son yıllardaki en büyük sıçramalarından biri, akıl yürütme yeteneğine sahip modellerin geliştirilmesiydi. Lakin bu sıçrayış da sona yaklaşıyor. Bağımsız araştırma kuruluşu Epoch AI tarafından yayımlanan rapora nazaran, “reasoning” yani akıl yürütme modellerinin performans kazanımları, önümüzdeki yıl gibi kısa bir müddette kıymetli ölçüde yavaşlayabilir.

Gelişim yavaşlayacak

Akıl yürütme modelleri, bilhassa matematiksel problem çözme ve programlama marifetlerini ölçen testlerde gösterdikleri üstün muvaffakiyetle dikkat çekmişti. OpenAI’ın geliştirdiği “o3” ile Deepseek, Anthropic ve Google’ın emsal modelleri, daha fazla hesaplama gücü kullanarak klâsik yapay zeka modellerine kıyasla daha isabetli sonuçlar verebiliyor. Fakat bu yüksek doğruluk oranının bedeli, süreç süresindeki uzama ve maliyetlerin önemli biçimde artması oluyor.

Bu tıp modellerin geliştirilmesi, iki temel kademeye dayanıyor: Öncelikle model büyük data kümeleri üzerinde eğitiliyor, akabinde destekli yahut pekiştirmeli öğrenme ismi verilen bir süreçle sıkıntı sorunlar karşısında yanlışsız tahliller üretmesi için geribildirim veriliyor. Epoch AI’nın bulgularına nazaran, bugüne dek önde gelen yapay zeka laboratuvarları bu ikinci etapta hudutlu bir süreç gücü kullanıyordu.

Fakat bu durum değişiyor. OpenAI, o3 modelini geliştirirken, bir evvelki sürümü olan o1’e kıyasla yaklaşık 10 kat daha fazla süreç gücü kullandığını açıkladı. Epoch’un varsayımlarına nazaran, bu artışın büyük kısmı destekli öğrenme sürecine ayrıldı. OpenAI araştırmacısı Dan Roberts ise, gelecekteki modellerde bu sürece çok daha fazla kaynak ayrılacağını belirtti.

Hesaplama gücü sonsuz değil

Fakat burada bir hudut var. Epoch analisti Josh You, klâsik model eğitimiyle elde edilen performans artışlarının yılda yaklaşık dört kat arttığını, buna karşılık destekli öğrenme kaynaklı çıkarların her 3 ila 5 ayda bir on katına çıktığını söylüyor. Fakat bu ivmenin sonsuza dek süremeyeceğini vurgulayan You, 2026 yılına kadar bu iki alanın performans kazanımlarında bir istikrara ulaşacağını öngörüyor. Raporda sırf süreç gücü değil, araştırma maliyetleri üzere faktörlerin de göz önünde bulundurulması gerektiği belirtiliyor. Bu modellerde birebir vakitte diğer bir sorun da var. Bu modeller ne kadar akıllandıkça o kadar palavra söylemeye, yani “halüsinasyon” üretme eğiliminde oluyorlar. Bunları bastırmak da tekrar dolaylı bir maliyet yaratacak. Münasebetiyle sanayi, bir sonraki “iPhone” anını bekliyor desek yanlış olmayacaktır.

administrator

Related Articles

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir