Singapur merkezli Sapient Intelligence, geçtiğimiz günlerde Hierarchical Reasoning Model (HRM) adlı yapay zeka mimarisini açık kaynak olarak paylaştı. 27 milyon parametreli bu modelin, belirli akıl yürütme testlerinde Claude, OpenAI’nin o3-mini ve DeepSeek R1 gibi güçlü rakiplerini geride bıraktığı iddiası teknoloji dünyasında büyük yankı uyandırdı. Başlıklarda “atılım” vurgusu var; ancak gerçekler daha nüanslı…
Neden farklı?
Bugünün büyük dil modelleri, çoğunlukla “Chain-of-Thought” (düşünce zinciri) yaklaşımıyla ara adımları metin üzerinden üretmeye dayanıyor. HRM ise ilhamını nörobilimden alıyor.
Model, iki farklı zaman ölçeğinde çalışan bağlantılı yinelenen (recurrent) modüllerden oluşuyor:
- Soyut planlama yapan yüksek seviye modül
- Hızlı hesaplama yapan düşük seviye modül
Bu yapı, Daniel Kahneman’ın insan aklının hem hızlı karar alma hem de derinlemesine muhakeme yapma kapasitesine sahip olduğunu savunan düşünce teorisini, biyolojik sinapslar yerine silikon çiplerde hayata geçiriyor: Sistem 1 (hızlı, sezgisel) ve Sistem 2 (yavaş, analitik)…
İlk sonuçlar dikkat çekici
- Eğitim seti: Sadece 1.000 örnek
- Ön eğitim yok
- Sonuçlar:
- Karmaşık Sudoku bulmacalarında neredeyse kusursuz başarı
- 30×30 labirentlerde optimal yol bulma (güncel CoT modellerinin skorunun 0 olduğu testler)
- ARC-AGI (soyutlama ve akıl yürütme ölçütü) testinde yüzde 40,3 doğruluk (Claude 3.7’de bu oran yüzde 21,2 olarak kaydedilmişti)
Sapient’in iddiaları çok iddialı: Nadir hastalık teşhisi, iklim tahminlerinde yüzde 97 doğruluk, hafif robotik kontrol… Dahası, model sadece 200 MB RAM altında ve standart CPU’larda çalışabiliyor. Bu, yüksek donanım ihtiyacıyla bilinen günümüz LLM’lerinden ciddi şekilde ayrışıyor.
Testler ne gösteriyor?
Ancak ARC Prize ekibi (HRM’nin üstünlüğünü kanıtladığı söylenen benchmark’ın geliştiricileri) kendi doğrulama testlerini yaptı. Bulgular tabloyu değiştirdi:
- Mimari avantaj abartılı: HRM, aynı boyuttaki klasik transformer modellerine karşı anlamlı bir üstünlük göstermedi.
- Asıl yenilik eğitim metodunda: “Outer loop” adı verilen, yinelemeli tahmin ve kendi kendini düzeltme süreci mimariden bağımsız olarak herhangi bir modele eklenebiliyor.
- Görev bağımlılığı yüksek: Sudoku başarısı, Sudoku’ya özel eğitimden geliyor. Labirent çözme yeteneği, labirent eğitiminden… Gizli testlerde başarı oranı yüzde 41’den yüzde 32’ye düştü. İşletim gerekleri söz konusu olduğunda küçük olarak tanımlanabilecek bir model için bu hala etkileyici, ama evrensel bir akıl yürütme atılımı değil.
HRM aslında ne?
- Güçlü olduğu alan: Net kuralları ve sınırlı kapsamı olan yapısal bulmacalar (Sudoku, labirentler, desen tanıma).
- Katma değer: Az veriyle öğrenme, dar kapsamlı görevlerde yüksek verim.
- Teknolojik fark: Ara adımları metinle üretmek yerine gizli durumlarda (latent states) hesaplama yapıyor. Bu da 100 kata kadar hızlanma sağlayabiliyor.
HRM ne değil?
- LLM alternatifi değil: HRM sohbet edemez, kod yazamaz, makale üretemez. Doğal dil üretim kapasitesi bulunmuyor.
- Genel amaçlı akıl yürütme motoru değil: Her yeni görev için özel eğitim gerekiyor.
- Üretim ortamına hazır değil: Sağlık ya da iklim gibi alanlarda uygulamalar hala pilot aşamasında gerçekleşiyor.
Stratejik çıkarımlar
HRM’in ortaya koyduğu asıl ders şu: “Daha büyük” her zaman “daha iyi” değil.
- Küçük, verimli modeller belirli görevlerde devasa LLM’lerden daha avantajlı olabilir.
- Açık kaynak paylaşım sayesinde işletmeler, özellikle yapısal akıl yürütme gerektiren özel problemler için HRM’i deneyebilir.
- Yapay zekanın geleceği muhtemelen tek bir devasa modelden değil; farklı mimarilerin farklı görevler için optimize edildiği çoklu bir ekosistemden oluşacak.
Sapient, CoT yaklaşımına meydan okuyarak beyin ilhamlı modellerin rekabet edebileceğini göstermiş oldu. Ancak HRM’i bir LLM ikamesi gibi görmek yanıltıcı olur. Bu iki yaklaşım farklı problemleri çözüp, yine farklı alanlarda değer üretecektir.
Ne anlama geliyor?
HRM, yapay zekada “büyük modeller mi, akıllı mimariler mi?” tartışmasına yeni bir boyut kazandırıyor. Model, tek başına devrimsel bir sıçrama sunmasa da, dar kapsamlı görevlerde küçük ve verimli sistemlerin büyük modellerle rekabet edebileceğini güçlü bir şekilde gösteriyor. Bu durum, özellikle enerji tüketimi, maliyet ve veri kıtlığı gibi faktörlerin kritik olduğu alanlarda stratejik değer taşıyor.
Bununla birlikte HRM’in sınırları da net: Genel amaçlı akıl yürütme için uygun değil, doğal dil üretemiyor ve görev bağımlılığı yüksek. Yani HRM’i, LLM’lerin yerine geçecek bir “evrensel çözüm” olarak görmek yanlış olur. Doğru çerçeveleme ise şu olarak gösterilebilir: HRM, yapay zeka ekosisteminde niş ama yüksek değerli uygulamalara hizmet edecek özel bir araç…
Daha büyük resimde, HRM’in önemi yalnızca kendi başarısından değil, aynı zamanda sektöre verdiği mesajdan geliyor: AI’ın geleceği tek bir paradigma üzerine inşa edilmeyecek. Önümüzdeki yıllarda, büyük dil modellerinin genel amaçlı kullanımına paralel olarak, HRM benzeri daha küçük ve görev odaklı mimarilerin yükseldiği hibrit bir manzara görebiliriz. İşletmeler için asıl stratejik beceri, hangi problem için hangi mimarinin en uygun olduğunu ayırt edebilmek olacak.
Buna da göz atın: Anthropic, telif hakkı davasında rekor kıran 1.5 milyar dolarlık ödeme yapacak