Yapay zeka modellerine Uluslararası Matematik Olimpiyatı’nda altın madalya

OpenAI ve Google tarafından geliştirilen deneysel yapay zeka modelleri, dünyanın en saygın bilimsel yarışmalarından biri olan Uluslararası Matematik Olimpiyatı’nda (IMO) altın madalya seviyesinde başarı elde etti. İnsan zekasına yakın muhakeme becerileriyle donatılmış bu modeller, şimdiye kadar yapay zekanın zorluk yaşadığı alanlardan biri olan yaratıcı matematik problemlerinde dikkat çekici bir performans sergiledi.

OpenAI araştırmacısı Alexander Wei’nin X platformunda duyurduğu gelişmeye göre, henüz yayınlanmamış deneysel model, IMO’daki altı sorudan beşini doğru çözerek 42 üzerinden 35 puan topladı. Bu skor, altın madalya kazanan yüzde 10’luk dilim içerisinde yer alacak kadar yüksek. Genellikle cebir, geometri, kombinatorik ve sayı teorisi gibi alanlarda hazırlanan IMO soruları, yalnızca teknik bilgi değil, aynı zamanda derin analitik düşünme ve yaratıcılık gerektiriyor.

Wei, modelin yalnızca doğru cevaplar üretmekle kalmayıp, aynı zamanda sağlam ve insan benzeri matematiksel akıl yürütmeler ortaya koyduğunu belirtti: “İnsan matematikçiler seviyesinde güçlü argümanlar kurabilen bir model geliştirdik.” Ancak OpenAI CEO’su Sam Altman ile birlikte yaptığı açıklamada, bu modelin yakın zamanda kamuya sunulmayacağını, dolayısıyla yaklaşan GPT-5 sürümünde bu seviyede bir matematiksel performans beklenmemesi gerektiğini vurguladı.

Benzer bir başarı Google cephesinden de geldi. Şirketin yapay zeka modeli Gemini Deep Think, aynı yarışmada altı sorudan beşini çözerek yine 35 puana ulaştı ve altın madalya düzeyine çıktı. Google, önceki yıllarda yapay zekaların matematik sorularını çözmeden önce doğal dili özel matematiksel dillere çevirdiğini ancak bu yıl Gemini’nın soruları doğrudan doğal dilde anlayarak 4,5 saatlik sınav süresi içinde eksiksiz ve katı ispatlarla yanıtladığını açıkladı.

Gemini Deep Think’in özellikle çok adımlı muhakeme ve paralel düşünme becerileriyle geliştirildiği belirtilirken, modelin önce matematikçilerden oluşan seçkin bir test grubuyla paylaşılacağı, ardından ise Google’ın premium yapay zeka hizmeti AI Ultra kapsamında kullanıma sunulacağı duyuruldu. Modelin genel kullanıma ne zaman açılacağı ise şimdilik net değil.

Her yıl farklı ülkelerden seçilen altı lise öncesi öğrencinin yarıştığı IMO, genç dahilerin mücadele ettiği ve yapay zekanın insan zihniyle rekabet ettiği en üst düzey platformlardan biri haline geliyor. Bu son gelişmeler, yapay zekanın yalnızca veriye dayalı görevlerde değil, soyut düşünme ve yaratıcı problem çözmede de hedeflenen standarda iyice yaklaştığına işaret ediyor.

Buna da göz atın: Yapay zeka şirketleri birlikte uyarıyor: AI anlaşılmaz hale gelebilir