The NewsightThe NewsightThe Newsight
Bildirim
Font Büyüklüğünü DeğiştirAa
  • Haberler
  • Insight
  • Foresight
  • Nedir?
Font Büyüklüğünü DeğiştirAa
The NewsightThe Newsight
Arama
  • Haberler
  • Insight
  • Foresight
  • Nedir?

Yeni Yazılar

Askıda Ne Var’dan, Altınyıldız Classics desteğiyle”Mezunlar Takım Yıldızı” projesi

Müşteri segmentasyonunda RFM analizi nedir?

Google’dan metin, görsel ve videoyu birleştiren Gemini Omni

Net tavsiye skoru: Müşteri bağlılığının finansal performans ve operasyonel verimlilikle bağı

Bugünün yatırımcılarının bilmesi gereken 15 kritik kavram

Takip Edin
  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği
The Newsight © 2026
The Newsight > Insight > ChatGPT-4.5 Turing Testi’ni geçti: Peki, şimdi ne olacak?
Insight

ChatGPT-4.5 Turing Testi’ni geçti: Peki, şimdi ne olacak?

Yazar The Newsight Nisan 21, 2025
Paylaş
6 Dk. Okuma
Paylaş
Yapay zeka ile özetle
▾

Geçtiğimiz hafta boyunca, bir yapay zeka chatbot’unun resmen Turing testini geçtiğine dair pek çok habere şahit olduk. Bu haberler, Kaliforniya Üniversitesi San Diego’dan iki araştırmacının yaptığı yakın tarihli bir ön baskı çalışmasına dayanıyor. Bu çalışmada dört büyük dil modeli (LLM), Turing testine tabi tutuldu. Bu modellerden biri – OpenAI’ın GPT-4.5’i – katılımcılar tarafından yüzde 70’ten fazla oranda insandan ayırt edilemez olarak değerlendirildi.

İçindekiler
Çalışma neyi ortaya koydu?Turing Testi’ni hatırlayalım…Neden tartışmalı?Peki, an itibarıyla, bir LLM insan kadar zeki mi?

Turing testi, makine zekasının nihai göstergesi olarak kabul edilmiş durumda. Ancak buna rağmen testin geçerliliği konusunda fikir birliği bulunmuyor. Hatta testin geçmişi üzerine fazlaca tartışıldığı gibi, makine zekasını ölçmede ne kadar etkili olduğu sorusunu da beraberinde getiriyor.

Peki bu yeni çalışmanın çıktıları ne anlama geliyor?

Çalışma neyi ortaya koydu?

Bilişsel bilimciler Cameron Jones ve Benjamin Bergen tarafından yapılan ve Mart 2025’te yayımlanan ön baskı aşamasındaki ve henüz hakem değerlendirmesinden geçmemiş olan çalışma, dört büyük dil modelini test etti: ELIZA, GPT-4o, LLaMa-3.1-405B ve GPT-4.5.

Testlerde, insan katılımcılar sekiz tur boyunca aynı anda iki muhatapla yazılı mesajlaşma yoluyla sohbet etti. Bu muhataplardan biri gerçek bir insandı, diğeri ise bir dil modeliydi. Toplam 284 katılımcı rastgele şekilde ya sorgulayıcı ya da muhatap olarak görevlendirildi.

Katılımcılar, beş dakika boyunca iki muhatapla ikiye bölünmüş bir ekran üzerinden aynı anda etkileşime geçti. Test arayüzü, klasik bir mesajlaşma uygulamasını taklit edecek şekilde tasarlandı. Etkileşimin ardından, katılımcılar hangi muhatabın insan, hangisinin yapay zeka sohbet botu olduğuna karar verdi.

Katılımcılar GPT-4.5’i yüzde 73 oranında insan zannetti. LLaMa-3.1-405B ise yüzde 56 oranında insan olarak değerlendirildi. Diğer iki model (ELIZA ve GPT-4o) ise sırasıyla yüzde 23 ve yüzde 21 oranlarında katılımcıları kandırabildi…

Turing Testi’ni hatırlayalım…

Turing testinin ilk hali, İngiliz matematikçi ve bilgisayar bilimci Alan Turing tarafından 1948 tarihli “Zeki Makineler” adlı yazısında sunulmuştur. Başlangıçta bu test, biri kuramsal bir “kâğıt makine” olan üç kişinin satranç oynadığı bir deney olarak önerilmişti; iki kişi oyuncu, biri ise operatör konumundaydı.

1950’de yayımlanan “Hesaplama Makineleri ve Zeka” başlıklı makalesinde Turing, bu deneyi “taklit oyunu” olarak yeniden tanıttı ve bunu bir makinenin, insanla eşdeğer zekada davranış sergileyip sergileyemeyeceğini belirlemenin bir yolu olarak sundu. Oyunda üç katılımcı yer alıyordu: Katılımcı A bir kadın, katılımcı B bir erkek ve katılımcı C herhangi bir cinsiyetteydi.

C katılımcısı, soru-cevap yoluyla “X A mı ve Y B mi?” yoksa “X B mi ve Y A mı?” sorularını cevaplamaya çalışıyordu. X ve Y bu iki cinsiyeti temsil ediyordu.

Sonrasında şu önerme ortaya atıldı: “Bir makine bu oyunda A rolünü üstlendiğinde ne olur? Oyunu bu şekilde oynarken sorgulayıcı, oyunun bir kadın ve bir erkek arasında oynandığı durumdaki kadar sık yanlış karar verecek mi?”

Bu sorular, “Makineler düşünebilir mi?” gibi soruları yanıtlayabilmek için ortaya atılmıştı. Turing, bu sorunun “makine” ve “düşünmek” kelimelerinin anlamlarının belirsizliği nedeniyle yanıtsız kalacağını savunuyordu.

Yıllar içinde bu deney, Turing testi olarak popülerleşti. Konusu zamanla değişmiş olsa da test, özü itibarıyla hala “X A mı ve Y B mi?” ya da “X B mi ve Y A mı?” sorusu üzerine kurulu.

Neden tartışmalı?

Turing Testi, makine zekasını test etmenin bir yolu olarak popülerleşmiş olsa da, bu yaklaşımın doğruluğu konusunda herkes hemfikir değil. Hatta, test sıklıkla eleştiriliyor.

Turing Testi’ne yönelik dört temel itiraz bulunuyor:

  • Davranış ve düşünce farkı: Bazı araştırmacılar, testten “geçmenin” aslında zekayla değil, davranışsal yeterlilikle ilgili olduğunu savunuyor. Yani bir makinenin bu oyunu geçmesi, gerçekten düşünebildiği anlamına gelmez.
  • Beyinler makine değildir: Turing, beynin bir makine olduğunu ve tamamen mekanik terimlerle açıklanabileceğini öne sürmüştür. Ancak birçok akademisyen bu görüşe karşı çıkarak testin geçerliliğini sorgular.
  • İçsel işleyiş farkı: Bilgisayarların karar verme süreçleri insanlar gibi çalışmaz; bu da doğrudan karşılaştırmaları yetersiz kılar.
  • Testin kapsamı: Bazı araştırmacılar, yalnızca bir tür davranışı test etmenin zekayı ölçmek için yeterli olmadığını düşünür.

Peki, an itibarıyla, bir LLM insan kadar zeki mi?

Ön baskıda olan makale, GPT-4.5’in Turing Testi’ni geçtiğini iddia etse de, şu ifadeye de yer veriyor:

Turing testi, yer değiştirme ölçüsüdür: bir sistemin, bir insan yerine geçip geçemeyeceğini ve bunun fark edilip edilmediğini test eder.

Bu ifade, araştırmacıların Turing testini insan zekasının meşru bir ölçütü olarak görmediğine işaret ediyor gibi gözüküyor. Daha çok, insan zekasının taklidine dair bir değerlendirmedir – yani testin kökenlerine bir gönderme niteliğinde olarak yorumlanabilir.

Ayrıca, her araştırma sürecinde olduğu gibi çalışmanın koşulları da tartışmalı/sınırlı olarak değerlendirilebilir. Örneğin, beş dakikalık bir test süresi oldukça kısa sayılabilir. Bunun yanında, testin açıklamasına göre her bir dil modeli belirli bir kişilik profilini/personayı sahiplenme prompt’unu aldı, ancak bu kişiliklerin ne ve kim olduğunun yanı sıra test sonuçlarını nasıl etkilediği net değil.

Şimdilik söylenebilecek olan: GPT-4.5 henüz insanlar kadar zeki değil – fakat bazı insanları kandırma konusunda hiç fena bir iş çıkarmıyor.


Buna da göz atın: Yapay zeka ve nezaket…

ETİKET:AraştırmaTeknoloji

Güncel Kalın

İş dünyasından en güncel haberler, sektörel analizler ve ilham verici içerikler için sosyal medya hesaplarımızı takip edin.

Popüler

Sosyal Etki Zirvesi: Eşitliğin karnesi, dayanışmanın gücü

Musk x OpenAI davasında ilk gün tamamlandı

Tedarik zincirinde kamçı etkisi (bullwhip effect): Talep dalgalanmalarının operasyonel maliyeti

Tekno feodalizm nedir? Dijital ortaçağ dönemi kapıda mı?

İlgili Yazılar

Apple’da Cook dönemi bitiyor; Mühendis Ternus dönemi başlıyor…

Tim Cook'un Apple CEO'luğu bayrağını John Ternus'a devretmesiyle, teknoloji devinin geleceğine bir mühendis liderlik edecek.

Yazar The Newsight 3 Dk. Okuma

ChatGPT: “DeepSeek henüz bana doğrudan bir tehdit değil.”

DeepSeek'in teknoloji sektörü ve piyasalar üzerinde yarattığı etkiye dair görüşü, sesi çıkmayan birinden aldık: ChatGPT.

Yazar Duygu Su Ocakoğlu 5 Dk. Okuma

Dijital Leviathan ve sürdürülebilir toplum sözleşmesi

Devletin mutlak gücünü betimlemek üzere üretilen Leviathan metaforu, günümüzde bir "dijital otorite"ye dönüşüyor.

Yazar Arda Öztaşkın 5 Dk. Okuma

2025’te IT departmanının fonksiyonu değişiyor

Gelişimin bir adım önünde olmalarını gerektiren görev tanımıyla IT departmanı 2025'te de evrim geçiriyor...

Yazar The Newsight 5 Dk. Okuma

Dünyanın en büyük çip üreticisi TSMC’den ABD’ye 100 milyar dolar

Dünyanın en büyük çip üreticisi Taiwan Semiconductor Manufacturing Co (TSMC), önümüzdeki dört yıl içinde ABD'ye…

Yazar The Newsight 3 Dk. Okuma

Gallup Küresel İş Gücü 2026: Rekabet, liderlik kalitesi üzerinden şekilleniyor.

Gallup State of the Global Workplace 2026, ekonomik krize rağmen çalışan beklentilerinin hız kesmeden yükseldiğini…

Yazar The Newsight 5 Dk. Okuma
The Newsight

İş dünyası haberleri, pazarlama ve kurumsal iletişim stratejileri, sektörel içgörüler, araştırma analizleri ve konularında uzman yazarlardan düşünce yazıları.

Bağlantılar

  • Gizlilik ve Kişisel Veri Politikası
  • Kişisel Verilerin Korunması Kanunu Kapsamında Açık Rıza Beyanı

Bilgiler

  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği

DSAB Yayın Yapım Tanıtım Organizasyon Bilişim Ticaret Limited Şirketi © 2024