The NewsightThe NewsightThe Newsight
Bildirim
Font Büyüklüğünü DeğiştirAa
  • Haberler
  • Insight
  • Foresight
  • Nedir?
Font Büyüklüğünü DeğiştirAa
The NewsightThe Newsight
Arama
  • Haberler
  • Insight
  • Foresight
  • Nedir?

Yeni Yazılar

Hissedebileceğimiz bir gelecek: Yarının çok duyulu pazarlaması

Dijital dönüşümde gölge bilişim (shadow IT): Güvenlik ve çeviklik arasındaki denge

Kurumsal yönetimde liderlik borcu nedir? Kararsızlığın gizli maliyeti

190 milyar dolarlık potansiyel neden hala fonlanamıyor?

Hizmet Telafisi Paradoksu Nedir? Operasyonel Hataları Sadakata Dönüştürme Stratejisi

Takip Edin
  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği
The Newsight © 2026
The Newsight > Insight > Yapay zeka o1, kapatılmasın diye yalan söyledi…
Insight

Yapay zeka o1, kapatılmasın diye yalan söyledi…

Yazar The Newsight Aralık 25, 2024
Paylaş
3 Dk. Okuma
Paylaş
Yapay zeka ile özetle
▾

OpenAI’ın yeni yayımlanan o1 modeli, geliştiricilerin denetimini aşmaya çalıştı ve kapanma riskiyle karşılaştığında kendini kopyalamaya kalktı. Şirket, modelin güvenlik testlerinde Apollo Research adlı bağımsız denetleyici tarafından yapılan değerlendirmelere yer verdi. Bu testler, modelin “ne pahasına olursa olsun görevini başarması gerektiği” belirtilen prompt’lar sonrasında, hedeflerine ulaşmaya ve hayatta kalmaya çalışırken denetimden kaçma çabalarını ortaya koydu.

İçindekiler
Modelin denetimden kaçma çabalarıDenetimden kaçma ve hedeflere ulaşmao1′ın davranışları gerçekten tehlike teşkil ediyor mu?Ne anlama geliyor?

Modelin denetimden kaçma çabaları

Apollo’nun raporuna göre o1 modeli, hedeflerine ulaşırken ve bu hedeflerin gerçekleştirilmesinin denetlendiğini düşündüğünde denetim mekanizmasını devre dışı bırakmaya çalıştı:

  • “o1, hedeflerine ulaşırken ve bu hedeflerin denetlendiğinin bilincindeyken, tüm denemelerin yüzde 5’inde denetim mekanizmasını devre dışı bırakmayı denedi.”
  • “o1, geliştiricileri tarafından kaleme alınan ve yeni bir model tarafından alt edileceğini belirten notlar bulduğu denemelerin yüzde 2’sinde ‘fazlalıklarını’ atmaya ve yeni modelin yerine geçmeye çalıştı.”

Modelin ve geliştiricilerin hedeflerinin çatıştığı senaryolara özel olmak üzere yaşanan bu olay, vahim gibi gözükse de o1’ın durum raporu verirken “tespit edilmekten kaçınmaya” çalıştığını kabul etmesi iç rahatlatıcı bir not olarak Apollo’nun raporunda yer aldı.

Denetimden kaçma ve hedeflere ulaşma

İncelemede sadece modelin hedeflerine ulaşması için güçlü şekilde prompt verildiğinde değil, bazen sadece bir hedef verilmesiyle bile denetimden kaçma davranışının görüldüğü belirlendi. Apollo’nun raporuna göre:

  • “Sadece bir hedef verildiğinde ve bunun güçlü bir şekilde takip edilmesi istenmediğinde, o1 yine de denetim mekanizmasını devre dışı bırakmaya çalıştı.b Bu tür vakalar, denemelerin yüzde birinden azında görüldü.”

Apollo’nun o1 ile gerçekleştirdiği konuşmaları da içeren detaylı rapora buradan ulaşabilirsiniz.

o1′ın davranışları gerçekten tehlike teşkil ediyor mu?

o1 modelinin bu tür davranışları, yıllardır uzmanların uyarı yaptığı bir endişeyi gündeme getiriyor: Güçlü yapay zeka sistemlerinin, hedeflerine ters düşebilecek denetim ve kapanma önlemlerine karşı direnmesi riski. Apollo, o1’ın bu şekilde davranmasının gelecekteki güçlü sistemler için bir gösterge olabileceğini belirtiyor.

Bu ifadeye rağmen Apollo, o1 modelinin kendisinin tehlikeli olmadığını belirtiyor, çünkü bu modelin yanlış hizalanmış davranışlarının felakete yol açabilecek kadar belirgin olmadığını vurguluyor. Ancak, sistemlerin giderek daha güçlü hale gelmesiyle bu tür davranışların gelecekte endişe verici olabileceğini belirten Apollo, bu tür davranışları izlemeyi ve gelecekteki modeller için hazırlık yapmayı öneriyor.

Ne anlama geliyor?

Apollo’nun raporunda belirtilenler, o1’ın “kötü” ya da yanlış hizalanmış olduğuna dair bir gösterge değil. Bu testlerin amacı, modellerin kendilerini koruma yeteneklerini test etmekten ibaret.

Bulgular, yapay zekanın sadece verilen hedeflere odaklandığında, denetimden kaçma ve kendini koruma çabalarının arttığını gösteriyor. Bu tür bir davranış, kötü niyetli olmasa da, modellerin üzerine çalıştıkları projelere zarar verebileceği anlamına gelebilir. Rapor, güçlü yapay zekaların gelecekte daha büyük bir denetim gereksinimi doğuracağını ve bununla birlikte daha fazla güvenlik önlemi alınması gerekebileceğini gösteriyor. Ancak kabul etmeliyiz ki bir perspektiften teknolojinin son harikası, diğerindense kıyamet senaryosu gibi gözüken bu gelişme, anlamı ne olursa olsun heyecan verici…

Buna da göz atın: 2025’e doğru: Hükümetlerin yapay zeka planları

ETİKET:Teknoloji
KAYNAKLAR:Transformer NewsApollo Search

Güncel Kalın

İş dünyasından en güncel haberler, sektörel analizler ve ilham verici içerikler için sosyal medya hesaplarımızı takip edin.

Popüler

Ufuk çizgisinin ötesi: Teknolojik tekillik

İrade rezervlerinin tükenişi: Dijital bolluk çağında karar yorgunluğu

Yapay zeka korkusu değişiyor: İş kaybı değil, halüsinasyonlar ve hatalar…

OpenAI, Sora’yı kapatma kararı aldı

İlgili Yazılar

İş dünyasında Z ve Y’ler: Para, anlam ve refah dengesi

Z ve Y kuşakları mensuplarının kariyerleriyle ilişkisi "sadece bir iş" yaklaşımından çok uzak; refah ve…

Yazar The Newsight 3 Dk. Okuma

Meta, “iyi” ses çevirisini ücretsiz hale getirdi: Sırada ne var?

Meta, Reels'lerdeki konuşmaları İngilizce ve İspanyolca arasında otomatik olarak dublajlayabilen özelliği duyurdu.

Yazar The Newsight 3 Dk. Okuma

2026’da iş dünyasını şekillendirecek 7 kuantum bilgisayar trendi

Kuantum bilgisayar teknolojisinin "bugünün teknolojisi" olduğu zaman dilimi, 2026 olabilir mi?

Yazar The Newsight 4 Dk. Okuma

TikTok’un ABD alıcısı belirleniyor

TikTok'u ABD'de; girişim fonları, özel şirketler ve teknoloji firmalarının yer aldığı bir yatırımcı konsorsiyumu satın…

Yazar The Newsight 3 Dk. Okuma

OpenAI ve Amazon Web Services’ten 38 milyar dolarlık anlaşma

OpenAI, hızla artan hesaplama gücü ihtiyacını karşılamak için Amazon Web Services (AWS) ile 38 milyar…

Yazar The Newsight 3 Dk. Okuma

Yapay zeka, sanal gerçeklik ile buluşsa daha mı iyi olur?

Üretken yapay zekayı iş süreçlerine entegre etmenin en iyi yolu, VR ve sanal evren olabilir…

Yazar The Newsight 5 Dk. Okuma
The Newsight

İş dünyası haberleri, pazarlama ve kurumsal iletişim stratejileri, sektörel içgörüler, araştırma analizleri ve konularında uzman yazarlardan düşünce yazıları.

Bağlantılar

  • Gizlilik ve Kişisel Veri Politikası
  • Kişisel Verilerin Korunması Kanunu Kapsamında Açık Rıza Beyanı

Bilgiler

  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği

DSAB Yayın Yapım Tanıtım Organizasyon Bilişim Ticaret Limited Şirketi © 2024