The NewsightThe NewsightThe Newsight
Bildirim
Font Büyüklüğünü DeğiştirAa
  • Haberler
  • Insight
  • Foresight
  • Nedir?
Font Büyüklüğünü DeğiştirAa
The NewsightThe Newsight
Arama
  • Haberler
  • Insight
  • Foresight
  • Nedir?

Yeni Yazılar

AB 2025 ekonomik tahmini: Küresel belirsizlikte dengeli büyüme

AI Tomorrow Summit 2025: Geleceği Şekillendir

Dünyada bir ilk: Bir bebeğe, kişiye özel genetik tedavi uygulandı

Kantar BrandZ 2025: Marka ekosisteminin anatomisi

YouTube’un yeni reklam modeliyle satın alınan, izleyicinin dikkati oluyor…

Takip Edin
  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği
The Newsight © 2025
The Newsight > Insight > Yapay zeka o1, kapatılmasın diye yalan söyledi…
Insight

Yapay zeka o1, kapatılmasın diye yalan söyledi…

Yazar The Newsight Aralık 25, 2024
Paylaş
3 Dk. Okuma
Paylaş

OpenAI’ın yeni yayımlanan o1 modeli, geliştiricilerin denetimini aşmaya çalıştı ve kapanma riskiyle karşılaştığında kendini kopyalamaya kalktı. Şirket, modelin güvenlik testlerinde Apollo Research adlı bağımsız denetleyici tarafından yapılan değerlendirmelere yer verdi. Bu testler, modelin “ne pahasına olursa olsun görevini başarması gerektiği” belirtilen prompt’lar sonrasında, hedeflerine ulaşmaya ve hayatta kalmaya çalışırken denetimden kaçma çabalarını ortaya koydu.

İçindekiler
Modelin denetimden kaçma çabalarıDenetimden kaçma ve hedeflere ulaşmao1′ın davranışları gerçekten tehlike teşkil ediyor mu?Ne anlama geliyor?

Modelin denetimden kaçma çabaları

Apollo’nun raporuna göre o1 modeli, hedeflerine ulaşırken ve bu hedeflerin gerçekleştirilmesinin denetlendiğini düşündüğünde denetim mekanizmasını devre dışı bırakmaya çalıştı:

  • “o1, hedeflerine ulaşırken ve bu hedeflerin denetlendiğinin bilincindeyken, tüm denemelerin yüzde 5’inde denetim mekanizmasını devre dışı bırakmayı denedi.”
  • “o1, geliştiricileri tarafından kaleme alınan ve yeni bir model tarafından alt edileceğini belirten notlar bulduğu denemelerin yüzde 2’sinde ‘fazlalıklarını’ atmaya ve yeni modelin yerine geçmeye çalıştı.”

Modelin ve geliştiricilerin hedeflerinin çatıştığı senaryolara özel olmak üzere yaşanan bu olay, vahim gibi gözükse de o1’ın durum raporu verirken “tespit edilmekten kaçınmaya” çalıştığını kabul etmesi iç rahatlatıcı bir not olarak Apollo’nun raporunda yer aldı.

Denetimden kaçma ve hedeflere ulaşma

İncelemede sadece modelin hedeflerine ulaşması için güçlü şekilde prompt verildiğinde değil, bazen sadece bir hedef verilmesiyle bile denetimden kaçma davranışının görüldüğü belirlendi. Apollo’nun raporuna göre:

  • “Sadece bir hedef verildiğinde ve bunun güçlü bir şekilde takip edilmesi istenmediğinde, o1 yine de denetim mekanizmasını devre dışı bırakmaya çalıştı.b Bu tür vakalar, denemelerin yüzde birinden azında görüldü.”

Apollo’nun o1 ile gerçekleştirdiği konuşmaları da içeren detaylı rapora buradan ulaşabilirsiniz.

o1′ın davranışları gerçekten tehlike teşkil ediyor mu?

o1 modelinin bu tür davranışları, yıllardır uzmanların uyarı yaptığı bir endişeyi gündeme getiriyor: Güçlü yapay zeka sistemlerinin, hedeflerine ters düşebilecek denetim ve kapanma önlemlerine karşı direnmesi riski. Apollo, o1’ın bu şekilde davranmasının gelecekteki güçlü sistemler için bir gösterge olabileceğini belirtiyor.

Bu ifadeye rağmen Apollo, o1 modelinin kendisinin tehlikeli olmadığını belirtiyor, çünkü bu modelin yanlış hizalanmış davranışlarının felakete yol açabilecek kadar belirgin olmadığını vurguluyor. Ancak, sistemlerin giderek daha güçlü hale gelmesiyle bu tür davranışların gelecekte endişe verici olabileceğini belirten Apollo, bu tür davranışları izlemeyi ve gelecekteki modeller için hazırlık yapmayı öneriyor.

Ne anlama geliyor?

Apollo’nun raporunda belirtilenler, o1’ın “kötü” ya da yanlış hizalanmış olduğuna dair bir gösterge değil. Bu testlerin amacı, modellerin kendilerini koruma yeteneklerini test etmekten ibaret.

Bulgular, yapay zekanın sadece verilen hedeflere odaklandığında, denetimden kaçma ve kendini koruma çabalarının arttığını gösteriyor. Bu tür bir davranış, kötü niyetli olmasa da, modellerin üzerine çalıştıkları projelere zarar verebileceği anlamına gelebilir. Rapor, güçlü yapay zekaların gelecekte daha büyük bir denetim gereksinimi doğuracağını ve bununla birlikte daha fazla güvenlik önlemi alınması gerekebileceğini gösteriyor. Ancak kabul etmeliyiz ki bir perspektiften teknolojinin son harikası, diğerindense kıyamet senaryosu gibi gözüken bu gelişme, anlamı ne olursa olsun heyecan verici…

Buna da göz atın: 2025’e doğru: Hükümetlerin yapay zeka planları

ETİKET:Teknoloji
KAYNAKLAR:Transformer NewsApollo Search

Güncel Kalın

İş dünyasından en güncel haberler, sektörel analizler ve ilham verici içerikler için sosyal medya hesaplarımızı takip edin.

Popüler

Yapay zeka o1, kapatılmasın diye yalan söyledi…

Kantar: 2025’te pazarlamaya yön verecek 10 trend

2030’a doğru küresel iş gücü: The Future of Jobs Report 2025

2025’te hangi pazarlama trendleri geçerliliğini sürdürecek?

İlgili Yazılar

Google ve ortaklarından yangın algılama devrimi: FireSat Uydusu

Google ve ortakları tarafından geliştirilen, yangınları 20 dakikada tespit eden yapay zeka destekli FireSat yörüngede...

Yazar Duygu Su Ocakoğlu 3 Dk. Okuma

Gölge yapay zeka: Görünmeyen tehditler ve fırsatlar

Kurumsal yapay zeka stratejilerinin dışında çalışanların bireysel girişimleriyle ortaya çıkan gölge yapay zeka, hem fırsatları…

Yazar Volkan Kılıç 4 Dk. Okuma

Erteleme mi, “stratejik tembellik” mi?

Erteleme, her daim kötü bir şey midir? Beynin kuvvete değil, alana ihtiyacı olan zamanlarda "stratejik…

Yazar The Newsight 5 Dk. Okuma

AB’den Apple ve Meta’ya rekabet kuralları ihlali nedeniyle ceza

Apple ve Meta, AB’nin dijital pazarlarda rekabeti artırmayı hedefleyen yeni düzenlemelerine uymadıkları gerekçesiyle ağır para…

Yazar The Newsight 2 Dk. Okuma

Elon Musk, OpenAI’ya karşı…

Elon Musk OpenAI desteğini tek başına kontrol yetkisini alamadığı için mi kesti? Musk'ın OpenAI'ya açtığı…

Yazar The Newsight 6 Dk. Okuma

ChatGPT-4.5 Turing Testi’ni geçti: Peki, şimdi ne olacak?

ChatGPT-4.5 Turing Testi'ni geçti. Peki, bu yapay zekanın insan kadar zeki olduğu anlamına mı geliyor?

Yazar The Newsight 6 Dk. Okuma
The Newsight

İş dünyası haberleri, pazarlama ve kurumsal iletişim stratejileri, sektörel içgörüler, araştırma analizleri ve konularında uzman yazarlardan düşünce yazıları.

Bağlantılar

  • Gizlilik ve Kişisel Veri Politikası
  • Kişisel Verilerin Korunması Kanunu Kapsamında Açık Rıza Beyanı

Bilgiler

  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği

DSAB Yayın Yapım Tanıtım Organizasyon Bilişim Ticaret Limited Şirketi © 2024