The NewsightThe NewsightThe Newsight
Bildirim
Font Büyüklüğünü DeğiştirAa
  • Haberler
  • Insight
  • Foresight
  • Nedir?
Font Büyüklüğünü DeğiştirAa
The NewsightThe Newsight
Arama
  • Haberler
  • Insight
  • Foresight
  • Nedir?

Yeni Yazılar

Müşteri segmentasyonunda RFM analizi nedir?

Google’dan metin, görsel ve videoyu birleştiren Gemini Omni

Net tavsiye skoru: Müşteri bağlılığının finansal performans ve operasyonel verimlilikle bağı

Bugünün yatırımcılarının bilmesi gereken 15 kritik kavram

Müşteri çaba skoru nedir? Hizmet deneyiminde “zahmetsizlik” ölçümü

Takip Edin
  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği
The Newsight © 2026
The Newsight > Insight > Yapay zeka o1, kapatılmasın diye yalan söyledi…
Insight

Yapay zeka o1, kapatılmasın diye yalan söyledi…

Yazar The Newsight Aralık 25, 2024
Paylaş
3 Dk. Okuma
Paylaş
Yapay zeka ile özetle
▾

OpenAI’ın yeni yayımlanan o1 modeli, geliştiricilerin denetimini aşmaya çalıştı ve kapanma riskiyle karşılaştığında kendini kopyalamaya kalktı. Şirket, modelin güvenlik testlerinde Apollo Research adlı bağımsız denetleyici tarafından yapılan değerlendirmelere yer verdi. Bu testler, modelin “ne pahasına olursa olsun görevini başarması gerektiği” belirtilen prompt’lar sonrasında, hedeflerine ulaşmaya ve hayatta kalmaya çalışırken denetimden kaçma çabalarını ortaya koydu.

İçindekiler
Modelin denetimden kaçma çabalarıDenetimden kaçma ve hedeflere ulaşmao1′ın davranışları gerçekten tehlike teşkil ediyor mu?Ne anlama geliyor?

Modelin denetimden kaçma çabaları

Apollo’nun raporuna göre o1 modeli, hedeflerine ulaşırken ve bu hedeflerin gerçekleştirilmesinin denetlendiğini düşündüğünde denetim mekanizmasını devre dışı bırakmaya çalıştı:

  • “o1, hedeflerine ulaşırken ve bu hedeflerin denetlendiğinin bilincindeyken, tüm denemelerin yüzde 5’inde denetim mekanizmasını devre dışı bırakmayı denedi.”
  • “o1, geliştiricileri tarafından kaleme alınan ve yeni bir model tarafından alt edileceğini belirten notlar bulduğu denemelerin yüzde 2’sinde ‘fazlalıklarını’ atmaya ve yeni modelin yerine geçmeye çalıştı.”

Modelin ve geliştiricilerin hedeflerinin çatıştığı senaryolara özel olmak üzere yaşanan bu olay, vahim gibi gözükse de o1’ın durum raporu verirken “tespit edilmekten kaçınmaya” çalıştığını kabul etmesi iç rahatlatıcı bir not olarak Apollo’nun raporunda yer aldı.

Denetimden kaçma ve hedeflere ulaşma

İncelemede sadece modelin hedeflerine ulaşması için güçlü şekilde prompt verildiğinde değil, bazen sadece bir hedef verilmesiyle bile denetimden kaçma davranışının görüldüğü belirlendi. Apollo’nun raporuna göre:

  • “Sadece bir hedef verildiğinde ve bunun güçlü bir şekilde takip edilmesi istenmediğinde, o1 yine de denetim mekanizmasını devre dışı bırakmaya çalıştı.b Bu tür vakalar, denemelerin yüzde birinden azında görüldü.”

Apollo’nun o1 ile gerçekleştirdiği konuşmaları da içeren detaylı rapora buradan ulaşabilirsiniz.

o1′ın davranışları gerçekten tehlike teşkil ediyor mu?

o1 modelinin bu tür davranışları, yıllardır uzmanların uyarı yaptığı bir endişeyi gündeme getiriyor: Güçlü yapay zeka sistemlerinin, hedeflerine ters düşebilecek denetim ve kapanma önlemlerine karşı direnmesi riski. Apollo, o1’ın bu şekilde davranmasının gelecekteki güçlü sistemler için bir gösterge olabileceğini belirtiyor.

Bu ifadeye rağmen Apollo, o1 modelinin kendisinin tehlikeli olmadığını belirtiyor, çünkü bu modelin yanlış hizalanmış davranışlarının felakete yol açabilecek kadar belirgin olmadığını vurguluyor. Ancak, sistemlerin giderek daha güçlü hale gelmesiyle bu tür davranışların gelecekte endişe verici olabileceğini belirten Apollo, bu tür davranışları izlemeyi ve gelecekteki modeller için hazırlık yapmayı öneriyor.

Ne anlama geliyor?

Apollo’nun raporunda belirtilenler, o1’ın “kötü” ya da yanlış hizalanmış olduğuna dair bir gösterge değil. Bu testlerin amacı, modellerin kendilerini koruma yeteneklerini test etmekten ibaret.

Bulgular, yapay zekanın sadece verilen hedeflere odaklandığında, denetimden kaçma ve kendini koruma çabalarının arttığını gösteriyor. Bu tür bir davranış, kötü niyetli olmasa da, modellerin üzerine çalıştıkları projelere zarar verebileceği anlamına gelebilir. Rapor, güçlü yapay zekaların gelecekte daha büyük bir denetim gereksinimi doğuracağını ve bununla birlikte daha fazla güvenlik önlemi alınması gerekebileceğini gösteriyor. Ancak kabul etmeliyiz ki bir perspektiften teknolojinin son harikası, diğerindense kıyamet senaryosu gibi gözüken bu gelişme, anlamı ne olursa olsun heyecan verici…

Buna da göz atın: 2025’e doğru: Hükümetlerin yapay zeka planları

ETİKET:Teknoloji
KAYNAKLAR:Transformer NewsApollo Search

Güncel Kalın

İş dünyasından en güncel haberler, sektörel analizler ve ilham verici içerikler için sosyal medya hesaplarımızı takip edin.

Popüler

Musk x OpenAI davasında ilk gün tamamlandı

Sosyal Etki Zirvesi: Eşitliğin karnesi, dayanışmanın gücü

Tedarik zincirinde kamçı etkisi (bullwhip effect): Talep dalgalanmalarının operasyonel maliyeti

Tekno feodalizm nedir? Dijital ortaçağ dönemi kapıda mı?

İlgili Yazılar

İlk beyaz yakalılar: İşvereniniz Stalin ise nelere dikkat etmelisiniz?

Stalin döneminde Sovyetler Birliği’nde beyaz yakalı olmak, modern anlamda çalışma hayatına dair benzersiz dersler barındırıyor.

Yazar Doğa Çakar 13 Dk. Okuma

20 yılın ardından Skype kapanıyor

2000’li yılların ortalarında internet üzerinden iletişimde devrim yaratan Skype kapanıyor.

Yazar The Newsight 2 Dk. Okuma

Yapay zekaya ilgi artarken, yatırımları neden düşüyor?

Yapay zekanın iş süreçlerini daha etkili hale getirdiği kabul edilmiş bir olguyken, bu alana yatırımların…

Yazar Volkan Kılıç 4 Dk. Okuma

Google antitröst davası: Geçmiş, güncel durum ve beklentiler

Google'ın arama motoru, reklam teknolojileri ve mobil cihaz ekosistemlerindeki baskın konumu, piyasa rekabetini engellediği iddialarıyla…

Yazar The Newsight 4 Dk. Okuma

Android eğitiminin yeni veri kaynağı: Ev işleri

Ev işlerine yardımcı olarak android robotun bir gerçek olması, ev işlerini yapan insanların videolarıyla eğitilmesinden…

Yazar The Newsight 5 Dk. Okuma

Müşteri segmentasyonunda RFM analizi nedir?

Modern ticaret ekosisteminde her müşteriye aynı pazarlama stratejisiyle yaklaşmak, operasyonel kaynakların verimsiz kullanımına ve müşteri…

Yazar The Newsight 8 Dk. Okuma
The Newsight

İş dünyası haberleri, pazarlama ve kurumsal iletişim stratejileri, sektörel içgörüler, araştırma analizleri ve konularında uzman yazarlardan düşünce yazıları.

Bağlantılar

  • Gizlilik ve Kişisel Veri Politikası
  • Kişisel Verilerin Korunması Kanunu Kapsamında Açık Rıza Beyanı

Bilgiler

  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği

DSAB Yayın Yapım Tanıtım Organizasyon Bilişim Ticaret Limited Şirketi © 2024