GPT-4o, iddialı görsel üretim yeteneklerini duyurdu

Yapay zeka ile özetle

▾

OpenAI, GPT-4o modelinin yeni nesil görüntü oluşturma yeteneklerini tüm ChatGPT kullanıcılarının erişimine sundu. Ücretsiz kullanıcılar dahil herkesin kullanımına açılan bu model, önceki sürümlerine kıyasla önemli iyileştirmelerle dikkat çekiyor. Modelin yeteneklerini ilk elden deneyimlemek üzere, bu haberin kapağını da GPT-4o’dan tasarlamasını talep ettik…

İçindekiler

Gelişmiş karakter tutarlılığı ve detay algısı Daha fazla kullanıcı deneyimi Şimdiden online dünyanın gündeminde

DALL-E 3’ün yerini alan GPT-4o, özellikle metin yerleştirme ve bağlam algısı konularında öne çıkıyor. 3 gün önce gerçekleştirdikleri canlı yayınla GPT-4o’nun görsel yeteneklerini aktaran OpenAI CEO’su Sam Altman’ın yanı sıra kurumun liderlik ekibinde yer alan Gabriel Goh, Prafulla Dhariwal, Lu Liu, Allan Jabri, ve Mengchao Zhong, GPT-4o’nun yeteneklerine dair örnekler verdi: Yayında tabelalar, reklam panoları, restoran menüleri ve afişler gibi çeşitli tasarımlarda, modelin metinleri bağlamı dikkate alarak doğru şekilde yerleştirmesiyle artık daha tutarlı ve okunabilir hale geldiği belirtiliyor. Bunun yanı sıra, OpenAI sözcüleri, kullanıcıların ayrıca görüntüler üzerinde özel metin ekleyerek kişiselleştirilmiş tasarımlar yapabileceğini vurguluyor.

Gelişmiş karakter tutarlılığı ve detay algısı

Altman ve ekibinin belirttiği bir diğer yenilik ise karakter ve nesne tasarımlarındaki tutarlılığın artırılması. Örneğin, kullanıcıların belirlediği bir karakter, artık farklı pozlar veya sahnelerde aynı görünümü koruyabiliyor. Daha önce yaşanan renk kaymaları veya form değişiklikleri gibi sorunların büyük ölçüde giderilmesi, tasarımlar üzerinde daha yüksek bir kontrol sağlıyor.

Bununla birlikte model, karmaşık matematiksel ifadeler, tablolar ve çok dilli metinler üzerinde hala sınırlı bir doğruluk oranına sahip. Kullanıcıların özellikle teknik içerik üretiminde bu tür küçük hatalarla karşılaşabileceği belirtiliyor.

Daha fazla kullanıcı deneyimi

YouTube videosunda vurgulanan detaylara göre, GPT-4o yalnızca teknik iyileştirmeler sunmakla kalmıyor; aynı zamanda yaratıcı projelere daha fazla özgürlük sağlıyor. Özellikle mimari tasarım, konsept sanat ve sosyal medya içerikleri için modelin sağladığı esneklik, profesyonellerin ve amatörlerin ilgisini çekebilir. Örneğin, bir mimar, tasarladığı binanın dış cephe tasarımını veya afişlerde kullanılacak yazı tiplerini, doğrudan model üzerinde test edebiliyor.

Sonuç olarak, GPT-4o, metin-görsel entegrasyonu ve detay işleme yeteneğiyle yaratıcı projeler için yeni bir dönemin kapısını aralıyor. Bu yenilikler, kullanıcıların içerik üretim sürecini daha verimli ve kişiselleştirilmiş hale getirirken, yapay zekânın kullanım alanlarını genişletiyor.

Şimdiden online dünyanın gündeminde

Açıklanmasının üzerinden henüz 3 gün geçmesine rağmen GPT-4o görsel yetenekleri online platformlarda büyük ses getirdi. En öne çıkan trendlerden bir tanesi ise GPT-4o’nun Japonya merkezli, ikonik animasyon stüdyosu Studio Ghibli’nin ve bu stüdyonun kurucusu efsanevi çizer ve yönetmen Hayao Miyazaki’nin tarzını kopyalayabilmesi oldu. Kullanıcılar tarafından şimdiden çokça kullanılan özelliklerin yayılması o kadar hızlı oldu ki, stüdyoya OpenAI’ya dava açma hakkının doğduna dair yorumlar çoktan yapıldı ve yayıldı…

Dava süreci henüz bir ihtimalden ibaret olup, aralarında olimpik atletimiz Yusuf Dikeç’in bu yaza damga vuran performansının da bulunduğu popüler kişi ve olayların Studio Ghibli tarzında yeniden yaratılması, görsel üretim süreçlerinin halihazırda süregelen hızlı dönüşümünün daha da ivme kazandığına bir işaret olarak yorumlanabilir.

Studio Ghibli tarzının yanı sıra grafik tasarımı, diyagramlar, ürün görselinden reklam afişi/kampanyası yaratma gibi özellikleri bulunan GPT-4o ile yaratılan görsellere göz atın:

It's been 24 hours since OpenAI unexpectedly shook the AI image world with 4o image generation.

Here are the 14 most mindblowing examples so far (100% AI-generated):

1. Studio ghibli style memespic.twitter.com/E38mBnPnQh
— Barsee 🐶 (@heyBarsee) March 26, 2025