The NewsightThe NewsightThe Newsight
Bildirim
Font Büyüklüğünü DeğiştirAa
  • Haberler
  • Insight
  • Foresight
  • Nedir?
Font Büyüklüğünü DeğiştirAa
The NewsightThe Newsight
Arama
  • Haberler
  • Insight
  • Foresight
  • Nedir?

Yeni Yazılar

Gartner Pazarlama Sempozyumu: Yapay zeka içeriği artırıyor ama değeri düşürüyor

Anthropic’ten yeni yapay zeka modelleri: Fable 5 ve Mythos 5

Tersine mentörlük nedir; nasıl uygulanır?

Yapay zekanın değer birimi: “Price Per Intelligence” nedir?

WWDC26: Apple, “Siri problemini” çözüyor mu?

Takip Edin
  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği
The Newsight © 2026
The Newsight > Haberler > Google’dan metin, görsel ve videoyu birleştiren Gemini Omni
Haberler

Google’dan metin, görsel ve videoyu birleştiren Gemini Omni

Yazar The Newsight Mayıs 22, 2026
Paylaş
3 Dk. Okuma
Paylaş
Yapay zeka ile özetle
▾

Google, üretken yapay zeka modeli ailesi Gemini için geliştirdiği yeni multimodal modelini duyurdu. “Gemini Omni” adı verilen yeni sistem, teknoloji devinin açıklamasına göre; metin, görsel, video ve ses girdilerini birlikte işleyerek video üretimi ve düzenleme yapabiliyor.

İçindekiler
Doğal dil ile video düzenleme dönemiGemini’ın bilgi altyapısı video üretimine taşınıyorFarklı girdi türlerini tek bir videoda birleştirebiliyorDijital avatar özelliği geliyorŞeffaflık ve güvenlik vurgusu

Şirket, Gemini Omni’nin ilk sürümü olan “Gemini Omni Flash” modelinin kademeli olarak Gemini uygulaması, Google Flow ve YouTube Shorts platformlarında kullanıma sunulacağını açıkladı. İlk aşamada video üretimine odaklanan modelin, ilerleyen dönemde görsel ve ses çıktıları da desteklemesi planlanıyor.


Doğal dil ile video düzenleme dönemi

Google’ın paylaştığı bilgilere göre Gemini Omni’nin öne çıkan özelliklerinden biri, kullanıcıların videoları doğal dil komutlarıyla düzenleyebilmesi… Kullanıcılar bir videodaki karakterleri, ortamı, aksiyonu veya görsel stili sohbet benzeri komutlarla değiştirebiliyor.

Şirket, modelin önceki düzenlemeleri “hatırlayabildiğini”, sahne tutarlılığını koruyabildiğini ve fiziksel hareketleri daha gerçekçi şekilde işleyebildiğini belirtiyor. Bu sayede aynı sahne üzerinde çok aşamalı düzenlemeler yapılabiliyor.

Google ayrıca kullanıcıların mevcut videolar üzerinde değişiklik yapabileceğini; yeni karakterler, objeler veya farklı sahne akışları ekleyebileceğini ifade ediyor.


Gemini’ın bilgi altyapısı video üretimine taşınıyor

Google’a göre Gemini Omni yalnızca gerçekçi görüntüler üretmeyi değil, aynı zamanda bağlamı anlamayı ve hikaye akışını kurgulamayı hedefliyor. Şirket, modelin fizik kuralları, tarih, bilim ve kültürel bağlam gibi alanlardaki Gemini bilgi altyapısından yararlandığını söylüyor.

Bu kapsamda modelin:

  • Yer çekimi, hareket ve akışkan dinamikleri gibi fiziksel süreçleri daha doğru simüle edebildiği,
  • Metin ve görsel arasındaki anlamsal ilişkiyi daha gelişmiş şekilde kurabildiği,
  • Karmaşık fikirleri kısa komutlardan açıklayıcı videolara dönüştürebildiği iddia ediliyor.


Farklı girdi türlerini tek bir videoda birleştirebiliyor

Gemini Omni; görsel, video, ses ve metin referanslarını bir araya getirerek tek bir çıktı üretebiliyor. İlk aşamada yalnızca ses referansları desteklenecek olsa da Google, ilerleyen süreçte farklı ses girdilerinin de sisteme ekleneceğini belirtiyor.

Kullanıcılar; karakter çizimleri, sahne görselleri veya mevcut videoları referans olarak kullanarak yeni içerikler oluşturabiliyor. Şirket ayrıca stil, hareket ve efekt tanımlarının hem örnek içeriklerle hem de yazılı komutlarla yapılabileceğini aktarıyor.


Dijital avatar özelliği geliyor

Google, “Avatar” adı verilen yeni özellikle kullanıcıların kendi dijital versiyonlarını oluşturabileceğini açıkladı. Bu sistem sayesinde kullanıcılar kendi sesleriyle ve görünümlerine benzeyen yapay zeka destekli videolar üretebilecek.

Şirket, ses ve konuşma düzenleme tarafında ise güvenlik ve kötüye kullanım riskleri nedeniyle çalışmaların sürdüğünü vurguluyor.


Şeffaflık ve güvenlik vurgusu

Google, Gemini Omni ile oluşturulan tüm videolarda “SynthID” isimli görünmez dijital filigran teknolojisinin kullanılacağını belirtti. Şirket, bu sistem sayesinde içeriklerin yapay zekayla üretildiğinin doğrulanabileceğini ifade ediyor.

Google ayrıca Gemini uygulaması, Chrome’daki Gemini entegrasyonu ve Google Arama üzerinden içerik doğrulama araçlarının sunulacağını açıkladı.

Şirketin blog paylaşımı, yapay zeka ile üretilen içeriklerin internet genelinde daha şeffaf biçimde işaretlenmesine yönelik çalışmaların sürdüğünü de ortaya koyuyor.


Buna da göz atın: LinkedIn “AI Slop”a karşı harekete geçti

ETİKET:DünyaTeknoloji

Güncel Kalın

İş dünyasından en güncel haberler, sektörel analizler ve ilham verici içerikler için sosyal medya hesaplarımızı takip edin.

Popüler

Müşteri edinme maliyeti nedir? Amortisman analizi nasıl yapılır?

Yakınlık pazarlaması (proximity marketing): Fiziksel mekanın dijital veriyle entegrasyonu

Kurumsal karar alma süreçlerinde “veri obezitesi”

Yazılım geliştirmede “Brook Kanunu” ve verimlilik sınırı

İlgili Yazılar

2024: Teknolojinin dünyayı dönüştürdüğü yıl

2024'te kanser tedavisinden sürdürülebilir enerji çözümlerine kadar uzanan teknoloji merkezli gelişmeler, dünyayı değiştirdi.

Yazar The Newsight 4 Dk. Okuma

Google’dan yeni gizlilik odaklı LLM: VaultGemma

Google, gizlilikten ödün vermediğini belirttiği VaultGemma adlı yeni büyük dil modelini açık kaynaklı olarak yayınladı.

Yazar The Newsight 3 Dk. Okuma

2024 BİT Sektör Raporu: Türkiye’nin teknoloji hamlesi hız kesmiyor

TÜBİSAD ve Deloitte tarafından yayınlanan 2024 Bilgi ve İletişim Teknolojileri (BİT) Sektör Raporu, sektörün performansını…

Yazar The Newsight 2 Dk. Okuma

Amazon, 2033’e kadar 600 bin çalışanı robotlarla değiştirmeyi planlıyor

The New York Times'ın yayınladığı belgelere göre bu hamleyle Amazon iki kat daha fazla ürün…

Yazar The Newsight 2 Dk. Okuma

ChatGPT’ye reklam geliyor: OpenAI, ücretsiz sürümde test etmeye hazırlanıyor

OpenAI, oturum açmış ve 18 yaşından büyük kullanıcılarına reklam göstermeyi test etmeye hazırlanıyor.

Yazar The Newsight 4 Dk. Okuma

Lükste yeni dönem: İkinci el ve kiralama modeli yükseliyor

EY Lüks Tüketim Endeksi 2025 lüks markaların yalnızca yüksek gelir grubuna değil, “ulaşılabilir lüks” arayışındaki…

Yazar The Newsight 3 Dk. Okuma
The Newsight

İş dünyası haberleri, pazarlama ve kurumsal iletişim stratejileri, sektörel içgörüler, araştırma analizleri ve konularında uzman yazarlardan düşünce yazıları.

Bağlantılar

  • Gizlilik ve Kişisel Veri Politikası
  • Kişisel Verilerin Korunması Kanunu Kapsamında Açık Rıza Beyanı

Bilgiler

  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği

DSAB Yayın Yapım Tanıtım Organizasyon Bilişim Ticaret Limited Şirketi © 2024