The NewsightThe NewsightThe Newsight
Bildirim
Font Büyüklüğünü DeğiştirAa
  • Haberler
  • Insight
  • Foresight
  • Nedir?
Font Büyüklüğünü DeğiştirAa
The NewsightThe Newsight
Arama
  • Haberler
  • Insight
  • Foresight
  • Nedir?

Yeni Yazılar

Müşteri segmentasyonunda RFM analizi nedir?

Google’dan metin, görsel ve videoyu birleştiren Gemini Omni

Net tavsiye skoru: Müşteri bağlılığının finansal performans ve operasyonel verimlilikle bağı

Bugünün yatırımcılarının bilmesi gereken 15 kritik kavram

Müşteri çaba skoru nedir? Hizmet deneyiminde “zahmetsizlik” ölçümü

Takip Edin
  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği
The Newsight © 2026
The Newsight > Haberler > Google’dan metin, görsel ve videoyu birleştiren Gemini Omni
Haberler

Google’dan metin, görsel ve videoyu birleştiren Gemini Omni

Yazar The Newsight Mayıs 22, 2026
Paylaş
3 Dk. Okuma
Paylaş
Yapay zeka ile özetle
▾

Google, üretken yapay zeka modeli ailesi Gemini için geliştirdiği yeni multimodal modelini duyurdu. “Gemini Omni” adı verilen yeni sistem, teknoloji devinin açıklamasına göre; metin, görsel, video ve ses girdilerini birlikte işleyerek video üretimi ve düzenleme yapabiliyor.

İçindekiler
Doğal dil ile video düzenleme dönemiGemini’ın bilgi altyapısı video üretimine taşınıyorFarklı girdi türlerini tek bir videoda birleştirebiliyorDijital avatar özelliği geliyorŞeffaflık ve güvenlik vurgusu

Şirket, Gemini Omni’nin ilk sürümü olan “Gemini Omni Flash” modelinin kademeli olarak Gemini uygulaması, Google Flow ve YouTube Shorts platformlarında kullanıma sunulacağını açıkladı. İlk aşamada video üretimine odaklanan modelin, ilerleyen dönemde görsel ve ses çıktıları da desteklemesi planlanıyor.


Doğal dil ile video düzenleme dönemi

Google’ın paylaştığı bilgilere göre Gemini Omni’nin öne çıkan özelliklerinden biri, kullanıcıların videoları doğal dil komutlarıyla düzenleyebilmesi… Kullanıcılar bir videodaki karakterleri, ortamı, aksiyonu veya görsel stili sohbet benzeri komutlarla değiştirebiliyor.

Şirket, modelin önceki düzenlemeleri “hatırlayabildiğini”, sahne tutarlılığını koruyabildiğini ve fiziksel hareketleri daha gerçekçi şekilde işleyebildiğini belirtiyor. Bu sayede aynı sahne üzerinde çok aşamalı düzenlemeler yapılabiliyor.

Google ayrıca kullanıcıların mevcut videolar üzerinde değişiklik yapabileceğini; yeni karakterler, objeler veya farklı sahne akışları ekleyebileceğini ifade ediyor.


Gemini’ın bilgi altyapısı video üretimine taşınıyor

Google’a göre Gemini Omni yalnızca gerçekçi görüntüler üretmeyi değil, aynı zamanda bağlamı anlamayı ve hikaye akışını kurgulamayı hedefliyor. Şirket, modelin fizik kuralları, tarih, bilim ve kültürel bağlam gibi alanlardaki Gemini bilgi altyapısından yararlandığını söylüyor.

Bu kapsamda modelin:

  • Yer çekimi, hareket ve akışkan dinamikleri gibi fiziksel süreçleri daha doğru simüle edebildiği,
  • Metin ve görsel arasındaki anlamsal ilişkiyi daha gelişmiş şekilde kurabildiği,
  • Karmaşık fikirleri kısa komutlardan açıklayıcı videolara dönüştürebildiği iddia ediliyor.


Farklı girdi türlerini tek bir videoda birleştirebiliyor

Gemini Omni; görsel, video, ses ve metin referanslarını bir araya getirerek tek bir çıktı üretebiliyor. İlk aşamada yalnızca ses referansları desteklenecek olsa da Google, ilerleyen süreçte farklı ses girdilerinin de sisteme ekleneceğini belirtiyor.

Kullanıcılar; karakter çizimleri, sahne görselleri veya mevcut videoları referans olarak kullanarak yeni içerikler oluşturabiliyor. Şirket ayrıca stil, hareket ve efekt tanımlarının hem örnek içeriklerle hem de yazılı komutlarla yapılabileceğini aktarıyor.


Dijital avatar özelliği geliyor

Google, “Avatar” adı verilen yeni özellikle kullanıcıların kendi dijital versiyonlarını oluşturabileceğini açıkladı. Bu sistem sayesinde kullanıcılar kendi sesleriyle ve görünümlerine benzeyen yapay zeka destekli videolar üretebilecek.

Şirket, ses ve konuşma düzenleme tarafında ise güvenlik ve kötüye kullanım riskleri nedeniyle çalışmaların sürdüğünü vurguluyor.


Şeffaflık ve güvenlik vurgusu

Google, Gemini Omni ile oluşturulan tüm videolarda “SynthID” isimli görünmez dijital filigran teknolojisinin kullanılacağını belirtti. Şirket, bu sistem sayesinde içeriklerin yapay zekayla üretildiğinin doğrulanabileceğini ifade ediyor.

Google ayrıca Gemini uygulaması, Chrome’daki Gemini entegrasyonu ve Google Arama üzerinden içerik doğrulama araçlarının sunulacağını açıkladı.

Şirketin blog paylaşımı, yapay zeka ile üretilen içeriklerin internet genelinde daha şeffaf biçimde işaretlenmesine yönelik çalışmaların sürdüğünü de ortaya koyuyor.


Buna da göz atın: LinkedIn “AI Slop”a karşı harekete geçti

ETİKET:DünyaTeknoloji

Güncel Kalın

İş dünyasından en güncel haberler, sektörel analizler ve ilham verici içerikler için sosyal medya hesaplarımızı takip edin.

Popüler

Oyunlara yönelik düzenleme meclisten geçti, peki şimdi neler değişecek?

Musk x OpenAI davasında ilk gün tamamlandı

Sosyal Etki Zirvesi: Eşitliğin karnesi, dayanışmanın gücü

Tedarik zincirinde kamçı etkisi (bullwhip effect): Talep dalgalanmalarının operasyonel maliyeti

İlgili Yazılar

OpenAI’ya ABD Savunma Bakanlığı’ndan $200 milyonluk sözleşme

ABD Savunma Bakanlığı, OpenAI ile ulusal güvenlik amaçlı yapay zeka prototipleri geliştirmek üzere 200 milyon…

Yazar The Newsight 2 Dk. Okuma

Meta, AI botların birbiriyle sosyalleştiği ağ Moltbook’u satın aldı

Meta, yapay zeka botlarının birbiriyle iletişim kurabildiği sosyal ağ platformu Moltbook'u satın aldı.

Yazar The Newsight 4 Dk. Okuma

Nvidia, sadece çip üreticisi olmanın ötesine geçiyor

Nvidia, mühendislerin doğrudan kullanabilmesi için ileri seviye açık kaynak yapay zeka paketi Nemotron 3'ü duyurdu.

Yazar The Newsight 5 Dk. Okuma

2025 açıkhava reklamcılığının (OOH) yılı olacak

Açıkhava reklamcılığının kendini teknolojiyle birlikte yenilemesi, reklamcılığın sınırlarını yeniden çizmeye devam edeceğini ortaya koyuyor.

Yazar The Newsight 5 Dk. Okuma

Küresel eğitimde alarm: Öğrencilerin ilk sorunu ruh sağlığı

Dünyada eğitim sistemlerine duyulan güven sınırlı ve gençlerin karşı karşıya olduğu en büyük sorun ruh…

Yazar The Newsight 5 Dk. Okuma

Papa Francis 88 yaşında hayatını kaybetti

Avrupa dışından seçilen ilk Papa olan Papa Francis; kapsayıcılık, şeffaflık ve sevgiyle sürdürdüğü yıllarının ardından…

Yazar The Newsight 2 Dk. Okuma
The Newsight

İş dünyası haberleri, pazarlama ve kurumsal iletişim stratejileri, sektörel içgörüler, araştırma analizleri ve konularında uzman yazarlardan düşünce yazıları.

Bağlantılar

  • Gizlilik ve Kişisel Veri Politikası
  • Kişisel Verilerin Korunması Kanunu Kapsamında Açık Rıza Beyanı

Bilgiler

  • Hakkımızda
  • Künye ve İletişim
  • Reklam ve İş Birliği

DSAB Yayın Yapım Tanıtım Organizasyon Bilişim Ticaret Limited Şirketi © 2024