Çin merkezli teknoloji devi Alibaba, yapay zeka alanındaki rekabeti kızıştıracak yeni büyük dil modeli (LLM) Qwen2.5-Max’i duyurdu. Şirket, bu modelin mevcut en güçlü yapay zeka modellerinden OpenAI’ın GPT-4o, DeepSeek’in V3 ve Meta’nın Llama-3.1-405B gibi alternatifleriyle yarıştığını ve bazı ölçütlerde onları geride bıraktığını belirtiyor. Peki, Qwen2.5-Max hangi özellikleriyle öne çıkıyor ve nasıl kullanılıyor?
Qwen2.5-Max’in özellikleri
Yeni model, birçok yapay zeka modelinde olduğu gibi geniş kapsamlı bir eğitim sürecinden geçti. Alibaba, Qwen2.5-Max’in aşağıdaki özellikleriyle öne çıktığını belirtiyor:
- Mixture-of-Experts (MoE) Mimarisi: Modelin, tüm olası opsiyonları kullanmaktan ziyade, yalnızca ilgili alt ağları aktif hale getirerek daha verimli çalıştığı vurgulanıyor. Bu sayede büyük bir model olmasına rağmen gereksiz işlem yükünü azaltarak enerji tasarrufu sağladığının altı çiziliyor.
- Geniş Kapsamlı Eğitim Verisi: 20 trilyondan fazla token ile eğitilen modelin, farklı dillerde ve çeşitli konularda güçlü bir anlama ve üretim yeteneğine sahip olduğu belirtiliyor.
- Mantık Yürütme ve Uzun Metin Anlama: Alibaba, Qwen2.5-Max’in karmaşık mantık problemlerini çözme, uzun belgeleri analiz etme ve bağlam bütünlüğünü koruyarak daha tutarlı cevaplar verme konusunda gelişmiş performans gösterdiğini vurguluyor.
- Kodlama ve Programlama Yetkinliği: Model, yazılım uygulamalarının performansını ve doğruluğunu değerlendirmek için kullanılan, otomatikleştirilmiş LiveCodeBench testlerinde önemli başarılar elde ederek kodlama konusunda GPT-4o ve diğer rakiplerine yakın bir performans sergiledi.
- Benchmark Performansı: Qwen2.5-Max’in; MMLU-Pro, LiveCodeBench, LiveBench ve Arena-Hard gibi testlerde DeepSeek V3’ü geride bırakarak güçlü bir yapay zeka modeli olduğu belirtiliyor.
- Erişim: Geliştiriciler, Qwen2.5-Max’e Alibaba Cloud hizmetleri aracılığıyla erişebilecek ve model, Qwen Chat platformu üzerinden de kullanılabilecek.
Ne anlama geliyor?
Alibaba’nın Qwen2.5-Max modeli, Çin merkezli yapay zeka teknolojilerinin küresel pazardaki rekabet gücünü artırmayı hedefliyor. OpenAI, Google ve Meta gibi teknoloji devlerinin geliştirdiği modellerin domine ettiği pazarda, Alibaba’nın güçlü bir rakip olarak konumlandığını gösteriyor. Yapay zeka destekli hizmetler ve uygulamalar için daha fazla seçenek sunulması, kullanıcılar açısından da fayda sağlayabilir. Ancak, modelin erişilebilirliği ve küresel ölçekte nasıl kullanılacağı, DeepSeek’in de yarattığı etkinin yanı sıra, önümüzdeki dönemde netleşecek önemli konular arasında yer alıyor.
Buna da göz atın: ChatGPT: “DeepSeek henüz bana doğrudan bir tehdit değil.”