Bilim-Teknoloji

Çin'de Alibaba, Qwen3'ün yeni versiyonunu piyasaya sürdü

Çinli e-ticaret ve teknoloji grubu Alibaba, yapay zeka modeli "Qwen3"ün çok daha ucuza eğitilen ve çok daha fazla performans gösteren açık kaynaklı versiyonunu piyasaya sürdüğünü duyurdu.

Alibaba yapay zeka modeli "Qwen3"ü geliştirmeye devam ediyor. Yeni versiyonu piyasaya sürülen modelin açık kaynaklı versiyonu piyasaya sürüldü.

"Qwen3-Next-80B-A3B" adı verilen modelin, önceki versiyonu "Qwen3-32B"den 10 kat ucuza eğitildiği, buna karşın 10 kat daha güçlü işlem kabiliyetine sahip olduğu belirtildi. Geliştirici ekibi, yayımladığı notta da yeni model mimarisinin performansını maksimize etmeye ve işlem maliyetini azaltmaya yönelik bir dizi yeniliğin sunulduğunu kaydetti.


Bu yeniliklerin arasında uzun metin girdilerini daha kolay işlemeyi sağlayan "hybrid attention" (melez dikkat) ve modeli, belirli alandaki girdileri ele alan ve ayrı alt ağlara bölen "high-sparsity mixture-of-experts" (uzmanların yüksek-seyreklikte karışımı) teknikleri yer alıyor.


Tüketici düzeyi donanımlarda etkin çalışabilecek şekilde optimize edilen 80 milyar parametreli model, sınırlı işlemci gücüyle sağladığı yüksek performansla yapay zekanın yaygın kullanımını daha etkin hale getirebilir.


Akıl yürütme modeli de yeni mimariyle güncellendi

Şirket, Qwen-3'ün akıl yürütme modelini de Next mimarisiyle güncelledi.
"Qwen3-Next-80B-A3B-Thinking" adı verilen model, bağımsız testlerde çok sayıda alanda önceki versiyonu "Qwen3-32B-Thinking"in yanı sıra Google'ın "Gemini-2.5-Flash-Thinking"den daha iyi performans gösterdi.
Qwen3'ün akıl yürütme modeli, daha önce yapılan testlerde ABD'li yapay zeka şirketi OpenAI'ın o1 ve Çinli yapay zeka şirketi DeepSeek'in R1 modellerini yakalayan veya aşan performanslar kaydetmişti.
Alibaba, 600 milyondan 235 milyara kadar parametreye sahip 8 gelişmiş yapay zeka modelinden oluşan Qwen3 ailesini nisan ayında piyasaya sürmüştü.


Şirket, bugüne kadarki en büyük modeli olan 1 trilyon parametreli "Qwen3-Max-Preview" modelini de 8 Eylül'de kullanıma açmıştı. Model, California Üniversitesinin yapay zeka değerlendirme platformu "LMArena" "metin çözümleme" alanında 6. sırada yer almıştı.
Bir yapay zeka modelinin parametre sayısındaki artış, modelin veri kapasitesini artırsa da verileri işlemek için gereken bilgisayar gücü ihtiyacı da arttığından maliyetleri de yükseltiyor.


Çin'de yapay zeka sektörü hızla gelişiyor


Bu yıl Çin'den çıkan iki şirketin açık kaynaklı modeller arasında üstünlük sağlaması, ülkede yapay zeka sektöründeki yoğun rekabeti ve hızlı gelişimi gösteriyor.
Çin'de High-Flyer Quant yatırım fonunun desteklediği DeepSeek, diğer yapay zeka şirketlerine kıyasla düşük maliyetle ve az sayıda çip kullanarak geliştirdiği açık kaynaklı yeni modeli R1'i 20 Ocak'ta piyasaya sürmüştü.
Dünya çapında kısa sürede yoğun şekilde kullanılmaya başlanan yapay zeka modeli, uygulama mağazalarında ABD merkezli ChatGPT'yi de geride bırakarak en fazla indirilen yapay zeka uygulaması olmuştu.