Alibaba, OpenAI’nin GPT-o1’ini Almak İçin QwQ-32B Akıl Yürütme Odaklı Yapay Zeka Modelini Önizlemede Yayınladı

Yayınlama: 29.11.2024

A⁺

A^-

Alibaba Perşembe günü, mantık yeteneği açısından OpenAI’nin GPT-o1 serisi modellerine rakip olacağı söylenen yeni bir yapay zeka (AI) modelini yayınladı. Önizleme aşamasında başlatılan QwQ-32B büyük dil modelinin (LLM), çeşitli matematiksel ve mantıksal akıl yürütmeyle ilgili kıyaslamalarda GPT-o1 önizlemesinden daha iyi performans gösterdiği söyleniyor. Yeni yapay zeka modeli Hugging Face’ten indirilebiliyor ancak tamamen açık kaynaklı değil. Yakın zamanda başka bir Çinli yapay zeka firması, ChatGPT üreticisinin akıl yürütme odaklı temel modellerine rakip olduğu iddia edilen açık kaynaklı bir yapay zeka modeli DeepSeek-R1’i piyasaya sürdü.

Alibaba QwQ-32B Yapay Zeka Modeli

Bir blog yazısında Alibaba, yeni muhakeme odaklı LLM’yi detaylandırdı ve yeteneklerini ve sınırlamalarını vurguladı. QwQ-32B şu anda önizleme olarak mevcuttur. Adından da anlaşılacağı gibi 32 milyar parametre üzerine kuruludur ve 32.000 tokenlik bir bağlam penceresine sahiptir. Model hem eğitim öncesi hem de eğitim sonrası aşamaları tamamlamıştır.

Mimarisine gelince Çinli teknoloji devi, yapay zeka modelinin transformatör teknolojisine dayandığını ortaya çıkardı. Konumsal kodlama için QwQ-32B, Anahtarlamalı Doğrusal Birim (SwiGLU) ve Ortalama Karekök Normalleştirme (RMSNorm) fonksiyonlarının yanı sıra, Dikkat Sorgu-Anahtar-Değer Sapması (Attention QKV) sapması ile birlikte Döner Konum Gömmeleri (RoPE) kullanır.

Tıpkı OpenAI GPT-o1 gibi, AI modeli de bir kullanıcı sorgusunu değerlendirirken ve doğru yanıtı bulmaya çalışırken kendi dahili monologunu gösterir. Bu dahili düşünce süreci, QwQ-32B’nin çeşitli teorileri test etmesine ve nihai cevabı sunmadan önce kendisinin doğruluğunu kontrol etmesine olanak tanır. Alibaba, LLM’nin dahili testler sırasında MATH-500 değerlendirmesinde yüzde 90,6 ve AI Matematiksel Değerlendirme (AIME) değerlendirmesinde yüzde 50 puan aldığını ve OpenAI’nin akıl yürütme odaklı modellerinden daha iyi performans gösterdiğini iddia ediyor.

Özellikle, daha iyi akıl yürütmeye sahip yapay zeka modelleri, modellerin daha akıllı veya yetenekli hale geldiğinin kanıtı değildir. Bu, test süresi hesaplaması olarak da bilinen ve modellerin bir görevi tamamlamak için ek işlem süresi harcamasına olanak tanıyan yeni bir yaklaşımdır. Sonuç olarak yapay zeka daha doğru yanıtlar verebilir ve daha karmaşık soruları çözebilir. Endüstrinin duayenlerinden bazıları, yeni LLM’lerin eski versiyonlarıyla aynı oranda gelişmediğine dikkat çekerek, mevcut mimarilerin bir doyum noktasına ulaştığını öne sürüyor.

QwQ-32B, sorgular üzerinde ek işlem süresi harcadığından çeşitli sınırlamalara da sahiptir. Alibaba, yapay zeka modelinin bazen dilleri karıştırabildiğini veya diller arasında geçiş yaparak dil karıştırma ve kod değiştirme gibi sorunlara yol açabildiğini belirtti. Aynı zamanda muhakeme döngülerine girme eğilimindedir ve matematik ve muhakeme becerileri dışında diğer alanlarda hala iyileştirmeler gerekmektedir.

Alibaba’nın Hugging Face listesi aracılığıyla yapay zeka modelini kullanıma sunması dikkat çekicidir ve hem bireyler hem de şirketler bu modeli Apache 2.0 lisansı kapsamında kişisel, akademik ve ticari amaçlarla indirebilir. Ancak şirket model ağırlıklarını ve verilerini kullanıma sunmadı; bu da kullanıcıların modeli kopyalayamayacağı veya mimarinin nasıl çalıştığını anlayamadığı anlamına geliyor.

Kaynak

ai, ai modeli, alibaba qwq 32b önizleme akıl yürütme yapay zeka modeli openai gpt o1 alibaba, sürmanşet, yapay zeka

Patron

Viyanablog Sitesinin Kurucusuyum.

Benzer Konular

OnlyFans’ın finansmanı, kuantum hızlandırıcılar, WeTransfer kesintileri

Avrupa teknoloji ekosistemindeki en son gelişmeleri tartıştığımız ve sektördeki en ilginç insanlardan bazılarıyla röportajlar yaptığımız program olan TNW Podcast’in yeni bölümüne hoş geldiniz. Bugünkü bölümde Linnea ve Andrii kuantum hızlandırıcılardan, WeTransfer’deki büyük işten çıkarmalardan, hiç var olmamış bir gezegenden ve aradaki birkaç şeyden bahsediyor. Ayrıca duyacaksınız OnlyFans CFO’su Lee...

12.09.2024

yorumlar kapalı

Finlandiya’nın IQM’si şu anda 30 adet tam yığın kuantum bilgisayarı üretti

Çoğu zaman, teknoloji dünyasında bile insanlar kuantum hesaplama terimini neredeyse gizemli bir şeye benzetiyorlar. Ancak kuantum mekaniğinin süperpozisyon ve dolaşma gibi kavramları her ne kadar sihir gibi görünse de, bunlar donanım parçaları üzerinde (kuantum hesaplama bağlamında) hala gerçekleşmektedir. Araştırmalarda atılımlar kuantum hesaplamanın bir teknoloji olarak ölçeklendirilmesinde hayati önem taşıyacak olsa...

17.09.2024

yorumlar kapalı

Amazon Büyük Hint Festivali Sırasında Apple, Samsung, Amazfit ve OnePlus Akıllı Saatlerinde En İyi Teklifler

Amazon Büyük Hint Festivali indirimi Hindistan’da yayında ve akıllı telefonlar, giyilebilir cihazlar, tabletler, dizüstü bilgisayarlar, TV’ler, ev aletleri ve daha fazlası gibi kategorilerde geniş bir ürün yelpazesinde kazançlı fırsatlar sunuyor. Böylece mevcut cihazlarını yenilemek isteyen müşteriler, birden fazla fırsattan yararlanarak istedikleri ürünlere çok daha uygun fiyatlara sahip olabiliyor. Amazon Büyük...

30.09.2024

yorumlar kapalı

MediaTek Dimensity 9400 Yonga Setinin GPU Kıyaslamalarında Apple A18 Pro SoC’yi Geride Bırakacağı Tahmin Ediliyor

MediaTek Dimensity 9400 yonga setinin Ekim ayında piyasaya sürülmesi bekleniyor. Lansman öncesinde, yeni bir sızıntı, mobil platformun grafik işleme biriminin (GPU) hem Apple’ın en son yonga setini hem de amiral gemisi Snapdragon işlemcisini önemli bir farkla geride bıraktığını iddia ediyor. MediaTek Dimensity 9400 SoC’nin Vulcan kıyaslamasında Apple A18 Pro’dan yüzde...

24.09.2024

yorumlar kapalı

iPhone 16 Pro Max Malzeme Listesi, iPhone 15 Pro Max’ten Yüzde 7 Daha Yüksek: Rapor

iPhone 16 serisi geçen ay Apple tarafından tanıtıldı ve iPhone 16, iPhone 16 Plus, iPhone 16 Pro ve iPhone 16 Pro Max’in parçalanma videoları ve dayanıklılık testleri şu anda Web’de dolaşıyor. Son zamanlarda, iPhone 16 Pro Max’in malzeme listesi (BOM) ayrıntıları çevrimiçi olarak ortaya çıktı ve cihazın toplam üretim maliyetini...

04.10.2024

yorumlar kapalı

Elon Musk’ın Starlink Uyduları, Yer Tabanlı Radyo Teleskoplarına Ciddi Zarar Verebilir, Diyor Çalışma

Elon Musk’ın Starlink uyduları dünya çapındaki gökbilimciler için önemli bir kesintiye neden oluyor. Hollanda’dan bilim insanları, özellikle Hollanda Radyo Astronomi Enstitüsü (ASTRON), büyüyen Starlink uyduları ağının hayati uzay araştırmaları için kullanılan radyo dalgalarına müdahale ettiğini bildirdi. Dünyanın uzak bölgelerinde yüksek hızlı internet sağlamak üzere tasarlanan uydular, gökbilimcilerin kara delikler, dış...

22.09.2024

yorumlar kapalı

POPÜLER KONULAR