Hugging Face, Test Süresinde Bilgi İşlem Ölçeklendirmesinin SLM’lerin Daha Büyük Yapay Zeka Modellerinden Daha İyi Performans Göstermesine Nasıl Yardımcı Olduğunu Gösteriyor

Yayınlama: 25.12.2024

A⁺

A^-

Hugging Face, geçen hafta küçük dil modellerinin (SLM’ler) daha büyük modellerden nasıl daha iyi performans gösterebileceğini gösteren yeni bir vaka çalışmasını paylaştı. Gönderide platformun araştırmacıları, yapay zeka (AI) modellerinin eğitim süresini artırmak yerine test süresi hesaplamasına odaklanmanın, AI modelleri için gelişmiş sonuçlar gösterebileceğini iddia etti. İkincisi, yapay zeka modellerinin bir sorunu çözmek için daha fazla zaman harcamasına olanak tanıyan ve kendi kendini geliştirme ve verimliliklerini artırabilecek bir doğrulayıcıya karşı arama yapma gibi farklı yaklaşımlar sunan bir çıkarım stratejisidir.

Test Süresinde Bilgi İşlem Ölçeklendirmesi Nasıl Çalışır?

Hugging Face, bir gönderisinde, bir yapay zeka modelinin yeteneklerini geliştirmeye yönelik geleneksel yaklaşımın genellikle kaynak yoğun ve son derece pahalı olabileceğini vurguladı. Tipik olarak, eğitim öncesi veri ve algoritmaların, temel modelin bir sorguyu parçalama ve çözüme ulaşma şeklini iyileştirmek için kullanıldığı, eğitim zamanı hesaplaması adı verilen bir teknik kullanılır.

Alternatif olarak araştırmacılar, yapay zeka modellerinin bir sorunu çözmek için daha fazla zaman harcamasına ve kendilerini düzeltmelerine olanak tanıyan bir teknik olan test süresi hesaplama ölçeklendirmesine odaklanmanın da benzer sonuçlar gösterebileceğini iddia etti.

OpenAI’nin test süresi hesaplamasını kullanan o1 muhakeme odaklı modelinin örneğini vurgulayan araştırmacılar, bu tekniğin, eğitim verilerinde veya ön eğitim yöntemlerinde herhangi bir değişiklik yapılmamasına rağmen yapay zeka modellerinin gelişmiş yetenekler sergilemesine izin verebileceğini belirtti. Ancak bir sorun vardı. Çoğu akıl yürütme modeli kapalı olduğundan, kullanılan stratejileri bilmenin bir yolu yoktur.

Araştırmacılar, LLM geliştiricilerinin eğitim sonrası aşamada test süresi hesaplamasını tam olarak nasıl ölçeklendirebileceğini ortaya çıkarmak için Google DeepMind tarafından yapılan bir çalışmayı ve tersine mühendislik tekniklerini kullandı. Vaka çalışmasına göre, yalnızca işlem süresinin arttırılması, karmaşık sorguların çıktılarında önemli bir iyileşme göstermemektedir.

Bunun yerine araştırmacılar, yapay zeka modellerinin sonraki yinelemelerdeki yanıtları değerlendirmesine ve potansiyel hataları belirleyip düzeltmesine olanak tanıyan bir kendi kendini iyileştirme algoritmasının kullanılmasını öneriyor. Ek olarak, modellerin arama yapabileceği bir doğrulayıcının kullanılması yanıtları daha da iyileştirebilir. Bu tür doğrulayıcılar, öğrenilmiş bir ödül modeli veya sabit kodlanmış buluşsal yöntem olabilir.

Daha gelişmiş teknikler, bir modelin problem başına birden fazla yanıt ürettiği ve hangisinin daha uygun olduğuna karar vermek için bir puan atadığı N’nin en iyisi yaklaşımını içerecektir. Bu tür yaklaşımlar bir ödül modeliyle eşleştirilebilir. Adım adım akıl yürütmeye ve her adım için puan atamaya öncelik veren ışın arama, araştırmacıların vurguladığı bir diğer stratejidir.

Hugging Face araştırmacıları yukarıda bahsedilen stratejileri kullanarak Llama 3B SLM’yi kullanabildiler ve MATH-500 testinde çok daha büyük bir model olan Llama 70B’den daha iyi performans göstermelerini sağladılar.

Kaynak

ai, kucaklayan yüz testi süresi hesaplama ölçeklendirme küçük dil modelleri llms'den daha iyi performans gösteren kucaklayan yüz, llama, sürmanşet, yapay zeka

Patron

Viyanablog Sitesinin Kurucusuyum.

Benzer Konular

iQOO Z9 Turbo+, MediaTek Dimensity 9300+ SoC ve 6.400mAh Pil ile Tanıtıldı: Fiyat, Özellikler

iQOO Z9 Turbo+ Salı günü Çin’de piyasaya sürüldü. Akıllı telefon, özel Q1 oyun yonga seti, 16 GB’a kadar RAM ve 80 W hızlı şarj desteğine sahip 6.400 mAh pil ile birlikte bir MediaTek Dimensity 9300+ SoC üzerinde çalışıyor. Telefon, 6,78 inç 1,5K ekrana, 50 megapiksel çift arka kamera ünitesine ve...

24.09.2024

yorumlar kapalı

Intel Lunar Lake İşlemcili Lenovo Yoga Slim 7i Aura Sürümü Hindistan’da Piyasaya Sürüldü: Fiyat, Teknik Özellikler

Lenovo Yoga Slim 7i Aura Edition Salı günü Hindistan’da piyasaya sürüldü. Çinli şirketin en yeni dizüstü bilgisayarı, Lunar Lake adlı yeni Intel Core Ultra serisi 2 işlemciyi içeriyor. Özel bir sinir işleme birimi (NPU) sayesinde yapay zeka (AI) yeteneklerini destekler ve sertifikalı bir Microsoft Copilot+ bilgisayarıdır. Dizüstü bilgisayar 2,8K IPS...

19.12.2024

yorumlar kapalı

Ülkenin E-Scooter Savaşı Yoğunlaştıkça Ola Electric’in Hakimiyeti Zayıflıyor

Hindistan’ın önde gelen elektrikli scooter üreticisi Ola Electric, SoftBank destekli firmanın hakimiyetinin daha küçük rakipler ve ağ sorunlarına hizmet verme nedeniyle erozyona uğradığını gördüğünden, hükümet verilerinin gösterdiğine göre bu yılın en düşük aylık satışlarını Eylül ayında kaydetti. Yaklaşık iki ay önce borsaya giriş yapan Ola Electric, Eylül ayında 23.965 araç...

01.10.2024

yorumlar kapalı

Alman drone firması otonom sürüler için ‘atılım’ yapıyor

Bir Alman drone şirketi, otonom sürü teknolojisinde “büyük bir atılım” yaptığını iddia ediyor. Münih merkezli Quantum Systems Salı günü yaptığı açıklamada, yapay zeka kontrollü İnsansız Hava Sistemlerini (UAS) sürü halinde başarıyla uçurduğunu duyurdu.S. Şirket, yapay zekanın şunları sağladığını söyledi:güvenilir görev icrası” – eşit bireysel dronlar tamamen başarısız olduğunda. Sistem aynı...

20.09.2024

yorumlar kapalı

Bilim, Estonya’da gelişen yeni nesil derin teknoloji girişimlerini yetiştiriyor

2000’li yılların başlarında Estonya hızla modernleşiyordu. kalıntılar Sovyet etkisinden. Oldu iddialı bir şekilde kendini bir şeye dönüştürüyor dijital gibi yeniliklerle toplum e-devlet ve çevrimiçi oylama. Ve tabii ki bu, küçük Baltık ülkesinin bir start-up güç merkezi olma yolundaki yolculuğunu başlatacak şirket olan Skype’ı doğurdu ve “tek boynuzlu at ülkesi.” O...

15.09.2024

yorumlar kapalı

Infinix Zero Flip 5G’nin MediaTek Dimensity 8020 SoC ve 120Hz Ekranla Piyasaya Sürüleceği Onaylandı

Infinix Zero Flip 5G’nin şirketin ilk kapak tarzı katlanabilir cihazı olarak yakında piyasaya sürülmesi bekleniyor. 50 megapiksel birincil kamera, UFS 3.1 depolama ve yapay zeka (AI) yetenekleri gibi özelliklere sahip olacağı bildiriliyor. Henüz bir lansman tarihimiz olmasa da Infinix, Salı günü bir sosyal medya gönderisiyle kapaklı telefonun birkaç özelliğini doğruladı....

19.09.2024

yorumlar kapalı

POPÜLER KONULAR