Epoch AI, Yapay Zeka Modellerinin Yeteneklerini Test Etmek İçin FrontierMath AI Benchmark’ı Başlattı

Yayınlama: 12.11.2024

A⁺

A^-

Kaliforniya merkezli bir araştırma enstitüsü olan Epoch AI, geçen hafta yeni bir yapay zeka (AI) kıyaslaması başlattı. FrontierMath olarak adlandırılan yeni AI kıyaslaması, büyük dil modellerinin (LLM’ler) yeniden düzenleme ve matematiksel problem çözme yeteneklerini test ediyor. Yapay zeka firması, veri kirliliği ve yapay zeka modellerinin çok yüksek puanlar alması gibi faktörler nedeniyle mevcut matematik kıyaslamalarının pek kullanışlı olmadığını iddia ediyor. Epoch AI, önde gelen LLM’lerin bile yeni kıyaslamada yüzde ikiden daha az puan aldığını iddia ediyor.

Epoch AI FrontierMath Benchmark’ı Başlattı

AI firması, X’teki (eski adıyla Twitter) bir gönderide, yüzlerce köken ve yayınlanmamış matematik problemi oluşturmak için 60’tan fazla matematikçiyle işbirliği yaptığını açıkladı. Epoch AI, bu soruların çözülmesinin matematikçilerin bile saatlerini alacağını iddia ediyor. Yeni kriterin geliştirilmesinin arkasındaki nedenin, AI modellerinin genellikle yüksek puan aldığı GSM8K ve MATH gibi mevcut kriterlerin sınırlamaları olduğu belirtildi.

Şirket, LLM’lerin elde ettiği yüksek puanların büyük ölçüde veri kirliliğinden kaynaklandığını iddia etti. Bu, soruların bir şekilde zaten yapay zeka modellerine beslendiği ve soruların kolayca çözülmesine olanak sağladığı anlamına geliyor.

FrontierMath, benzersiz ve hiçbir yerde yayınlanmamış yeni problemleri dahil ederek sorunu çözer ve veri kirliliğiyle ilişkili riskleri azaltır. Ayrıca kıyaslama, sayı teorisi, gerçek analiz ve cebirsel geometrideki hesaplama açısından yoğun problemlerin yanı sıra Zermelo-Fraenkel küme teorisi gibi konuları da içeren çok çeşitli soruları içerir. Yapay zeka firması, tüm soruların “tahmin kanıtı” olduğunu, yani güçlü bir mantık yürütmeden kazara çözülemeyeceklerini söylüyor.

Epoch AI, yapay zekanın yeteneğini ölçmek için, yapay zekanın birden fazla adımda akıl yürütmeyi sürdürmesi gereken yaratıcı problem çözme konusunda kıyaslamaların oluşturulması gerektiğini vurguladı. Özellikle sektör emektarlarının çoğu, mevcut kriterlerin bir yapay zeka modelinin ne kadar gelişmiş olduğunu doğru bir şekilde ölçmek için yeterli olmadığına inanıyor.

Şirketin o1 modelinin arkasında yer alan OpenAI araştırmacısı Noam Brown, yeni kıyaslamaya bir gönderiyle yanıt vererek yeni kıyaslamayı memnuniyetle karşıladı ve şunları söyledi: “Öncü modeller için bu kadar düşük geçiş oranlarına sahip yeni bir değerlendirme görmeyi seviyorum.”

En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin XFacebook, WhatsApp, Konular ve Google Haberler. Gadget’lar ve teknolojiyle ilgili en yeni videolar için YouTube kanalımıza abone olun. En etkili kişiler hakkında her şeyi öğrenmek istiyorsanız şirket içi Who’sThat360’ımızı Instagram ve YouTube’da takip edin.

Poco X7 Pro, Xiaomi’nin HyperOS 2’siyle Hindistan’da Gönderilen İlk Akıllı Telefon Olabilir

iQOO 13 Renk Seçenekleri 3 Aralık’ta Hindistan’da Lansman Öncesi Ortaya Çıktı

Kaynak

ai, ai kıyaslama, epoch ai frontiermath kıyaslama testi büyük dil modellerini başlattı epoch ai, sürmanşet, yapay zeka

Patron

Viyanablog Sitesinin Kurucusuyum.

Benzer Konular

Mozambik’te huzursuzluk: Binlerce kişi Malavi’ye kaçtı

Mozambik’te devam eden huzursuzluk nedeniyle birçok kişi komşu Malavi’ye sığınıyor. Yetkililerin bugün açıkladığı gibi, yalnızca bu hafta 2.000’den fazla aile Mozambik’ten Malavi’ye kaçtı. Ekim ayındaki tartışmalı seçimlerin ardından protestolar yayılmaya devam ederken Mozambik’te düzinelerce kişinin öldürüldüğü bildirildi. Resmi rakamlara göre, çarşamba günü hapishanelerde çıkan isyanda en az 33 kişinin ölmesi...

27.12.2024

Mozambik’te huzursuzluk: Binlerce kişi Malavi’ye kaçtı için yorumlar kapalı

Hintli moda tasarımcısı Rohit Bal hayatını kaybetti

Hindistan’ın en ünlü moda tasarımcılarından Rohit Bal, 63 yaşında hayatını kaybetti. Hindistan Moda Tasarımı Konseyi (FDCI) başkanı Sunil Sethi, dün bunu Hindistan haber ajansları PTI ve ANI’ye doğruladı. PTI’ye “Cumartesi günü yapılacak cenaze töreninin ayrıntılarını çözmeye çalışıyoruz” dedi. Bal, derneğin kurucularından biriydi. FDCI sosyal medyada, derneğin efsanevi tasarımcının kaybının yasını...

02.11.2024

Hintli moda tasarımcısı Rohit Bal hayatını kaybetti için yorumlar kapalı

Vali: Odessa’daki Rus hava saldırısında öldü

Buradaki yetkililere göre, Cuma gecesi Ukrayna’nın güneyindeki Odessa bölgesine Rus roket saldırısında 4 kişi hayatını kaybetti. Bölge Valisi Oleh Kiper Telegram’da balistik füzenin sivillerin yaşadığı ve çalıştığı iki katlı bir binaya çarptığını söyledi. Olayda dördü ağır olmak üzere 10 kişi de yaralandı. Enkaz altında kalanları arama çalışmaları sürüyor. Bilgiler şu...

11.10.2024

Vali: Odessa’daki Rus hava saldırısında öldü için yorumlar kapalı

Mpox: Salgın, DSÖ’ye göre sağlık açısından acil bir durum olmaya devam ediyor

Afrika ülkelerindeki Mpox salgınları şu sıralar Dünya Sağlık Örgütü’nün (WHO) Acil Durum Komitesi’ni meşgul ediyor. Bir düzine bağımsız uzmandan oluşan bu komite, DSÖ’nün ağustos ayında Mpox (eski adıyla maymun çiçeği) nedeniyle acil sağlık durumu ilan etmesinden dolayı her üç ayda bir toplanmak zorundadır. Şimdi nasıl ilerleneceği tartışılıyor. Bu yıl Demokratik...

23.11.2024

Mpox: Salgın, DSÖ’ye göre sağlık açısından acil bir durum olmaya devam ediyor için yorumlar kapalı

Bahçelievler’de 30.

Bahçelievler Belediyesi, 30’uncu bisiklet DALIM TÖRENINI Gerçekiştiri. Törende, Çeşitli Yaş Gruplardan Çocuklar ve Gençler Için Toplamda Yüzlerce Bisiklet sahhiplerine ulshtiLı. Beşiktaşkkanı Serdal Adilli Pfdk’a Sevk Edildi Etkinlikte Konishan Bahçelievler Belediye Daşkani, Bisiklet Kullanimisin Taşvik EDILMESI GEKTININI VURGULADI. Ayronca, bu tür organizasyonunonlaririn sahliKLı yaşami DestekleMeKAYYAY DEVAM EDEVIVININIRIN. Törene Katha Aileler VE...

28.03.2025

Bahçelievler’de 30. için yorumlar kapalı

Bolu yanginin faciundan hüryzan sonra mhp’den Hamle

Bolu’da 78 Kişinin Hayatünür Kaybettiyi Yangın Felaketinin Aridindan, Milliiyethai Hareket Partisi (MHP) Turizm BÖLGELERINDE ‘Yangına 10 Dakika Mesafede’ Seyyar ve Sabit Itfaiye iStasyonlaririn Bulundurulmaskı Zorunlu KILAN YENI BIR YASA TEKLIFI SUNMAYA KARAR VERDI. Bolu-Kartalkaya’Daki Otel Yangınında 78 Kişi Yüzaşamı Yitiren, MHP Genel Daşkan Yardmcisen ilmail özdemir, Eşi ve OSlUNU Son...

29.01.2025

Bolu yanginin faciundan hüryzan sonra mhp’den Hamle için yorumlar kapalı

POPÜLER KONULAR