26 dakikada 50 dolara OpenAI’a rakip yapay zeka yaptılar!
Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, sadece 26 dakika içinde ve 50 dolardan daha az bir maliyetle OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modelini eğitmeyi başardı. s1 olarak isimlendirilen bu model, 1 …

Stanford Üniversitesi ve Washington Üniversitesi’nden araştırmacılar, sadece 26 dakika içinde ve 50 dolardan daha az bir maliyetle OpenAI’ın gelişmiş modellerine rakip bir yapay zeka modelini eğitmeyi başardı. s1 olarak isimlendirilen bu model, 1.000 sorudan oluşan küçük bir bilgi seti ile eğitildi ve büyük yapay zeka modellerinin bilgisini küçük modellere aktaran distilasyon (distillation) prosedürü ile geliştirildi.
50 dolarlık OpenAI rakibi yapay zeka: s1
Araştırmacılar, s1’in mantık yürütme yeteneklerini geliştirmek için Google’ın Gemini 2.0 Flash Thinking Experimental modelinden yararlandı. Lakin Google’ın hizmet kaideleri Gemini API’sinin rakip yapay zeka modellerinin geliştirilmesi için kullanılmasını yasaklıyor ve bu durum muhtemel hukuksal problemleri gündeme getiriyor.
s1 modeli, Alibaba Cloud’un açık kaynaklı Qwen2.5 modeli üzerine inşa edildi. Başlangıçta 59.000 soruluk büyük bir data seti kullanılarak eğitime başlansa da yapılan testler daha küçük bir bilgi setinin emsal doğruluk oranlarını sunduğunu ortaya koydu ve böylelikle eğitim müddeti ve maliyet değerli ölçüde düşürüldü.

Çin, Trump vergileri yüzünden Apple’a acımayacak!
Çin, Apple’ın App Store siyasetlerini inceliyor. ABD-Çin ticaret gerginliği tırmanırken şirketlerde son durum ne?
Eğitim süreci 16 adet Nvidia H100 GPU kullanılarak tamamlandı. Model, doğruluğunu artırmak için test-time scaling ismi verilen gelişmiş bir teknikten yararlanıyor. Araştırmacılar, modele “Wait” komutu ekleyerek cevap üretme müddetini uzattı ve böylelikle modelin cevaplarını tekrar gözden geçirip yanılgılarını düzeltmesine imkan tanıdı. Bu usul, yapay zekanın karmaşık mantık süreçlerini daha yanlışsız çalıştırmasını sağladı.
Bu gelişme, yüksek performanslı yapay zeka modellerinin kesinlikle milyarlarca dolarlık yatırımlarla ve devasa bilgi merkezleriyle eğitilmesi gerekmediğini kanıtlıyor. OpenAI’ın o1 modeli de misal bir mantık yürütme tekniği kullanıyor ve Çin merkezli DeepSeek’in R1 modeli, benzeri bir teknikle çok daha düşük maliyetle geliştirildiğini sav ediyor.
Ancak OpenAI, DeepSeek’i modellerinden bilgi distile ederek rakip bir yapay zeka geliştirmekle suçladı ve bu durum büyük teknoloji şirketlerinin açık kaynak yapay zeka modelleri karşısındaki duruşlarını tekrar gözden geçirmelerine neden olabilir.