Grok-1 Kodları Yayınlandı
Elon Musk, xAI Sohbet Robotunun Arkasındaki Modeli Açıkladı: Grok-1 Kodları Yayınlandı.
Elon Musk, xAI Sohbet Robotunun Arkasındaki Modeli Açıkladı: Grok-1 Kodları Yayınlandı – Açık Kaynak mı, Pandora’nın Kutusu mu?
Elon Musk’ın vaadi üzerine, xAI sohbet robotu Grok-1’in arkasındaki model yayınlandı.
Apache 2.0 lisansı altında yayınlanan temel model ağırlıkları ve ağ mimarisi şimdi erişilebilir durumda. Model, 314 milyar parametreye sahip ve çalıştırılması için yeterli GPU belleğine sahip donanıma ihtiyaç duyuyor. Doğal dil diyalog gibi uygulamalar için ince ayar yapılmış durumda ve Ekim 2023’te sona eren ön eğitim aşamasından ham temel model kontrol noktasını temsil ediyor. Eleştirmenler, kıyaslamalardaki göreceli olarak vasat performansına işaret ettiler; Grok büyük bir model olmasına rağmen, bazı mühendislerin gördüğü kadarıyla kötü performans sergiliyor. “Diğer modellere kıyasla ne kadar kötü olduğunu düşünürsek, ince ayarın ne kadar önemli olduğunu gerçekten vurguluyor. Çok daha küçük parametre sayılarına sahip modeller, birçok metrikte onu geride bırakıyor,” dedi bir poster dün gece Hacker News forumlarında. Örneğin, daha küçük Mistral’in Grok-1 kadar iyi performans gösterdiğini görebilirsiniz.
Boyutunu perspektife koyacak olursak, 314 milyar parametre ile bile, son sayımda 1.76 trilyon parametreye sahip OpenAI’nin GPT-4’ü ile hala yakalaması gereken bir yol var. Özellikle, mevcut Büyük Dil Modellerinin (LLM) aksine, belirli bir zamanda veri kesme noktasına sahip olan Grok, herkesin X.com üzerinden Xeet’lerinin gerçek zamanlı veri korpusuna erişim sağlayacak, bu da ilerleyen günlerde bazı ilginç deneyler yapılmasına olanak tanıyacak, ancak başka bir yorumcu not düştü: “Twitter tweet verileri kendiliğinden oldukça özgül ve tasarım gereği kısa, bu yalnızca bir LLM eğitimi için elverişli değil.” Grok, Musk’ın sosyal medya platformu X’in kullanıcılarına tanıdık gelecek ve aboneler sohbet robotuna sorular sorup cevaplar alabilmişlerdi. xAI’ye göre, Grok Otostopçunun Galaksi Rehberi’nden modellenmiş. “Neredeyse her şeye cevap vermek ve, daha da zoru, hangi soruları sormanız gerektiğini bile önermek üzere tasarlanmıştır.”
Bir kullanıcı Otostopçunun Galaksi Rehberi radyo senaryolarının köşeleri kıvrılmış bir kopyasını karıştırırsa, Fit the Tenth’te şu tanım bulunabilir: “Otostopçunun Galaksi Rehberi, sonsuz karmaşık ve kafa karıştırıcı bir evrende yaşamın anlamını çözmeye hevesli herkes için vazgeçilmez bir yoldaştır, çünkü her ne kadar tüm konularda faydalı veya bilgilendirici olmayı ummasa da, yanlış olduğu yerlerde en azından kesinlikle yanlış olduğunu iddia eden rahatlatıcı bir iddia yapar. Büyük bir farklılık durumunda, her zaman yanılan gerçekliktir.” Yayın, OpenAI’nin GPT-4 modelinin piyasaya sürülmesinin birinci yıldönümünde geldi ve Musk’ın eski AI arkadaşlarıyla olan hukuki çekişmesi arka planda kalmaya devam ediyor.
Bu ayın başında Musk, OpenAI’ye karşı, şirketin adına rağmen pek de açık olmadığı iddiasıyla dava açtı. OpenAI, Musk’ın planlarından tamamen haberdar olduğunu ve bunun Tesla’ya katılmasını istediğini iddia ederek bir dizi e-postayı yayınladı. OpenOcean’ın genel ortağı Patrik Backman, Grok-1’in yayınlanması hakkında şöyle dedi: “Elon Musk, ilk defa olarak prensiplerini eyleme döküyor. OpenAI’yi kar odaklı bir organizasyona dönüştürdüğü için dava ediyorsanız, aynı ideallere bağlı kalmaya hazır olmalısınız.”
xAI tarafından yayınlanmayanlar da dikkate değer. Grok-1 ağırlıkları dışarıda, ancak eğitim için kullanılan veri aynı lisans altında mevcut değil, bu da AI uzmanı Gary Marcus’un “KısmenAçıkAI” demesine neden oldu. Generatif AI araçlarını açık kaynak yapmak tartışmaya açıldı… Bazı geliştiriciler, teknolojinin kötüye kullanım riski taşıdığını düşünürken, diğerleri şeffaflığın doğasında var olan faydalara işaret ediyor. Meta – bir nevi – geçen yıl Llama 2 modellerini paylaştı ve diğer şirketler de bu örneği takip etti. Öte yandan, OpenAI kesinlikle yapmadı. Grok-1’in ağırlıklarını açarak, Musk, OpenAI’nin mülkiyet dünyasının tam tersi bir kampa bayrak dikmeye çalışıyor. Son performansı söz konusu olduğunda, Musk’ın dokunduğu her şey gibi, iki yönlü gidebilir.