Nytt öppen källkod LLM Smaug-72B av Abacus AI

Den nya stjärnan bland öppen källkod LLM av Abacus AI har nyligen släppt en ny öppen källkod stor språkmodell (LLM) vid namn Smaug-72B. Denna modell har skapat rubriker för sin förmåga att överträffa andra ledande modeller som GPT-3.5 och Mistral Medium i flera populära benchmarks på Hugging Face Open LLM leaderboard. Smaug-72B är tekniskt sett en finjusterad version av ”Qwen-72B”, en annan kraftfull språkmodell som släpptes för bara några månader sedan av Qwen ett team av forskare vid Alibaba Group.

Prestation och Jämförelse

Smaug-72B är en tekniskt förfinad version av ”Qwen-72B”, vilken ursprungligen skapades av ett forskarteam hos Alibaba Group. Modellen imponerar speciellt med sina prestationer i resonemang och matematiska uppgifter, vilket kan ses i dess resultater som ofta överskrider 80-poängs tröskeln på utvärderingsplattformar. Denna milstolpe tyder på att Smaug-72B har nått en nivå av språkförståelse och textgenerering som närmar sig mänsklig prestanda.

Tillgänglighet och Framsteg

Smaug-72B är offentligt tillgänglig på Hugging Face vilket innebär att vem som helst kan ladda ner, använda och anpassa modellen för sina egna projekt. Detta är ett stort steg för demokratiseringen av artificiell intelligens, då det ger utvecklare och forskare tillgång till toppmoderna AI-verktyg som tidigare bara fanns hos stora teknikföretag.

Abacus AI och dess VD Bindu Reddy har uttryckt sina mål för framtiden där de vill publicera de tekniker som användes för att skapa Smaug-72B i en forskningsartikel. Dessa tekniker förklaras i detalj vilket i sin tur kan tillämpas på andra modeller för att ytterligare förbättra prestandan inom resonemang och matematiska färdigheter.

Med lanseringen av Smaug-72B ser vi en ny era av AI-innovation och demokratisering som utmanar dominansen av stora teknikföretag. Det öppnar upp för nya möjligheter för alla, från enskilda utvecklare till mindre företag.

Hur man använder Smaug-72B

Användare kan köra Smaug-72B lokalt med hjälp av verktyg som Ollama eller LM Studio. För att göra detta behöver man installera Ollama eller använda LM Studios gränssnitt för att upptäcka och ladda ner tillgängliga LLM-modeller till den lokala miljön.

https://huggingface.co/abacusai/Smaug-72B-v0.1