Sarvam lansează modele AI open-source

Lansarea Noilor Modele AI de la Sarvam

Laboratorul indian de inteligență artificială Sarvam a dezvăluit recent o nouă generație de modele de limbaj de mari dimensiuni. Această lansare reprezintă un pariu strategic pe viabilitatea modelelor AI open-source, mai mici și mai eficiente, care ar putea câștiga cotă de piață în fața sistemelor mai costisitoare oferite de rivalii săi mai mari din SUA și China. Evenimentul a avut loc la India AI Impact Summit din New Delhi, subliniind eforturile Indiei de a reduce dependența de platformele AI străine și de a adapta modelele la limbile și cazurile de utilizare locale.

Detalii Tehnice și Strategia Sarvam

Sarvam a anunțat că noua gamă include modele de 30 de miliarde și 105 miliarde de parametri, un model text-to-speech, un model speech-to-text și un model de viziune pentru analizarea documentelor. Acestea reprezintă o îmbunătățire semnificativă față de modelul Sarvam 1 de 2 miliarde de parametri lansat în octombrie 2024. Modelele de 30 de miliarde și 105 miliarde de parametri utilizează o arhitectură de tip mixture-of-experts, care activează doar o fracțiune din totalul parametrilor la un moment dat, reducând astfel semnificativ costurile de calcul.

Antrenare și Suport Tehnic

Modelele AI au fost antrenate de la zero, fără a fi ajustate pe sisteme open-source existente. Modelul de 30 de miliarde de parametri a fost pre-antrenat pe aproximativ 16 trilioane de tokeni de text, în timp ce modelul de 105 miliarde de parametri a fost antrenat pe trilioane de tokeni care acoperă mai multe limbi indiene. Aceste modele sunt concepute pentru a susține aplicații în timp real, inclusiv asistenți vocali și sisteme de chat în limbile indiene.

Planuri de Viitor și Open-Source

Sarvam a subliniat că modelele au fost antrenate folosind resurse de calcul furnizate în cadrul inițiativei IndiaAI Mission, cu suport de infrastructură de la operatorul de centre de date Yotta și suport tehnic de la Nvidia. Co-fondatorul Sarvam, Pratyush Kumar, a declarat la lansare: «Vrem să fim atenți la cum facem scalarea. Nu vrem să facem scalarea fără minte. Vrem să înțelegem sarcinile care contează cu adevărat la scară și să construim pentru ele.»

Planuri de Comercializare și Investiții

Sarvam intenționează să deschidă sursa modelelor de 30 de miliarde și 105 miliarde de parametri, deși nu a specificat dacă datele de antrenament sau codul complet de antrenament vor fi făcute publice. Compania a mai anunțat planuri de a dezvolta sisteme AI specializate, inclusiv modele axate pe codare și instrumente pentru întreprinderi sub un produs numit Sarvam for Work, și o platformă de agenți AI conversaționali numită Samvaad. Fondată în 2023, Sarvam a strâns peste $50 milioane în finanțare și are printre investitori Lightspeed Venture Partners, Khosla Ventures și Peak XV Partners (fostă Sequoia Capital India).

Sarvam pariază pe AI open-source cu noi modele

Puncte Cheie

Lansarea Noilor Modele AI de la Sarvam

Detalii Tehnice și Strategia Sarvam

Antrenare și Suport Tehnic

Planuri de Viitor și Open-Source

Planuri de Comercializare și Investiții

Abonează-te la StiriX