Sarvam pariază pe AI open-source cu noi modele
Noi modele AI de la Sarvam, lansate la India AI Impact Summit
Sarvam a lansat noi modele AI open-source, eficiente și scalabile, la India AI Impact Summit. Modelele sunt susținute de inițiativa IndiaAI Mission și Nvidia.
Puncte Cheie
- Sarvam a lansat noi modele AI la India AI Impact Summit.
- Modelele includ versiuni de 30 și 105 miliarde de parametri.
- Modelele sunt open-source și mai eficiente decât cele ale rivalilor.
- Sarvam a fost fondată în 2023 și a strâns peste $50 milioane.
- Modelele sunt susținute de IndiaAI Mission și Nvidia.
Lansarea Noilor Modele AI de la Sarvam
Laboratorul indian de inteligență artificială Sarvam a dezvăluit recent o nouă generație de modele de limbaj de mari dimensiuni. Această lansare reprezintă un pariu strategic pe viabilitatea modelelor AI open-source, mai mici și mai eficiente, care ar putea câștiga cotă de piață în fața sistemelor mai costisitoare oferite de rivalii săi mai mari din SUA și China. Evenimentul a avut loc la India AI Impact Summit din New Delhi, subliniind eforturile Indiei de a reduce dependența de platformele AI străine și de a adapta modelele la limbile și cazurile de utilizare locale.
Detalii Tehnice și Strategia Sarvam
Sarvam a anunțat că noua gamă include modele de 30 de miliarde și 105 miliarde de parametri, un model text-to-speech, un model speech-to-text și un model de viziune pentru analizarea documentelor. Acestea reprezintă o îmbunătățire semnificativă față de modelul Sarvam 1 de 2 miliarde de parametri lansat în octombrie 2024. Modelele de 30 de miliarde și 105 miliarde de parametri utilizează o arhitectură de tip mixture-of-experts, care activează doar o fracțiune din totalul parametrilor la un moment dat, reducând astfel semnificativ costurile de calcul.
Antrenare și Suport Tehnic
Modelele AI au fost antrenate de la zero, fără a fi ajustate pe sisteme open-source existente. Modelul de 30 de miliarde de parametri a fost pre-antrenat pe aproximativ 16 trilioane de tokeni de text, în timp ce modelul de 105 miliarde de parametri a fost antrenat pe trilioane de tokeni care acoperă mai multe limbi indiene. Aceste modele sunt concepute pentru a susține aplicații în timp real, inclusiv asistenți vocali și sisteme de chat în limbile indiene.
Planuri de Viitor și Open-Source
Sarvam a subliniat că modelele au fost antrenate folosind resurse de calcul furnizate în cadrul inițiativei IndiaAI Mission, cu suport de infrastructură de la operatorul de centre de date Yotta și suport tehnic de la Nvidia. Co-fondatorul Sarvam, Pratyush Kumar, a declarat la lansare: «Vrem să fim atenți la cum facem scalarea. Nu vrem să facem scalarea fără minte. Vrem să înțelegem sarcinile care contează cu adevărat la scară și să construim pentru ele.»
Planuri de Comercializare și Investiții
Sarvam intenționează să deschidă sursa modelelor de 30 de miliarde și 105 miliarde de parametri, deși nu a specificat dacă datele de antrenament sau codul complet de antrenament vor fi făcute publice. Compania a mai anunțat planuri de a dezvolta sisteme AI specializate, inclusiv modele axate pe codare și instrumente pentru întreprinderi sub un produs numit Sarvam for Work, și o platformă de agenți AI conversaționali numită Samvaad. Fondată în 2023, Sarvam a strâns peste $50 milioane în finanțare și are printre investitori Lightspeed Venture Partners, Khosla Ventures și Peak XV Partners (fostă Sequoia Capital India).
Abonează-te la StiriX
Primește cele mai noi știri tech direct pe email.
