O echipă de cercetători români a dezvoltat un model de limbaj „open source” dedicat limbii române

O echipă de cercetători români a dezvoltat un model de limbaj „open source” dedicat limbii române

Numărul 19, 15-21 mai 2024  »  Conectarea la era digitală

Un model de limbaj dedicat limbii române, ce poate fi folosit pentru dezvoltarea unor unelte și platforme cu Inteligență Artificială (AI), a fost dezvoltat de o echipă de cercetători români din cadrul Politehnica București, Universitatea din București și Institutul de Logică și Știința Datelor. Potrivit unui comunicat de presă al BRD Groupe Societe Generale (instituția bancară care a sprijinit proiectul), citat de Agerpres, modelul este "open source" și va putea fi accesat și folosit de orice persoană care dorește să construiască instrumente bazate pe inteligența artificială.

În același timp, odată cu publicarea acestui LLM (Large Language Model), inițiatorii proiectului lansează și comunitatea OpenLLM-Ro, care dorește să-i aducă împreună pe toți cei care vor să contribuie în diverse forme la dezvoltarea tehnologiilor AI pentru limba română.

Ambele proiecte sunt inițiate și derulate de Politehnica București, Universitatea din București și Institutul de Logica și Știința Datelor, cu sprijinul BRD Groupe Societe Generale.

"Modelul românesc lansat acum este adaptarea unui LLM public dezvoltat în principal pentru limba engleză. Însă acesta a fost expus la câteva milioane de documente în limba română, pentru a înțelege mai bine semnificația cuvintelor. Acest lucru e esențial pentru perfomanța unor astfel de modele în situații unde exprimarea cerinței sau a întrebării introduse de utilizator, cât și a răspunsului trebuie să fie în limba română. Începând din a doua parte a anului 2023, la dezvoltarea și instruirea acestui LLM a lucrat o echipă de cercetători de la Politehnica București, Universitatea din București și Institutul de Logica și Știința Datelor. Partenerii academici au contribuit cu cercetători care au lucrat pro-bono și, în plus, Politehnica București a pus la dispoziție și puterea de calcul necesară antrenării modelului ", se arată în comunicat.

Efortul de specializare a unui model dedicat unei limbi este frecvent coordonat de către comunitatea academică asociată limbii respective, exemple recente fiind din țări precum Franța, Germania, Spania, Finlanda, Bulgaria.

"Câteva dintre exemplele de utilizare a modelului românesc sunt: căutarea de informații în baza de cunoștințe a unei organizații, cu ghiduri și proceduri de lucru, sau roboți conversaționali pentru clienții companiilor sau ai instituțiilor care să îi ghideze în parcurgerea pașilor necesari pentru utilizarea unui produs sau serviciu. În ambele cazuri, angajații și/sau clienții economisesc timp în accesarea informației, beneficiind în multe situații și de îmbunătățirea calității acesteia", a menționat Alin Ștefănescu, directorul Departamentului de Informatică din cadrul Universității din București și vicepreședintele Institutului de Logică și Știința Datelor.

La rândul său, Traian Rebedea, conferențiar la Politehnica București și cercetător principal la Nvidia, unul dintre coordonatorii tehnici ai inițiativei OpenLLM-Ro, susține că pentru a avea modele performante pentru limba română este nevoie de două tipuri de resurse: colecții de date mari și curatoriate și resurse hardware, în special, GPU-uri pentru antrenarea modelelor.

"Sperăm ca atât entitățile private, cât și cele publice, să înțeleagă importanța dezvoltării modelelor mari de limbaj și multimodale (text-imagini) pentru limba română. Pe toți îi așteptăm să ni se alăture în cadrul inițiativei OpenLLM-Ro și a proiectelor de cercetare care o vor sprijini", a spus Rebedea.

Modelul românesc de limbaj reprezintă adaptarea unui LLM public dezvoltat in principal pentru limba engleză, dar care a fost expus la câteva milioane de documente în limba română, pentru a înțelege mai bine semnificația cuvintelor.

(Copyright foto: 123RF Stock Photo)




Site-ul ceccarbusinessmagazine.ro folosește cookie-uri pentru analiza traficului și pentru îmbunătățirea experienței de navigare. Sunt incluse aici și cookie-urile companiilor/serviciilor terțe plasate pe acest site (Google Analytics, Facebook, Twitter, Disqus). Continuând să utilizezi acest website, ești de acord cu stocarea tuturor cookie-urilor pe acest device.