ReLDI konferencija

Naučni i računarski pristupi prirodnom jeziku

Računarsko modeliranje prirodnog jezika je pojavom generativnih modela tipa GPT izašlo iz naučne sfere i preplavilo sve oblasti društva i ekonomije. Činjenica je, međutim, da performanse modela opadaju čim se radi o nekom jeziku koji nije engleski. Dostizanje komercijalno vrednih performansi kad su u pitanju manji jezici, kao što su srpski, hrvatski, slovenački, makedonski i bugarski, zahteva dalja istraživanja u naučnoj sferi.

ReLDI centar je zato odlučio da pokrene naučnu konferenciju koja će se baviti pitanjima naučnog i računarskog modeliranja prirodnog jezika na primeru južnoslovenskih jezika. Naš cilj je da obezbedimo svima razumljiv pregled aktuelnih naučnih dostignuća i dolazećih trendova kroz izlaganja vodećih stručnjaka. Prvo, pilotno izdanje konferencije će se održati 25–26. septembra 2025. u Palati nauke u Beogradu

ORGANIZACIONI I NAUČNI ODBOR

MESTO ODRŽAVANJA

PREDAJA RADOVA

PRIJAVA ZA UČEŠĆE

ZAKLJUČCI

GALERIJA

SPONZORSTVA

Predaja radova

Rok: 30. jun 2025.

Glavni program konferencije će sadržati izlaganja koja će naš Naučni odbor odabrati na osnovu kvaliteta i prikladnosti prijavljenih radova. Očekujemo nekoliko tipova radova:

  • Obrada prirodnog jezika, sistematska evaluacija modela ili unapređenje performansi na jednom ili više od sledećih skupova podataka:
  • Struktura jezika iz ugla opšte lingvistike: empirijsko testiranje hipoteza
  • Teorijsko proučavanje jezika relevantno za računarsku obradu
  • Teorijsko mašinsko učenje relevantno za računarsku obradu jezika
  • Jezičke usluge i računarska tehnologija
  • Pregled literature na navedene teme

Radovi treba da budu na engleskom jeziku, metodološki dobro utemeljeni i sa jasnim naučnim doprinosom. Sadržaj treba da bude nov (da nije objavljen ranije) i kompletan. Minimalna dužina je 4 stranice prema datom šablonu. Detaljnije informacije o formi i predaji radova dostupne su na engleskoj verziji stranice.

Prihvaćeni radovi će biti objavljeni u elektronskoj formi u konferencijskom zborniku.

Program

Detaljnije informacije (na engleskom)

25. septembar 2025.

15:30 – 16:00

Registracija

16:00 – 18:00

Panel diskusija

Kako jezičke tehnologije menjaju jezičke usluge

18:00 – 19:00

Svečani prijem

26. septembar 2025.

09:00 – 09:30

Registracija i uvodne napomene

09:30 – 10:30

Pozvano predavanje

10:30 – 11:00

Kafe pauza

11:00 – 12:00

Glavni naučni program – sesija 1

12:00 – 13:00

Program Sinergije – poster sesija

13:00 – 14:30

Pauza za ručak

14:30 – 15:00

Program Sinergije – diskusija

15:00 – 16:00

Glavni naučni program – sesija 2

16:00 – 16:30

Kafe pauza

16:30 – 18:00

Panel diskusija

Nacionalne strategije za razvoj jezičke tehnologije

18:00 – 18:15

Završne napomene

18:30 – 21:00

Konferencijska večera

Mesto održavanja konferencije

Palata nauke

Zadužbina Miodraga Kostića 
Kralja Milana 11
11000 Beograd

Palata nauke je centar za istraživanje i popularizaciju nauke u Srbiji. Nastala je s misijom da podstakne razvoj i razmenu znanja u partnerstvu sa Elektrotehničkim fakultetom Univerziteta u Beogradu i Radio-televizijom Srbije.

Zgrada Palate nauke predstavlja istorijsko nasleđe u centru Beograda. Osim naučnih centara koji se bave fundamentalnim istraživanjima i primenjenim tehnologijama, u zgradi je smešteno i preko 30 naučnih eksponata koji predstavljaju znanja o čoveku i Zemlji, tehnološkim inovacijama i svemiru.

ReLDI konferencija će se odvijati u salama „Horizont“ i „Reč“ na četvrtom spratu zgrade. Učesnicima će biti na raspolaganju i restoran, koji se nalazi na petom spratu, odmah iznad konferencijskih sala.

Prijava za učešće na konferenciji

Prijava je završena!

Nakon što stigne uplata, potvrdu ćemo poslati zajedno sa računom na E-mail adresu unetu u formular.

Važni datumi

12. maj 2025.

Uputstva za autore i recenzente

30. jun 2025.

Rok za predaju radova

26. jul 2025.

Obaveštenja o selekciji radova

26. jul 2025.

Početak rane prijave za učešće na konferenciji, objava uputstava za putovanje i smeštaj u Beogradu

8. septembar 2025.

Početak kasne prijave za učešće na konferenciji

25. septembar 2025.

Dobrodošlica i uvodna panel diskusija

26. septembar 2025.

Glavni program konferencije

Organizacioni odbor

Tanja Samardžić, član ReLDI centra, Univerzitet u Ženevi, predsednica Odbora

Mirjana Starović, član ReLDI centra, Leksikom Beograd, lokalna organizacija

Savetodavni članovi

Vlado Delić, Univerzitet u Novom Sadu

Sabina Halupka Rešetar, Univerzitet u Novom Sadu

Boško Nikolić, Univerzitet u Beogradu

Ranka Stanković, Univerzitet u Beogradu

Naučni odbor

Boban Arsenijević, Univerzitet u Gracu

Duygu Ataman, Bliskoistočni tehnički univerzitet (u Ankari)

Vuk Batanović, Univerzitet u Beogradu, član ReLDI centra

Christian Bentz, Univerzitet u Pasau

Silvia Bernardini, Univerzitet u Bolonji

Ksenija Bogetić Pejović, Slovenačka akademija nauka i umetnosti

Milica Denić, Univerzitet u Ženevi

Ljiljana Dolamić, Cyber-Defence Campus, armasuisse

Tomaž Erjavec, Institut Jožef Stefan

Adriano Ferraresi, Univerzitet u Bolonji

Darja Fišer, Univerzitet u Ljubljani and CLARIN ERIC

Goran Glavaš,  Univerzitet u Vircburgu

Gordana Hržica, Univerzitet u Zagrebu

Tihana Kraš, Univerzitet u Rijeci

Nikola Ljubešić, Institut Jožef Stefan, član ReLDI centra

Aleksandra Miletić, Univerzitet Pariz Nantere

Filip Miletić, Univerzitet u Štutgartu

Maja Miličević Petrović, Univerzitet u Bolonji, član ReLDI centra

Mirjana Mirić, Srpska akademija nauka i umetnosti

Sandra Mitrović, IDSIA Lugano

Giuseppe Samo, Univerzitet u Ženevi i Idiap

Yves Scherrer, Univerzitet u Oslu

Milan Sečujski, Univerzitet u Novom Sadu

Nikola Simić, Univerzitet u Novom Sadu

Marko Simonović, Univerzitet u Gracu

Irena Srdanović, Univerzitet u Puli

Miloš Stanojević, Univerzitetski koledž u Londonu

Siniša Suzić, Univerzitet u Novom Sadu

Kristina Štrkalj Despot, Institut za hrvatski jezik

Slavko Žitnik, Univerzitet u Ljubljani

Zaključci

Međunarodna konferencija pod naslovom “Naučni i računarski pristupi prirodnom jeziku” (engl. “Language science and technology”)  održana je 25. i 26. septembra 2025. u prostorijama Palate nauke u Beogradu u organizaciji udruženja “ReLDI centar za jezičke podatke”. Cilj konferencije je bio da obezbedi pregled aktuelnih naučnih dostignuća i dolazećih trendova u oblasti računarskog modeliranja prirodnog jezika putem generativnih modela (tipa GPT) i drugih naučnih tehnika zasnovanih na mašinskom učenju i obradi velikog obima jezičkih podataka. Naglasak je bio na dubljem razmatranju pitanja mašinskog prevođenja i konverzije između govora i teksta u kontekstu manjih jezika kao što su srpski, hrvatski, slovenački i njihovih regionalnih varijanti. Implicitno, kroz rad svih sesija, provlačilo se pitanje akcija neophodnih za intenziviranje razvoja jezičke infrastrukture i izrade raznovrsnih aplikacija primenom jezičkih tehnologija.

Učesnici

Konferencija je okupila stručnjake sa nekoliko evropskih univerziteta (Oslo, Mančester, Pariz Nanter, Ženeva, Bolonja, Grac, Ljubljana, Zagreb, Pula), Instituta Jožef Štefan u Ljubljani, kao i domaće stručnjake sa Fakulteta tehničkih nauka (Novi Sad), Elektrotehničkog i Rudarsko-geološkog fakulteta (Beograd) i sa dva instituta Srpske akademije nauka i umetnosti. Osim predstavnika akademske zajednice, konferenciji su prisustvovali i predstavnici kineske kompanije iFLYTEK, koja je bila glavni sponzor konferencije, domaće kompanije AlfaNum koja je bila ko-sponzor, predstavnici manjih kompanija za pružanje jezičkih usluga, kao i predstavnik Razvojnog programa Ujedinjenih nacija (UNDP).

Izveštaj rada po sesijama

 1. Okrugli sto: Kako jezičke tehnologije menjaju jezičke usluge

Prva sesija je bila posvećena transformaciji industrije pružanja jezičkih usluga (prevođenje, lokalizacija softvera i drugih proizvoda) pod uticajem jezičkih tehnologija, posebno generativnih modela. Zaključak je da se pružanje jezičkih usluga u velikoj meri automatizuje, svodeći potrebe za stručnim znanjem na usko područje visoko specijalizovanih usluga kao što su sudsko tumačenje i književni prevodi. Suprotno tome, dostupnost tehnoloških rešenja širi polje upotrebe automatskih usluga kao što je automatska transkripcija i sinteza govora. Dok je ova tehnologija u prošlosti bila ograničena na vrlo specifične upotrebe, na primer prilagođavanje medijskih sadržaja osobama oštećenog vida ili sluha, danas se njena upotreba širi na gotovo sve domene, od automatizacije poslovanja do upravljanja uređajima putem prirodnog jezika i konverzije medijskih sadržaja za široku publiku. Ovaj razvoj otvara nove mogućnosti za jezičke stručnjake koji sada mogu preuzeti bitnu ulogu u izradi podataka za obuku i evaluaciju generativnih modela. Tome svedoči i primer modela SPARK kompanije iFLYTEK čije performanse se konstantno unapređuju najviše zahvaljujući kvalitetnim podacima za treniranje i evaluaciju. Ovaj model već donekle podržava srpski, ali za poboljšanje performansi potrebno je angažovati stručnjake za srpski jezik koji takođe vladaju savremenom računarskom tehnologijom. 

2. Glavni naučni program

Sesije glavnog naučnog programa pokazale su trenutni nivo performansi niza savremenih modela na zadacima tematske i regionalne klasifikacije tekstova, kao i na zadatku konverzije govora u tekst. Osim performansi utvrđenih naučnom metodologijom, predstavljena istraživanja pokazuju da su regionalne karakteristike jezika kodirane u parametrima obučenih modela kao i to da je sastav podataka za obuku bitniji kod manjih modela (sa manje parametara), koji se, takođe, mogu bolje specijalizovati za pojedine varijante i domene upotrebe. U ovim sesijama predstavljena su i nova saznanja o strukturi i upotrebi jezika zasnovana na analizi velikog obima jezičkih podataka. Na primer, pokazano je da je povišena frekvencija glasa povezana sa negativnim sentimentom u parlamentarnim izlaganjima dok nema uočljivih obrazaca u variranju jačine glasa. Kvantitativnom analizom glagolske paradigme, pokazano je da je torlački govor strukturno bliži srpskom nego bugarskom, što je u suprotnosti sa dosadašnjim uverenjima. 

3. Sesija: Sinergije

Učesnici ove sesije su predstavili aktivnosti koje se odvijaju na nekoliko projekata u Srbiji i regionu uključujući projekte TESLA i AI-SPEAK, koje finansira Fond za nauku Republike Srbije. Ovi projekti se bave razvojem i obučavanjem modernih generativnih modela specifično za srpski. Takođe su predstavljeni rezultati projekta COMtext.SR, finansiranog od strane domaće IT zajednice, na izradi jezičkih resursa i tehnologija za obradu pravno-administrativnih tekstova na srpskom. Nakon diskusije o predstavljenim projektima, uočena je potreba za dodatnim aktivnostima kako bi se nove tehnologije razvijene u ovim projektima stavile u funkciju izrade rešenja za krajnje korisnike. 

4. Okrugli sto: Nacionalne strategije za razvoj jezičke tehnologije

Iako su savremeni generativni modeli mahom višejezični i mogu u određenoj meri da odgovore na potrebe korisnika na raznim jezicima, veliki pad performansi je uočljiv na svim jezicima u odnosu na engleski. Da bi se dobile zadovoljavajuće performanse za bilo koji drugi jezik, potrebna je nacionalna strategija i državna potpora stvaranju istraživačke jezičke infrastrukture. Kroz nacionalnu strategiju potrebno je sinhronizovati i usmeriti ka zajedničkom cilju rad svih aktera bitnih za razvoj jezičke tehnologije unutar jedne države. Osim istraživača na univerzitetima i institutima, značajni akteri su i državne institucije koje raspolažu velikim arhivama, poput Narodne biblioteke ili Radio-televizije Srbije, kao i krajnji korisnici jezičke tehnologije kao što su institucije državne uprave, kompanije i pojedinci. U Norveškoj, na primer, glavni nosilac razvoja infrastrukture za jezičke tehnologije je nacionalna biblioteka. U Velikoj Britaniji se kooperativnost u radu na zajedničkoj infrastrukturi stimuliše kroz nacionalni fond za nauku koji propisuje standarde za otvorenost i dostupnost svih rezultata finansiranih projekata. Dok se u samom istraživačkom radu podstiče konkurencija između istraživača, po pitanju zajedničke infrastrukture se podstiče kooperacija. Za Srbiju bi najbolje rešenje bilo uspostavljanje konzorcijuma istraživačkih i drugih institucija, uključujući državne, koje bi na infrastrukturi radile zajednički uz jasnu podelu zadataka, odgovornosti i obaveza, dok bi se u ostalim segmentima naučnog rada podsticala konkurencija.

Poziv na infrastrukturna ulaganja

Kao što su autoputevi i železnica infrastruktura koja pospešuje celokupan privredni razvoj, tako i tehnološka infrastruktura za obradu jezika pospešuje razvoj primene veštačke inteligencije kao nove oblasti IT industrije. Evidentno je da je kod velikih jezika razvoj velikih jezičkih modela i njihovih raznovrsnih primena bio podstaknut zahtevima tržišta i ogromnim mogućnostima komercijalizacije, što po prirodi nije slučaj kod malih jezika, kakvi su južnoslovenski jezici. Na ovim prostorima dosadašnji razvoj jezičkih resursa i alata poticao je, pre svega, iz sfere akademskih istraživanja. Da bi se napravio iskorak ka komercijalnim aplikacijama i širokoj upotrebi jezičkih tehnologija potrebna je sistemska podrška celog društva i države kroz infrastrukturna ulaganja. Razvoj tehnologije obrade prirodnog jezika dovodi do unapređenja efikasnosti javne uprave i državnih organa (sudstvo, ministarstva, opštine, itd.) i sredstava javnog informisanja, očuvanja kulturne baštine (biblioteke, muzeji, arhivi), kao i povećanja pristupačnosti različitih usluga građanima. Zato je neophodno da državne institucije (ministarstva i kancelarije zadužene za IKT sektor, odgovarajući sektori velikih državnih i privatnih preduzeća) povećaju svoj doprinos i angažovanje u razvoju jezičke infrastrukture i njene primene u konkretnim aplikacijama. 

Na konferenciji je predstavljen i predlog strategije za razvoj jezičke tehnologije u Srbiji čiji tekst će u narednom periodu biti predstavljen široj zajednici i eventualno dorađen prema dobijenim sugestijama. Tekst je namenjen prvenstveno relevantnim državnim institucijama kao konkretan plan za razvoj jezičkih tehnologija na koji će moći da se oslone pri donošenju odluka i upravljanju u svim aspektima vezanim za razvoj jezičke infrastrukture.

Sponzorstva

Glavni sponzor

Sponzori

Kontakt za kompanije koje žele da podrže konfereciju: info@reldi.rs