
Jezički modeli: veliki i mali
Nauka o jeziku zasnovana na podacima: eksperimenti i posmatranja
Računarska obrada teksta i govora
Jezik i veštačka inteligencija

PILOT-IZDANJE
PALATA NAUKE BEOGRAD
25–26. septembar 2025.
ReLDI konferencija
Naučni i računarski pristupi prirodnom jeziku
Računarsko modeliranje prirodnog jezika je pojavom generativnih modela tipa GPT izašlo iz naučne sfere i preplavilo sve oblasti društva i ekonomije. Činjenica je, međutim, da performanse modela opadaju čim se radi o nekom jeziku koji nije engleski. Dostizanje komercijalno vrednih performansi kad su u pitanju manji jezici, kao što su srpski, hrvatski, slovenački, makedonski i bugarski, zahteva dalja istraživanja u naučnoj sferi.
ReLDI centar je zato odlučio da pokrene naučnu konferenciju koja će se baviti pitanjima naučnog i računarskog modeliranja prirodnog jezika na primeru južnoslovenskih jezika. Naš cilj je da obezbedimo svima razumljiv pregled aktuelnih naučnih dostignuća i dolazećih trendova kroz izlaganja vodećih stručnjaka. Prvo, pilotno izdanje konferencije će se održati 25–26. septembra 2025. u Palati nauke u Beogradu
DETALJNI PROGRAM (na engleskom)
Predaja radova
Rok: 30. jun 2025.
Glavni program konferencije će sadržati izlaganja koja će naš Naučni odbor odabrati na osnovu kvaliteta i prikladnosti prijavljenih radova. Očekujemo nekoliko tipova radova:
- Obrada prirodnog jezika, sistematska evaluacija modela ili unapređenje performansi na jednom ili više od sledećih skupova podataka:
- Struktura jezika iz ugla opšte lingvistike: empirijsko testiranje hipoteza
- Teorijsko proučavanje jezika relevantno za računarsku obradu
- Teorijsko mašinsko učenje relevantno za računarsku obradu jezika
- Jezičke usluge i računarska tehnologija
- Pregled literature na navedene teme
Radovi treba da budu na engleskom jeziku, metodološki dobro utemeljeni i sa jasnim naučnim doprinosom. Sadržaj treba da bude nov (da nije objavljen ranije) i kompletan. Minimalna dužina je 4 stranice prema datom šablonu. Detaljnije informacije o formi i predaji radova dostupne su na engleskoj verziji stranice.
Prihvaćeni radovi će biti objavljeni u elektronskoj formi u konferencijskom zborniku.
Program
Detaljnije informacije (na engleskom)
25. septembar 2025.
15:30 – 16:00
Registracija
16:00 – 18:00
Panel diskusija
Kako jezičke tehnologije menjaju jezičke usluge
18:00 – 19:00
Svečani prijem
26. septembar 2025.
09:00 – 09:30
Registracija i uvodne napomene
09:30 – 10:30
Pozvano predavanje
10:30 – 11:00
Kafe pauza
11:00 – 12:00
Glavni naučni program – sesija 1
12:00 – 13:00
Program Sinergije – poster sesija
13:00 – 14:30
Pauza za ručak
14:30 – 15:00
Program Sinergije – diskusija
15:00 – 16:00
Glavni naučni program – sesija 2
16:00 – 16:30
Kafe pauza
16:30 – 18:00
Panel diskusija
Nacionalne strategije za razvoj jezičke tehnologije
18:00 – 18:15
Završne napomene
18:30 – 21:00
Konferencijska večera
Mesto održavanja konferencije
Palata nauke
Zadužbina Miodraga Kostića
Kralja Milana 11
11000 Beograd
Palata nauke je centar za istraživanje i popularizaciju nauke u Srbiji. Nastala je s misijom da podstakne razvoj i razmenu znanja u partnerstvu sa Elektrotehničkim fakultetom Univerziteta u Beogradu i Radio-televizijom Srbije.

Zgrada Palate nauke predstavlja istorijsko nasleđe u centru Beograda. Osim naučnih centara koji se bave fundamentalnim istraživanjima i primenjenim tehnologijama, u zgradi je smešteno i preko 30 naučnih eksponata koji predstavljaju znanja o čoveku i Zemlji, tehnološkim inovacijama i svemiru.
ReLDI konferencija će se odvijati u salama „Horizont“ i „Reč“ na četvrtom spratu zgrade. Učesnicima će biti na raspolaganju i restoran, koji se nalazi na petom spratu, odmah iznad konferencijskih sala.

Prijava za učešće na konferenciji
Prijava je završena!
Nakon što stigne uplata, potvrdu ćemo poslati zajedno sa računom na E-mail adresu unetu u formular.
Važni datumi
12. maj 2025.
Uputstva za autore i recenzente
30. jun 2025.
Rok za predaju radova
26. jul 2025.
Obaveštenja o selekciji radova
26. jul 2025.
Početak rane prijave za učešće na konferenciji, objava uputstava za putovanje i smeštaj u Beogradu
8. septembar 2025.
Početak kasne prijave za učešće na konferenciji
25. septembar 2025.
Dobrodošlica i uvodna panel diskusija
26. septembar 2025.
Glavni program konferencije
Organizacioni odbor
Tanja Samardžić, član ReLDI centra, Univerzitet u Ženevi, predsednica Odbora
Mirjana Starović, član ReLDI centra, Leksikom Beograd, lokalna organizacija
Savetodavni članovi
Vlado Delić, Univerzitet u Novom Sadu
Sabina Halupka Rešetar, Univerzitet u Novom Sadu
Boško Nikolić, Univerzitet u Beogradu
Ranka Stanković, Univerzitet u Beogradu
Naučni odbor
Boban Arsenijević, Univerzitet u Gracu
Duygu Ataman, Bliskoistočni tehnički univerzitet (u Ankari)
Vuk Batanović, Univerzitet u Beogradu, član ReLDI centra
Christian Bentz, Univerzitet u Pasau
Silvia Bernardini, Univerzitet u Bolonji
Ksenija Bogetić Pejović, Slovenačka akademija nauka i umetnosti
Milica Denić, Univerzitet u Ženevi
Ljiljana Dolamić, Cyber-Defence Campus, armasuisse
Tomaž Erjavec, Institut Jožef Stefan
Adriano Ferraresi, Univerzitet u Bolonji
Darja Fišer, Univerzitet u Ljubljani and CLARIN ERIC
Goran Glavaš, Univerzitet u Vircburgu
Gordana Hržica, Univerzitet u Zagrebu
Tihana Kraš, Univerzitet u Rijeci
Nikola Ljubešić, Institut Jožef Stefan, član ReLDI centra
Aleksandra Miletić, Univerzitet Pariz Nantere
Filip Miletić, Univerzitet u Štutgartu
Maja Miličević Petrović, Univerzitet u Bolonji, član ReLDI centra
Mirjana Mirić, Srpska akademija nauka i umetnosti
Sandra Mitrović, IDSIA Lugano
Giuseppe Samo, Univerzitet u Ženevi i Idiap
Yves Scherrer, Univerzitet u Oslu
Milan Sečujski, Univerzitet u Novom Sadu
Nikola Simić, Univerzitet u Novom Sadu
Marko Simonović, Univerzitet u Gracu
Irena Srdanović, Univerzitet u Puli
Miloš Stanojević, Univerzitetski koledž u Londonu
Siniša Suzić, Univerzitet u Novom Sadu
Kristina Štrkalj Despot, Institut za hrvatski jezik
Slavko Žitnik, Univerzitet u Ljubljani
Zaključci
Međunarodna konferencija pod naslovom “Naučni i računarski pristupi prirodnom jeziku” (engl. “Language science and technology”) održana je 25. i 26. septembra 2025. u prostorijama Palate nauke u Beogradu u organizaciji udruženja “ReLDI centar za jezičke podatke”. Cilj konferencije je bio da obezbedi pregled aktuelnih naučnih dostignuća i dolazećih trendova u oblasti računarskog modeliranja prirodnog jezika putem generativnih modela (tipa GPT) i drugih naučnih tehnika zasnovanih na mašinskom učenju i obradi velikog obima jezičkih podataka. Naglasak je bio na dubljem razmatranju pitanja mašinskog prevođenja i konverzije između govora i teksta u kontekstu manjih jezika kao što su srpski, hrvatski, slovenački i njihovih regionalnih varijanti. Implicitno, kroz rad svih sesija, provlačilo se pitanje akcija neophodnih za intenziviranje razvoja jezičke infrastrukture i izrade raznovrsnih aplikacija primenom jezičkih tehnologija.
Učesnici
Konferencija je okupila stručnjake sa nekoliko evropskih univerziteta (Oslo, Mančester, Pariz Nanter, Ženeva, Bolonja, Grac, Ljubljana, Zagreb, Pula), Instituta Jožef Štefan u Ljubljani, kao i domaće stručnjake sa Fakulteta tehničkih nauka (Novi Sad), Elektrotehničkog i Rudarsko-geološkog fakulteta (Beograd) i sa dva instituta Srpske akademije nauka i umetnosti. Osim predstavnika akademske zajednice, konferenciji su prisustvovali i predstavnici kineske kompanije iFLYTEK, koja je bila glavni sponzor konferencije, domaće kompanije AlfaNum koja je bila ko-sponzor, predstavnici manjih kompanija za pružanje jezičkih usluga, kao i predstavnik Razvojnog programa Ujedinjenih nacija (UNDP).
Izveštaj rada po sesijama
1. Okrugli sto: Kako jezičke tehnologije menjaju jezičke usluge
Prva sesija je bila posvećena transformaciji industrije pružanja jezičkih usluga (prevođenje, lokalizacija softvera i drugih proizvoda) pod uticajem jezičkih tehnologija, posebno generativnih modela. Zaključak je da se pružanje jezičkih usluga u velikoj meri automatizuje, svodeći potrebe za stručnim znanjem na usko područje visoko specijalizovanih usluga kao što su sudsko tumačenje i književni prevodi. Suprotno tome, dostupnost tehnoloških rešenja širi polje upotrebe automatskih usluga kao što je automatska transkripcija i sinteza govora. Dok je ova tehnologija u prošlosti bila ograničena na vrlo specifične upotrebe, na primer prilagođavanje medijskih sadržaja osobama oštećenog vida ili sluha, danas se njena upotreba širi na gotovo sve domene, od automatizacije poslovanja do upravljanja uređajima putem prirodnog jezika i konverzije medijskih sadržaja za široku publiku. Ovaj razvoj otvara nove mogućnosti za jezičke stručnjake koji sada mogu preuzeti bitnu ulogu u izradi podataka za obuku i evaluaciju generativnih modela. Tome svedoči i primer modela SPARK kompanije iFLYTEK čije performanse se konstantno unapređuju najviše zahvaljujući kvalitetnim podacima za treniranje i evaluaciju. Ovaj model već donekle podržava srpski, ali za poboljšanje performansi potrebno je angažovati stručnjake za srpski jezik koji takođe vladaju savremenom računarskom tehnologijom.
2. Glavni naučni program
Sesije glavnog naučnog programa pokazale su trenutni nivo performansi niza savremenih modela na zadacima tematske i regionalne klasifikacije tekstova, kao i na zadatku konverzije govora u tekst. Osim performansi utvrđenih naučnom metodologijom, predstavljena istraživanja pokazuju da su regionalne karakteristike jezika kodirane u parametrima obučenih modela kao i to da je sastav podataka za obuku bitniji kod manjih modela (sa manje parametara), koji se, takođe, mogu bolje specijalizovati za pojedine varijante i domene upotrebe. U ovim sesijama predstavljena su i nova saznanja o strukturi i upotrebi jezika zasnovana na analizi velikog obima jezičkih podataka. Na primer, pokazano je da je povišena frekvencija glasa povezana sa negativnim sentimentom u parlamentarnim izlaganjima dok nema uočljivih obrazaca u variranju jačine glasa. Kvantitativnom analizom glagolske paradigme, pokazano je da je torlački govor strukturno bliži srpskom nego bugarskom, što je u suprotnosti sa dosadašnjim uverenjima.
3. Sesija: Sinergije
Učesnici ove sesije su predstavili aktivnosti koje se odvijaju na nekoliko projekata u Srbiji i regionu uključujući projekte TESLA i AI-SPEAK, koje finansira Fond za nauku Republike Srbije. Ovi projekti se bave razvojem i obučavanjem modernih generativnih modela specifično za srpski. Takođe su predstavljeni rezultati projekta COMtext.SR, finansiranog od strane domaće IT zajednice, na izradi jezičkih resursa i tehnologija za obradu pravno-administrativnih tekstova na srpskom. Nakon diskusije o predstavljenim projektima, uočena je potreba za dodatnim aktivnostima kako bi se nove tehnologije razvijene u ovim projektima stavile u funkciju izrade rešenja za krajnje korisnike.
4. Okrugli sto: Nacionalne strategije za razvoj jezičke tehnologije
Iako su savremeni generativni modeli mahom višejezični i mogu u određenoj meri da odgovore na potrebe korisnika na raznim jezicima, veliki pad performansi je uočljiv na svim jezicima u odnosu na engleski. Da bi se dobile zadovoljavajuće performanse za bilo koji drugi jezik, potrebna je nacionalna strategija i državna potpora stvaranju istraživačke jezičke infrastrukture. Kroz nacionalnu strategiju potrebno je sinhronizovati i usmeriti ka zajedničkom cilju rad svih aktera bitnih za razvoj jezičke tehnologije unutar jedne države. Osim istraživača na univerzitetima i institutima, značajni akteri su i državne institucije koje raspolažu velikim arhivama, poput Narodne biblioteke ili Radio-televizije Srbije, kao i krajnji korisnici jezičke tehnologije kao što su institucije državne uprave, kompanije i pojedinci. U Norveškoj, na primer, glavni nosilac razvoja infrastrukture za jezičke tehnologije je nacionalna biblioteka. U Velikoj Britaniji se kooperativnost u radu na zajedničkoj infrastrukturi stimuliše kroz nacionalni fond za nauku koji propisuje standarde za otvorenost i dostupnost svih rezultata finansiranih projekata. Dok se u samom istraživačkom radu podstiče konkurencija između istraživača, po pitanju zajedničke infrastrukture se podstiče kooperacija. Za Srbiju bi najbolje rešenje bilo uspostavljanje konzorcijuma istraživačkih i drugih institucija, uključujući državne, koje bi na infrastrukturi radile zajednički uz jasnu podelu zadataka, odgovornosti i obaveza, dok bi se u ostalim segmentima naučnog rada podsticala konkurencija.
Poziv na infrastrukturna ulaganja
Kao što su autoputevi i železnica infrastruktura koja pospešuje celokupan privredni razvoj, tako i tehnološka infrastruktura za obradu jezika pospešuje razvoj primene veštačke inteligencije kao nove oblasti IT industrije. Evidentno je da je kod velikih jezika razvoj velikih jezičkih modela i njihovih raznovrsnih primena bio podstaknut zahtevima tržišta i ogromnim mogućnostima komercijalizacije, što po prirodi nije slučaj kod malih jezika, kakvi su južnoslovenski jezici. Na ovim prostorima dosadašnji razvoj jezičkih resursa i alata poticao je, pre svega, iz sfere akademskih istraživanja. Da bi se napravio iskorak ka komercijalnim aplikacijama i širokoj upotrebi jezičkih tehnologija potrebna je sistemska podrška celog društva i države kroz infrastrukturna ulaganja. Razvoj tehnologije obrade prirodnog jezika dovodi do unapređenja efikasnosti javne uprave i državnih organa (sudstvo, ministarstva, opštine, itd.) i sredstava javnog informisanja, očuvanja kulturne baštine (biblioteke, muzeji, arhivi), kao i povećanja pristupačnosti različitih usluga građanima. Zato je neophodno da državne institucije (ministarstva i kancelarije zadužene za IKT sektor, odgovarajući sektori velikih državnih i privatnih preduzeća) povećaju svoj doprinos i angažovanje u razvoju jezičke infrastrukture i njene primene u konkretnim aplikacijama.
Na konferenciji je predstavljen i predlog strategije za razvoj jezičke tehnologije u Srbiji čiji tekst će u narednom periodu biti predstavljen široj zajednici i eventualno dorađen prema dobijenim sugestijama. Tekst je namenjen prvenstveno relevantnim državnim institucijama kao konkretan plan za razvoj jezičkih tehnologija na koji će moći da se oslone pri donošenju odluka i upravljanju u svim aspektima vezanim za razvoj jezičke infrastrukture.
Sponzorstva
Kontakt za kompanije koje žele da podrže konfereciju: info@reldi.rs



