The members of the ReLDI Centre are experts in text processing and quantitative linguistic analysis, primarily for South Slavic languages. We teach in-person seminars and create online learning materials.
This page contains an overview of our past activities and learning materials. If you need to develop a new course or want to organise a seminar at your institution on one of the topics we deal with, you can contact us at reldi.centre@gmail.com.
Online courses on Open edX
Created as part of the initial ReLDI project during 2016, our online courses in Serbian can be used for self study, as complementary sources in preparing university courses or as supporting materials for supervising student projects. With mandatory free-of-charge registration on the Open edX platform of the University of Zurich, these four courses are open to all interested parties:

Research Methods in Linguistics
(in Serbian)
Topics
Topics include general features of scientific research and key elements of quantitative research: research design, variables, sampling. The course is relevant as a foundation for corpus and experimental research, as well as for statistical analysis.

Introduction to Corpus Methods in Linguistics
(in Serbian)
Topics
Course topics include the technical aspects of the construction and use of language corpora, as well as methodological issues concerning the search of corpora and their use in language analysis..

Introduction to Experimental Methods in Linguistics
(In Serbian)
Topics
Course topics include the preparation of experiments, their comparison with other data sources in linguistics, the selection of subjects and stimuli, and the quality control of research.

Introduction to Statistics for Language Data
(in Serbian)
Topics
Course topics include the computation of descriptive measures, statistical inference, and a variety of inferential tests (t-tests, correlation, nonparametric tests). Statistical software used in the course is R.
Seminars
In the following list, you can find programs and materials from seminars held by members of the ReLDI project and the ReLDI Centre in previous years.
BELGRADE 1
June 2016
Empirical data in language research: resources and methods (1) – in Serbian
Filološki fakultet u Beogradu, 2–5. juna 2016.
Glavne teme seminara bile su:
- Uvod u ReLDI: ciljevi projekta i dostupni resursi
- Eksperimentalne metode u jezičkim istraživanjima
- Osnove korpusnih metoda u jezičkim istraživanjima
PROGRAM [ pdf ]
Četvrtak, 2.6.2016.
15:00–16:00 Kad nas podaci iznenade [uvodno predavanje]
16:00–16:45 Ko sam, gde sam, kuda idem (1) [predstavljanje učesnika seminara]
16:45–17:15 Pauza za kafu
17:15–18:00 Ko sam, gde sam, kuda idem (2) [predstavljanje učesnika seminara]
18:00–19:00 Gde je tu pravilo (1): Uvod u praktične zadatke
Petak, 3.6.2016.
9:00–11:00 ReLDI za početnike (1): Korpusi i alati [predstavljanje projekta]
11:00–11:30 Pauza za kafu
11:30–12:30 ReLDI za početnike (2): Instrumenti [predstavljanje projekta]
12:30–13:30 Sekcija za goste: Digitalizacija srpskih službenih novina 1813–2013., Eksperimentalna morfosintaksa južnoslovenskih jezika (EMSS) i Projekt AThEME i Bilingualism Matters@Rijeka: produbljivanje i popularizacija znanstvenih spoznaja o višejezicnosti [predstavljanje projekata]
13:30–15:00 Pauza za ručak
15:00–16:30 Dušica Filipović Đurđević (Univerzitet u Novom Sadu i Univerzitet u Beogradu): Kombinovanje korpusnog i eksperimentalnog pristupa u razumevanju morfološke kompleksnosti jezika [predavanje po pozivu] [prezentacija]
16:30–17:00 Pauza za kafu
17:00–19:00 Kako iskoristiti potencijal korpusa u istraživanjima jezika? [predavanje sa praktičnim zadacima] [Regularni izrazi i CQL] [Osnovno uputstvo za Sketch Engine]
Subota, 4.6.2016.
9:00–11:00 Kada su lingvistima potrebni eksperimenti i kako ih sprovesti? [predavanje]
11:00–11:30 Pauza za kafu
11:30–13:30 Kakvi eksperimenti se koriste u istraživanjima jezika? [predavanje sa praktičnim zadacima]
13:30–15:00 Pauza za ručak
15:00–16:30 Tihana Kraš (Univerzitet u Rijeci): Prosudbe lingvističke prihvatljivosti: tehnika procjene veličine u usporedbi s tradicionalnim tehnikama [predavanje po pozivu] [prezentacija]
16:30–17:00 Pauza za kafu
17:00–19:00 Kako se sastavlja eksperiment? [praktični zadaci]
20:00 Zajednička večera
Nedelja, 5.6.2016.
9:00–11:00 Gde je tu pravilo (2): Predstavljanje rešenja praktičnih zadataka
11:00–11:30 Pauza za kafu
11:30–13:00 Kad se suprotni podaci privuku [diskusija i zaključci]
***
Kratke biografije učesnika seminara
ZAGREB 1
June 2016
Empirical data in language research: resources and methods (2) – in Croatian
Filozofski fakultet u Zagrebu, 27–30. juna 2016.
Glavne teme seminara bile su:
- Uvod u ReLDI: ciljevi projekta i dostupni resursi
- Korpusne metode u jezičnim istraživanjima
- Osnove eksperimentalnih metoda u jezičnim istraživanjima
PROGRAM [ pdf ]
Ponedjeljak, 27.6.2016.
15:00–16:00 Kad nas podaci iznenade [uvodno predavanje]
16:00–16:45 Tko sam, gdje sam, kamo idem (1) [predstavljanje sudionika]
16:45–17:15 Pauza za kavu
17:15–18:00 Tko sam, gdje sam, kamo idem (2) [predstavljanje sudionika]
18:00–19:00 Gdje je tu pravilo (1): Uvod u praktične zadatke
Utorak, 28.6.2016.
9:00–11:00 ReLDI za početnike (1): Korpusi i alati [predstavljanje projekta] [Uputstvo za Python knjižnicu]
11:00–11:30 Pauza za kavu
11:30–12:30 ReLDI za početnike (2): Instrumenti [predstavljanje projekta]
12:30–13:30 Anita Peti-Stantić: EMSS — Eksperimentalna morfosintaksa južnoslavenskih jezika; Darja Fišer: JANES — Jezikoslovna analiza nestandardnog slovenskog; Simon Krek: SSSJ — Mrežni rječnik slovenskog jezika [predstavljanje projekata]
13:30–15:00 Pauza za ručak
15:00–16:30 Gordana Hržica (Sveučilište u Zagrebu): Miljenko Kokot i Barbara Kolar vs. baka Štefica i susjed Marko: što donose korpusi govornog i pisanog jezika osoba koji nisu profesionalni pisci ili govornici [pozvano predavanje]
16:30–17:00 Pauza za kavu
17:00–19:00 Kako se provode eksperimenti u lingvistici? [predavanje s praktičnim zadacima] [Prvi koraci]
Srijeda, 29.6.2016.
9:00–11:00 Kako izgledaju korpusna istraživanja jezika? [predavanje]
11:00–11:30 Pauza za kavu
11:30–13:30 Kako se sve mogu pretraživati korpusi? [predavanje s praktičnim zadacima][Regularni izrazi i CQL] [Osnovno uputstvo za Sketch Engine]
13:30–15:00 Pauza za ručak
15:00–17:00 Kako povezati eksperimentalne i korpusne podatke? [praktični zadaci]
17:00–17:30 Pauza za kavu
17:30–19:00 Nikola Dobrić (Alpen-Adria Universität Klagenfurt): Savremena korpusna lingvistika i upotreba učeničkih korpusa u primenjenoj lingvistici [pozvano predavanje]
20:00 Zajednička večera
Četvrtak, 30.6.2016.
9:00–11:00 Gdje je tu pravilo (2): Predstavljanje rješenja praktičnih zadataka
11:00–11:30 Pauza za kavu
11:30–13:00 Kad se suprotni podaci privuku [diskusija i zaključci]
***
Kratke biografije učesnika seminara
BELGRADE 2
January 2017
Data analysis in Linguistics (1) – in Serbian
Filološki fakultet u Beogradu, 26–29. januara 2017.
Glavne teme seminara bile su:
- Rad sa većim količinama jezičkih podataka
- Empirijski podaci i teorijska lingvistika
- Statistička analiza jezičkih podataka
PROGRAM [ pdf ]
Četvrtak, 26.1.2017.
15:00–15:30 Predikcija u lingvistici [uvodno predavanje]
15:30–16:30 Ko sam, šta prikupljam, kako analiziram (1) [predstavljanje učesnika seminara]
16:30–17:00 Pauza za kafu
17:00–17:30 Ko sam, šta prikupljam, kako analiziram (2) [predstavljanje učesnika seminara]
17:30–19:00 Boban Arsenijević (Univerzitet u Nišu): Elicitirana produkcija i sud prihvatljivosti u testiranju hipoteza teorijske sintakse [predavanje po pozivu] [prezentacija]
Petak, 27.1.2017.
9:00–10:00 Anotacija kao lingvistička analiza [predavanje]
10:00–11:00 Obrada teksta pomoću ReLDI biblioteke [predavanje sa praktičnim zadacima] [Materijali za ceo dan] [extract.py]
11:00–11:30 Pauza za kafu
11:30–13:30 Ekstrakcija podataka pomoću namenskog programa [predavanje sa praktičnim zadacima]
13:30–15:00 Pauza za ručak
15:00–16:30 Ekstrakcija podataka pomoću namenskog programa (nastavak) [predavanje sa praktičnim zadacima]
16:30–17:00 Pauza za kafu
17:00–19:00 Osnovni koncepti u mašinskom učenju [predavanje]
Subota, 28.1.2017.
9:00–11:00 Statističko zaključivanje, R i priprema podataka [predavanje sa praktičnim zadacima]
[Prvi koraci ka statističkoj analizi] [Uvod u R] [Test podaci 1] [Test podaci 2]
11:00–11:30 Pauza za kafu
11:30–13:30 Deskriptivna statistika i vizualizacija podataka [predavanje sa praktičnim zadacima]
13:30–15:00 Pauza za ručak
15:00–16:30 Inferencijalni statistički testovi [predavanje]
16:30–17:00 Pauza za kafu
17:00–19:00 Od deskriptivne do inferencijalne analize [praktični zadaci]
20:00 Zajednička večera
Nedelja, 29.1.2017.
9:00–11:00 Kako izabrati odgovarajuću analizu? [praktični zadaci] [rešenja zadataka] [dopunjen kod (veličina efekta i dr.)]
11:00–11:30 Pauza za kafu
11:30–13:00 Koliko su lingvistima potrebni programiranje i statistika? [diskusija i zaključci]
***
Kratke biografije učesnika seminara
Fotografije sa seminara
ZAGREB 2
February 2017
Data analysis in Linguistics (2) – in Croatian
Filozofski fakultet u Zagrebu, 23–26. februara 2017.
Glavne teme ovog seminara bile su:
- Rad s većim količinama jezičnih podataka
- Automatska analiza jezika
- Statistička analiza jezičnih podataka
PROGRAM
Četvrtak, 23.2.2017.
15:00–16:30 Predikcija u lingvistici [uvodno predavanje]
16:30–17:00 Pauza za kavu
17:00–18:30 Tko sam, što prikupljam, kako analiziram [predstavljanje sudionika seminara]
18:30–19:00 Pregled sadržaja seminara
Petak, 24.2.2017.
9:00–10:00 Anotacija kao lingvistička analiza [predavanje]
10:00–11:00 Obrada teksta pomoću ReLDI biblioteke [predavanje sa praktičnim zadacima] [Materijali za cijeli dan] [extract.py]
11:00–11:30 Pauza za kavu
11:30–13:30 Ekstrakcija podataka pomoću Pythona [predavanje sa praktičnim zadacima]
13:30–15:00 Pauza za ručak
15:00–16:30 Željko Agić, Jezične tehnologije za sve jezike? [pozvano predavanje]
16:30–17:00 Pauza za kavu
17:00–19:00 Ekstrakcija podataka pomoću Pythona (nastavak) [predavanje sa praktičnim zadacima]
Subota, 25.2.2017.
9:00–11:00 Statističko zaključivanje, R i priprema podataka [predavanje sa praktičnim zadacima] [Prvi koraci ka statističkoj analizi] [Uvod u R] [Test podaci 1] [Test podaci 2]
11:00–11:30 Pauza za kavu
11:30–13:30 Deskriptivna statistika i vizualizacija podataka [predavanje sa praktičnim zadacima]
13:30–15:00 Pauza za ručak
15:00–16:30 Petar Milin, Diskriminaciono učenje: mogućnosti interdisciplinarnog pristupa fenomenima jezika i komunikacije [pozvano predavanje] [prezentacija]
16:30–17:00 Pauza za kavu
17:00–19:00 Inferencijalni statistički testovi [predavanje sa praktičnim zadacima]
20:00 Zajednička večera
Nedjelja, 26.2.2017.
9:00–11:00 Kako izabrati odgovarajuću analizu? [praktični zadaci] [rešenja zadataka] [dopunjen kod (veličina efekta i dr.)]
11:00–11:30 Pauza za kavu
11:30–13:00 Koliko su lingvistima potrebni programiranje i statistika? [diskusija i zaključci]
***
Kratke biografije učesnika seminara
Fotografije sa seminara
LJUBLJANA
June 2017
Empirical data in Linguistics: From study design to data analysis – taught in English, materials in Serbian
Ljubljana, 21–23. juna 2017,
U saradnji sa slovenačkim projektom JANES
PROGRAM
Sreda, 21.6.2017.
9:00–10:30 Podaci i predikcija u lingvistici [uvodno predavanje]
10:30–11:00 Pauza za kafu
11:00–12:30 Lingvistička istraživanja zasnovana na korpusima [predavanje]
12:30–13:30 Pauza za ručak
13:30–15:00 Kako doći do korpusnih podataka: Regex i CQL [Zadaci] [Pregled metakaraktera i vrsta upita] [Osnovno uputstvo za Sketch Engine] [Rešenja zadataka]
15:00–15:30 Pauza za kafu
15:30–17:00 Uvod u praktične zadatke (1) [Uputstva]
Četvrtak, 22.6.2017.
9:00–10:30 Uloga eksperimenta u lingvistici [predavanje]
10:30–11:00 Pauza za kafu
11:00–12:30 Eksperimentalna lingvistika kao metodološki uzor za korpusnu lingvistiku?
12:30–13:30 Pauza za ručak
13:30–15:00 Priprema podataka za statističku analizu [Podaci (tviti.csv)] [Kod za R] [Dodatni podaci (reldi.tsv)] [Dopunjen kod za R]
15:00–15:30 Pauza za kafu
15:30–17:00 Praktični zadaci (2)
20:00 Večera
Petak, 23.6.2017.
9:00–10:30 Deskriptivna statistika, statističko zaključivanje i statistički testovi [predavanje]
10:30–11:00 Pauza za kafu
11:00–12:30 Analiza i vizualizacija podataka
12:30–13:30 Pauza za ručak
13:30–15:00 Praktični zadaci (3)
15:00–15:30 Pauza za kavu
15:30–17:00 Praktični zadaci (4): Predstavljanje rezultata
20:00 Zajednička večera
20:00 Oproštajna žurka (koncert benda Melanholiki u kafiću SEM)
***
Predavači:
Maja Miličević (Univerzitet u Beogradu)
Tanja Samardžić (Univerzitet u Cirihu)
NIKŠIĆ, Montenegro
June 2018
From text data to numbers: An introduction to the statistical analysis of language data – in Serbian
Nikšić, 28–30. juna 2018.
Ovaj seminar održan je u saradnji sa Filološkim fakultetom Univerziteta Crne Gore. Cilj seminara bilo je upoznavanje učesnika sa osnovnim odlikama kvantitativnih istraživanja jezika, uz upotrebu statističkog softvera R. Potreba za seminarom javila se usled dostupnosti sve veće količine empirijskih jezičkih podataka, za čiju analizu su potrebni postupci statističke analize koji su najčešće odsutni iz obrazovnih programa u domenu jezika.
PROGRAM [ pdf ]
Četvrtak, 28.6.2018.
9:15-9:30 Registracija učesnika
9:30-10.00 Pozdravna riječ dekana
10:00-11:30 Podaci i predikcija u lingvistici
11:30-12:00 Pauza za kafu
12:00-13:15 Kako do podataka i šta dalje sa njima
13:15-14:15 Pauza za ručak
14:15-15:45 Priprema podataka za statističku analizu (R)
15:45-16:00 Pauza za kafu
16:00-16:45 Samostalni praktični zadaci (R)
Petak, 29.6.2018.
9:15-10:30 Početni uvid u podatke
10:30-11:00 Pauza za kafu
11:00-12:30 Statističko zaključivanje
12:30-13:30 Opisivanje i vizualizacija podataka (R)
13:30-14:30 Pauza za ručak
14:30-15:45 Samostalni praktični zadaci (R)
15:45-16:00 Pauza za kafu
16:00-16:45 Samostalni praktični zadaci (R)
Subota, 30.6.2018.
9:15-10:45 Izbor statističkog testa
10:45-11:30 Izrada testova (R)
11:30-12:00 Pauza za kafu
12:00-13:30 Samostalni praktični zadaci (R)
13:30-14:30 Pauza za ručak
14:30-16:00 Predstavljanje rezultata zadataka
***
Predavači:
Maja Miličević Petrović (Univerzitet u Beogradu)
Tanja Samardžić (Univerzitet u Cirihu)
PETNICA, Serbia
November 2021
Computer Assisted Translation(CAT) tools – in Serbian
Istraživačka stanica Petnica, 18–21. novembra 2021. godine.
Glavni cilj seminara bio je da uvede polaznike u svet savremenog profesionalnog prevođenja koje se u velikoj meri oslanja na jezičke tehnologije. Nakon završenog seminara, polaznici su bili osposobljeni za samostalan uspešan rad u industriji lokalizacije uz upotrebu CAT alata i fleksibilnost u njihovom izboru. Osim tehničkih veština, polaznici su bili upućeni i u profesionalne zahteve:
- kako proceniti cenu, obim i vremenski rok za konkretan posao
- kako isporučiti kvalitetan prevod u predviđenom roku
- kako i gde pronaći prevodilačke poslove
Nastavu je vodila Mirjana Starović, članica ReLDI centra za jezičke podatke i direktorka kompanije Lexicom – jezički inženjering d.o.o.
Detaljan plan rada
Ishodi seminara:
– Samostalan i uspešan rad u industriji prevođenja i lokalizacije uz upotrebu CAT alata, fleksibilnost u izboru CAT alata
– Poznavanje i razumevanje toka rada: procena cene, obima i vremenskog roka za konkretan posao
– Usvajanje standarda kvaliteta usluge: isporučiti kvalitetan prevod u predviđenom roku
PROGRAM
18. novembar 2021. (1. dan)
13:00–14:00 Upoznavanje učesnika i predstavljanje sadržaja kursa
15:30–16:00 Predstavljanje ISP
Jelena Gledić, pomoćnica direktora IS Petnica — programski sektor i viši lektor za kineski jezik, Filološki fakultet u Beogradu
16:00–17:00 Uvod u lokalizaciju (Prezentacija uz diskusiju sa predavačem)
Cilj: Prepoznavanje mesta i uloge prevođenja u celokupnom procesu lokalizacije
Sadržaj: Šta je lokalizacija, šta sve podrazumeva i obuhvata. Potreba za lokalizacijom na tržištima. Proces rada i mogući zadaci za koje su potrebni lingvisti: Style Guide, terminologija, prevođenje, pregled (lektura), QA, LQI, LSO
Literatura: The Future of the Localization Industry
17:00–18:00 Uvod u praktične zadatke (20 minuta instrukcije 40 minuta samostalan rad)
Cilj: Utvrđivanje polaznog nivoa veština; organizacija praktičnog rada
Sadržaj: Podela zadataka; polaznici se dele u 5 grupa i dobijaju tekstove za prevođenje (dužine oko 150 reči) bez CAT alata iz sledećih oblasti: medicina/farmacija, lokalizacija softvera, pravo, teška industrija i marketing.
Materijali će biti podeljeni na času
18:30–19:30 Instalacija i postavljanje alata (Praktičan rad uz instrukcije i praćenje)
Cilj: Obezbeđivanje tehničkih uslova za samostalan rad (vežbe i izrade zadataka, prevođenje)
Sadržaj: Preuzimanje i instaliranje odgovarajućeg alata (SDL Trados Studio).
Materijali: SDL Trados Studio free trial
21:00–22:00 Iskustva sa prevođenjem pomoću CAT alata (Prezentacija Jelene Gledić uz diskusiju)
Cilj: Usvajanje aktivnog pristupa radu i prevazilaženju prepreka
Sadržaj: Upoznavanje sa dobrim i lošim strana računarski asistiranog prevođenja, problemi i rešenja u savladavanju novih alata i lokalizacija kao povremeni posao
Literatura: The usefulness of CAT tools
19. novembar 2021. (2. dan)
10:00–11:00 Uvod u CAT alate (30 minuta diskusija sa predavačem, 30 minuta samostalni rad)
Cilj: Pregled funkcionalnosti koje pružaju CAT alati u cilju osiguravanja kvaliteta prevoda i mogućnosti njihovog korišćenja
Sadržaj: Istorijska perspektiva. Opšti principi funkcionisanja. Šta su prevodilačke memorije (Translation Memory – TM). Objašnjenje i značaj odobrene terminologije (Term recognition). Dalji razvoj (uloga mašinskog prevođenja)
Literatura: The Routledge Encyclopedia of Translation Technology, What is a CAT tool? — Translation 101
12:00–13:00 Uvod u CAT alate (30 minuta diskusija sa predavačem, 30 minuta samostalni rad sa materijalima)
Cilj: Pregled funkcionalnosti koje pružaju CAT alati u cilju osiguravanja kvaliteta prevoda i mogućnosti njihovog korišćenja
Sadržaj: Objašnjenje funkcija u konkretnom alatu (SDL Trados Studio). Pregled prozora za prevođenje (Editor). Konkretna uputstva u specifičnom alatu za pretraživanje TM-a (Concordance). Konkretna uputstva u specifičnom alatu za praćenje odobrene terminologije (Term Recognition)
Literatura: How to translate a document in SDL Trados Studio 2019 translation software
13:00–14:00 Prva evaluacija praktičnog rada (Razgovor sa predavačem)
Cilj: Uvid u trenutno stanje veština
Sadržaj: Komentari na predate zadatke
16:00–18:00 Praktičan rad (Samostalan rad)
Cilj: Prevođenje tekstova uz pomoć CAT alata
Sadržaj: Prevođenje proširenih tekstova (oko 600 reči) uz pomoć CAT alata. Prevođenje se vrši uz pripremljene memorije za svaku oblast i ponuđenu prevedenu osnovnu terminologiju.
Materijali će biti podeljeni na času
18:00–19:00 Kreiranje translacionih memorija i terminoloških baza (30 minuta samostalni rad sa materijalima, 30 minuta diskusija sa predavačem)
Cilj: Osposobljavanje za samostalno kreiranje translacionih memorija i terminoloških baze u različitim alatima i prevođenje pomoću njih
Sadržaj: Kreiranje translacione memorije od postojećih prevodnih ekvivalenata. Kreiranje prazne (nove) translacione memorije. Kreiranje terminološke baze. Unošenje termina u terminološku bazu (na primeru alata SDL Trados Studio)
Literatura: How to create a translation memory in SDL Trados Studio , Why you should use a termbase in Studio and how to get started
19:00–20:00 Principi prevođenja: konzistentnost i poštovanje instrukcija (Diskusija sa predavačem, Praktičan rad)
Cilj: Pregled potrebnih aktivnosti pre započinjanja prevođenja – objašnjenje kako treba započeti rad u nekom projektu na konkretnim primerima. Priprema za prevođenje
Sadržaj: Pregled različitih vrsta instrukcija koje dolaze uz zadatke: Style Guide, instrukcije klijenta, posebna uputstva. Kako utvrditi prioritete u obezbeđenim resursima
Literatura: Microsoft Language Portal
21:00–22:00 Principi prevođenja: prevođenje neprevodivog (30 min diskusija sa predavačem, 30 min samostalan rad)
Cilj: Objašnjenje tagova i ICU sintakse. Uvid u krajnji proizvod
Sadržaj: Upoznavanje sa neprevodivim delovima teksta (zaključani segmenti, tagovi). Izgled teksta u konačnom obliku (DTP, objavljivanje na mreži i sl.). Rešavanje problema na konkretnim primerima
Literatura: Crowdin, ICU Message Syntax
20. novembar 2021. (3. dan)
10:00–10:30 Principi prevođenja: upravljanje kvalitetom (diskusija sa predavačem)
Cilj: Identifikovanje parametara koji se uzimaju u obzir prilikom evaluacije prevoda, obezbeđivanje kvaliteta
Sadržaj: Šta je QA (Quality Assurance). Automatizovane provere kvaliteta: Xbench, LTB, QA provere unutar CAT alata – objašnjenje, principi funkcionisanja i primeri
Literatura: A Complete Guide to Improving Translation Quality, Xbench
10:30–11:30 Praktični rad (Samostalan rad)
Cilj: Usvajanje tehnika automatizovanog obezbeđivanja kvaliteta na primeru tekućih zadataka
Sadržaj: Praktičan zadatak: podela generisanih QA izveštaja za svaki pojedinačni prevod, popunjavanje izveštaja i unošenje ispravki
Materijali će biti podeljeni na času
11:30–12:00 Upoznavanje sa različitim CAT alatima (instrukcije za samostalan rad)
Cilj: Pregled postojećih najčešće korišćenih alata – osposobljavanje za samostalno pronalaženje uputstava i rad u odabranom alatu
Sadržaj: Rad po grupama, podela zadataka. Polaznici se dele u 5 grupa, svaka grupa dobija zadatak da opiše izgled i funkcije jednog od dostupnih alata
Opisi:
MemoQ pdf
Wordfast pdf
Translation Workspace (TWS) video
MateCat video
Smartling video
12:00–14:00 Upoznavanje sa različitim CAT alatima (Samostalan rad)
Cilj: Pregled postojećih najčešće korišćenih alata – sposobljavanje za samostalno pronalaženje uputstava i rad u odabranom alatu
Sadržaj: Instalacija/prijavljivanje. Pronalaženje dostupnih uputstava. Upoznavanje sa izgledom i načinom rada u konkretnom alatu. Pronalaženje i razumevanje QA funkcionalnosti u dodeljenom alatu. Priprema prezentacija
16:00–18:00 Upoznavanje sa različitim CAT alatima (Diskusija sa predavačem)
Cilj: Pregled postojećih najčešće korišćenih alata – osposobljavanje za samostalno pronalaženje uputstava i rad u odabranom alatu
Sadržaj: Prezentovanje konkretnih alata
18:00–19:30 Prevođenje u lokalnoj praksi (Gostujuće predavanje)
Jelena Budimirović, asistent za slovenački jezik na Filološkom fakultetu u Beogradu i terminolog u sektoru za prevođenje pravnih akata EU u Ministarstvu za evropske integracije
Cilj: Upoznavanje sa drugim praksama na lokalnom tržištu
Sadržaj: Predstavljanje konkretnog sistema prevođenja i upravljanja terminologijom u sektoru za prevođenje pravnih akata EU i lokalnih agencija
21:00–22:00 Druga evaluacija praktičnog rada (Diskusija sa predavačem)
Cilj: Procena napretka
Sadržaj: Komentari predatih zadataka sa posebnim osvrtom na kvalitet, konzistentnost i unošenje ispravki
21. novembar 2021. (4. dan)
9:30–10:30 Principi prevođenja: upravljanje kvalitetom (Diskusija sa predavačem)
Cilj: Identifikovanje parametara koji se uzimaju u obzir prilikom evaluacije prevoda, obezbeđivanje kvaliteta
Sadržaj: Šta je LQI (Language Quality Inspection). Detaljnije o sistemima procene kvaliteta. Kategorije i gradacija grešaka. Pass/fail: šta raditi nakon primljene evaluacije (pozitivne/negativne) za sopstveni prevod. Primeri stvarnih izveštaja. Gramatička, pravopisna i stilska ispravnost prevoda. Translation vs transcreation. Zamke u prevođenju: jezik i stil. Predstavljanje najčešćih grešaka na primerima iz samostalnih zadataka polaznika.
Materijali će biti prikazani na času
10:30–11:30 Javno dostupni resursi (Diskusija sa predavačem)
Cilj: Pregled javno dostupnih prevodnih terminoloških baza i rečnika, javno dostupnih pretraživih translacionih memorija i drugih pomoćnih resursa
Sadržaj: Predstavljanje konkretnih referentnih resursa za različite oblasti prevođenja. Terminološki rečnici na mreži (MLP, Electropedia, Evronim…). Translacione memorije na mreži (Glosbe). Druge vrste rečnika (rečnik sinonima kontekst.io, morfološki rečnik i sl.). Upotrebljivost mašinskih prevoda (DeepL, Google, Bing, Yandex). Pouzdanost resursa na mreži
Izvori: Microsoft Language Portal, Electropedia, Evronim, Glosbe, Konteks.io, Morfološki rečnik, DeepL, Bing, Yandex, ProZ.com
11:30–12:00 Principi prevođenja: upravljanje vremenom (Diskusija sa predavačem)
Cilj: Pregled načina obračunavanja količine posla, najčešćih normi u industriji i utvrđivanje vremena potrebnog za završavanje zadatka
Sadržaj: Šta je WWC (weighted wordcount – effort words). Predstavljanje analize dokumenata i koeficijenata obračuna. Instrukcije za pravljenje analize dokumenta u konkretnim alatima. Očekivano vs stvarno vreme za ispunjavanje određenih vrsta zadataka. Cene po jedinici mere
Materijali: CATcount
12:00–13:00 Mogućnosti za zaposlenje i traženje poslova (30 minuta diskusija sa predavačem, 30 minuta samostalni rad sa materijalima)
Cilj: Pregled agencija koje angažuju lingviste. Prepoznavanje zahteva agencija i upoznavanje sa sistemima prijavljivanja
Sadržaj: Predstavljanje međunarodnih agencija. Popunjavanje prijava. Očekivanja agencija, principi regrutovanja u različitim agencijama. Primeri testova koji služe za evaluaciju prevodilaca
Izvor: The Largest Language Service Providers: 2021
13:00–14:00 Konačna evaluacija i rangiranje (Diskusija sa predavačem)
***
Predavač:
Mirjana Starović (ReLDI centar i Lexicom – jezički inženjering d.o.o.)
FORLÌ
October 2016
Count your frequencies wisely! An introduction to concepts and methods in quantitative (corpus) linguistics
Forlì, 28 October 2016
The goal of this one-day seminar, organised in collaboration with DIT, was to provide an introduction to quantitative analyses in linguistics using the R environment, with a special focus on the analysis of corpus derived data. The rationale was that a firm grasp of quantitative methods is needed to properly describe corpus data, as well as to generalise from a single language sample to other similar samples, and to language in general.
PROGRAM [ pdf ]
9.00-10.30 Session 1: “From corpora to R: obtaining and organising data”
- Introduction to quantitative corpus studies
- Formulating linguistic hypotheses testable on corpus data
- The R environment: installing R, setting working directories, installing packages
- Importing data into R: defining and coding variables, file formats
10.30-11.00 Break
11.00-12.30 Session 2: “Describing and visualising corpus data”
- Descriptive statistics: counts, frequency distributions; mean, median; standard deviation, interquartile range
- Graphs: scatter plots, line charts, bar charts, histograms, box plots, mosaic plots
12.30-14.00 Lunch break
14.00-15.30 Session 3: “Generalising from corpus data”
- Basics of statistical hypothesis testing: intro to probability; null hypothesis, significance levels and their meaning; parametric vs. non-parametric statistic
- Specific tests: chi-square, correlation, (intro to) regression
15.30-16.30 Session 4: “Practice”
- Hands-on analyses, questions, discussion…
***
Predavači:
Maja Miličević (Univerzitet u Beogradu)
Adriano Ferraresi (Univerzitet u Bolonji)
ZURICH (Online)
November 2021
Interactive workshop on regional markedness in text
Online, 6-7. novembra 2021
U saradnji sa Univerzitetom u Cirihu i infrastrukturom CLARIN.SI, na seminaru su predstavljene platforme noSketchEngine i KonText, kao i upotreba jezika za pretragu korpusa (Corpus Query Language, CQL) u analizi rodnih razlika iz sociolingvističke perspektive. Više informacija dostupno je na ovoj stranici, a materijali sa radionice mogu se preuzeti i ovde.
PROGRAM
Subota, 6.11.2021.
09:00-09:15 | Tanja Samardžić: Welcome |
09:15-10:15 | Yves Scherrer: Computational dialectology (keynote) |
10:15-10:30 | Break |
10:30-12:30 | Sara Košutar, Larissa Schmidt, Leyla Feiner: Interactive workshop on regional variation in text (part 1) |
12:30-13:00 | Darja Fišer: Student research at JTDH (part 1) |
13:00-14:00 | Break |
14:00-16:00 | Mirjana Starović, Tanja Samardžić: Regional variation in gender marking: a hands-on tutorial on extracting data from corpora (part 1) Worksheet PDF Worksheet GoogleDoc |
16:00-17:00 | Networking time |
Nedelja, 7.11.2021.
09:00-10:30 | ReLDI business meeting |
10:30-12:30 | Sara Košutar, Larissa Schmidt, Leyla Feiner: Interactive workshop on regional variation in text (part 2) |
12:30-13:00 | Darja Fišer: Student research at JTDH (part 2) |
13:00-14:00 | Break |
14:00-16:00 | Mirjana Starović, Tanja Samardžić: Regional variation in gender marking: a hands-on tutorial on extracting data from corpora (part 2) |
16:00-17:00 | Networking time |
Predavač po pozivu
Dr. Yves Scherrer (University of Helsinki, Department of Digital Humanities) [website]
Organizatori
Tanja Samardžić (University of Zurich)
Larissa Schmidt (University of Zurich)
Leyla Feiner (University of Zurich)
Sara Košutar (University of Zagreb)