Proteverb – Pravni, etični in tehnološki vidiki obdelave besedilnih in govornih virov podatkov za znanstvene, raziskovalne in razvojne namene

O PROJEKTU

Slovenščina je z vidika razvoja jezikovnih tehnologij jezik, za katerega je na voljo malo digitalnih virov. Zaradi tega sta sodobno raziskovanje s perspektive računalniške znanosti in razvoj produktov, ki temeljijo okrog procesiranja naravnega jezika, bistveno počasnejša kot to velja za jezike z veliko digitalnimi viri. Za ustrezno pridobivanje jezikovnih virov in sekundarno uporabo slednjih v čimbolj naravni obliki, ki zaradi tega lahko vsebujejo tudi nekatere osebne podatke, pa je pomembno interpretiranje Splošne uredbe o varstvu podatkov (GDPR) in izjem prav za raziskovalne namene. Prav tovrstna odstopanja omogočajo doseganje posebnih namenov, na katere se veže tudi pričujoči ciljni raziskovalni projekt, ki bo prvikrat v slovenskem prostoru sistematično naslovil pridobivanje in obdelavo (osebnih) podatkov na način, ki so v interesu znanosti in tako prek apliciranja v obliki pilotnega projekta prispeval k razvoju slednje, kot tudi gospodarstva na podlagi novih spoznanj in praks.

Raziskovalni projekt bo združil, prepletel in poglobil znanje več različnih znanstvenih ved tako z družboslovnega kot tudi naravoslovnega in tehničnega področja ter humanistike. Tovrstno součinkovanje je ključno za zagotovitev, da se napredek v tehnološkem razvoju osmisli ter regulira tako, da se maksimira družbena korist in da se hkrati minimizirajo negativni učinki v obliki posegov v etične in pravne standarde ter človekove pravice. Tak vsestranski pristop je edini način, da koncept odprte znanosti zaživi kar v največji meri.

Projekt bo primarno pomembno prispeval k razvoju treh vej znanosti, in sicer prava, informatike in računalništva ter humanistike.

Pri vseh treh področjih znanosti bo omogočen takojšnji prenos ugotovitev in znanj v pedagoški proces na domačih in tujih univerzah, tako preko sodelovanja študentov pri razvijanju zgoraj omenjenih tehnologij kot pri poučevanju, ki ga izvajajo raziskovalci, udeleženi pri tem projektu, ki so hkrati profesorji na različnih fakultetah.

Akademski rezultati tega projekta bodo premostili ključne ovire za napredek znanosti, ki stremi k optimizaciji uporabe podatkov za raziskovalne namene brez kršitev pravnih standardov ter človekovih pravic.

Tip projekta: Ciljni raziskovalni program (CRP)

Šifra projekta (SICRIS): V5-2265

Trajanje projekta: 1. 10. 2022 – 31. 3. 2025

DELOVNI SKLOPI

Raziskovalni projekt je razdeljen v več faz:

Preučitev pravnega okvira obdelave podatkov v raziskovalni-znanstvene namene. Izhodišče bosta predstavljala Splošna uredba in ZVOP-1, ki ju bomo nadgradili s primerjalnopravno analizo in spremljanjem razvoja zakonodajnega predloga ZVOP-2.
Preučitev dosedanje prakse zbiranja podatkov v znanstveno-raziskovalne namene, s poudarkom na dostopanju do podatkov raziskovalcev in raziskovalnih organizacij ter izkušnjah z deljenjem podatkov javnih organov in institucij (npr. sodišč). Identifikacija ključnih dejavnikov tveganj, ki so onemogočali dostop do podatkov v preteklosti, za oblikovanje protokola za varovanje zasebnosti tekom obdelovanja podatkov.
Razvijanje postopkov za ustrezno dostopanje do podatkov in anonimizacijo podatkov, ki bo temeljila na prilagoditvi in izboljšanju obstoječih anonimizatorjev. Oblikovanje priporočil glede metod biometrične anonimizacije zvočnih govornih posnetkov, ki temeljijo na metodah strojnega učenja, z namenom zmanjšanja vplivov na zanesljivost samodejnih razpoznavalnikov govora.

Pilotni del raziskave bo obsegal pripravo potrebnih podlag za prevzem podatkov, prevzem podatkov, anonimizacijo podatkov ter ureditev dokumentacije, postopkov in pravil za potrebe obdelave podatkov v okviru raziskovalne inštitucije. Na podlagi podatkov, pridobljenih za pilotni del ciljnega raziskovalnega projekta bomo specializirali anonimizator besedil kot tudi razpoznavalnik govora za slovenski jezik.

VODJA PROJEKTA IN KONZORCIJSKI PARTNERJI

Vodja projekta je Inštitut za kriminologijo pri Pravni fakulteti v Ljubljani.

Partnerji konzorcija:

FINANCIRANJE

Ciljni raziskovalni projekt (CRP) financirata Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost RS (ARIS) in Ministrstvo za digitalno preobrazbo (MDP).

REZULTATI IN DOSEŽKI PROJEKTA

Izvirni znanstveni članek

ZAVRŠNIK, Aleš. Criminal Justice, Artificial Intelligence Systems, and Human Rights. Ûridičeskie nauki i obrazovanie. 2023, no. 70, pp. 150-164. ISSN 2304-1730. [Online]: http://www.iolr.org/wp-content/uploads/2023/04/Zavrsnik-A.-Criminal-justice….pdf. [COBISS.SI-ID 159764739]
ZAVRŠNIK, Aleš, RAMUŠ CVETKOVIČ, Iva, LAZAREVIČ PADAR, Kristina, STARIHA, Andraž. Data Control and Research in Criminology. Journal of Criminal Investigation and Criminology. Jan.-Mar. 2024, vol. 75, no. 1, pp. 72-89. ISSN 0034-690X. [COBISS.SI-ID 192594691]

Strokovni članek

ZAVRŠNIK, Aleš. Artificial Intelligence in Criminal Justice: Impact on Human Rights. Pravo i pravda: Journal of Legal Theory and Practice. 2023, vol. 21, no. 1, pp. 173-192. ISSN 1512-8571. [COBISS.SI-ID 155372291]

Prispevek na konferenci brez natisa

ŠARF, Pika. Tanka meja med osebnim in anonimiziranim podatkom v digitalni dobi : predavanje, Konferenca prava varstva osebnih podatkov, Portorož, 15. november 2022. [COBISS.SI-ID 150492163]
ZAVRŠNIK, Aleš. Artificial intelligence and criminal justice : predavanje, International Scientific and Practical Conference “Digital Forensics in the Modern World: Problems of Theory and Practice”, Taškent, 5. 5. 2023. [COBISS.SI-ID 159767299]
ZAVRŠNIK, Aleš. Kriminaliteta in podatki : predavanje na 4. konferenci Prava informacijske varnosti, Portorož, 16. 3. 2023. [COBISS.SI-ID 159392003]
ZAVRŠNIK, Aleš. Umjetna inteligencija i krivično pravosuđe : predavanje, međunarodni seminar “Digitalizacija u pravu, zaštita privatnosti i automatizacija – DPZPA”, Sarajevo, 18. 5. 2023. [COBISS.SI-ID 159770371]

Objavljeni povzetek znanstvenega prispevka na konferenci

ZAVRŠNIK, Aleš. Fair trial implications of automation in criminal justice systems. V: 2023 ASC Annual Meeting : Seeking justice: reconciling with our past, reimagining the future : Philadelphia, 15. 11. 2023 –18. 11. 2023. [S. l.]: American Society of Criminology, 2023. 1 spletni vir. https://convention2.allacademic.com/one/asc/asc23/index.php?cmd=Online+Program+View+Paper&selected_paper_id=2075050&PHPSESSID=7p1hcnhkka36t6t7ki72oj4i07. [COBISS.SI-ID 183045891]

Drugo

Organizacija Jesenske šole z naslovom “Pravo pred izzivi digitalne (r)evolucije”, 22. 11. 2024. https://www.inst-krim.si/category/jesenska-sola/

KREK, Simon. Avtorske pravice, slovenskega jezika grob. Dnevnik. [Tiskana izd.]. 29. nov. 2022, leto 72, št. 276, str. 17, avtorj. sl. ISSN 1318-0320. https://www.dnevnik.si/1043001868/Kultura/jezikolumna-avtorske-pravice-slovenskega-jezika-grob, https://trojina.si/2022/12/14/avtorske-pravice-slovenskega-jezika-grob/. [COBISS.SI-ID 184173827]
SPLICHAL, Slavko (intervjuvanec), BRATKO, Ivan (intervjuvanec), KRONEGGER, Luka (intervjuvanec), KALUŽA, Jernej (intervjuvanec), KREK, Simon (intervjuvanec), ŠARF, Pika (intervjuvanec), GORJANC, Vojko (intervjuvanec). Poletje umetne inteligence. Ljubljana: Radiotelevizija Slovenija javni zavod, 2023. 1 spletni vir (1 zvočna datoteka (22 min 12 sek)). Vroči mikrofon. https://val202.rtvslo.si/podkast/vroci-mikrofon/584/174960060. [COBISS.SI-ID 154859523]
SPLICHAL, Slavko (intervjuvanec), BRATKO, Ivan (intervjuvanec), KREK, Simon (intervjuvanec), KALUŽA, Jernej (intervjuvanec), ŠARF, Pika (intervjuvanec). Upodatkovanje družbe. Ljubljana: Radiotelevizija Slovenija javni zavod, 2023. 1 spletni vir (1 zvočna datoteka (9 min 11 sek)). Aktualna tema. https://365.rtvslo.si/arhiv/aktualna-tema/174958360. [COBISS.SI-ID 154855171]
SLAČEK, Nina (oseba, ki intervjuva), BOGATAJ JANČIČ, Maja (intervjuvanec), CVAR, Nina (intervjuvanec), DOBRANIĆ, Filip (intervjuvanec), ZAVRŠNIK, Aleš (intervjuvanec). Kdo bo imel koristi in kdo škodo od nove umetne inteligence. Ljubljana: Radiotelevizija Slovenija javni zavod, 2023. 1 spletni vir (1 zvočna datoteka (50 min, 52 sek)). Intelekta. https://365.rtvslo.si/arhiv/intelekta/174964772. [COBISS.SI-ID 155695363]

Predavanje na tuji univerzi

ZAVRŠNIK, Aleš. AI and penal system : lecture at module “Artificial Intelligence and Intellectual Property”, Strasbourg University, Center for International Intelectual Property Studies, 24. 1. 2023, Zoom. [COBISS.SI-ID 142227715]
ZAVRŠNIK, Aleš. AI and penal system : lecture at Università Cattolica del Sacro Cuore, Milano, 12. 9. 2023, Zoom. [COBISS.SI-ID 164318467]
ZAVRŠNIK, Aleš. Veštačka inteligencija u pravosuđu: prilike i rizici algoritamskog upravljanja : predavanje, Fakulteta za organizacijske vede Univerze v Beogradu in Raziskovalno-razvojni inštitut umetne inteligence Srbije, Novi Sad, 8. december 2023. [COBISS.SI-ID 178939651]

Druga predavanja