ANOPPI-projektet
Projekt för automatisk anonymisering av dokument som innehåller personuppgifter och beskrivning av innehållet i dokumenten
OM042:00/2018 Projekt
Ministerierna genomför regeringsprogrammet, bereder lagar och andra författningar samt genomför reformer i olika projekt, arbetsgrupper och organ.
Alla ministeriers projekt hittas på statsrådets webbplats
I projektet som leds av justitieministeriet ska det att tas fram två språkteknologiska AI-verktyg med hjälp av vilka arbetet med anonymisering och innehållsbeskrivning i domstolsavgöranden och andra myndighetsbeslut kan automatiseras. Med verktygen kan material i högre grad bli digitalt tillgängligt t.ex. inom beslutsfattande och forskning.
Projektets basuppgifter Pågår
Projektets nummer OM042:00/2018
Ärendenummer VN/5161/2018
Projektets arrangör justitieministeriet
Mandattid 1.10.2018 – 31.12.2020
Datum för tillsättande 26.10.2018
Mål och resultat
Det självlärande anonymiseringvertyget (ANOPPI) som tas fram i projektet ska automatiskt kunna identifiera och markera de uttryck som är väsentliga med tanke på anonymisering samt sambanden mellan dem, t.ex. olika hänvisningar till samma person. På basis av analysen producerar verktyget ett förslag till ett anonymiserat dokument och erbjuder smidiga redskap för att göra behövliga ändringar i dokumentet. Verktyget utnyttjar språkteknologi och semantisk beräkning för att identifiera begrappsliga referenser till personer, företag, orter och annan information.
Samma tekniska lösning och programvara kommer att användas för generering av automatiska innehållsbeskrivingar så att verktyget hämtar fram de mest centrala begreppen ur innehållet. Det självlärande automatiska annoterinsverktyget (APPI) ska möjliggöra smart sökning och länkning av dokument till annat material, t.ex. förena rättsfall med andra motsvarande fall och med relevant lagstiftning. Produktionen av innehållsbeskrivingar till rättsfall, t.ex. i domstolarnas ärendehanteringssystem (Ritu, Sakari, Tuomas, o.s.v.), i andra myndigheters ärendehanteringssystem och i Finlex-systemet, är på samma sätt som anonymisering dyrt manauellt arbete, och därför har det i nuläget skötts bristfälligt.
Sammandrag
I projektet som leds av justitieministeriet ska det att tas fram två språkteknologiska AI-verktyg med hjälp av vilka arbetet med anonymisering och innehållsbeskrivning i domstolsavgöranden och andra myndighetsbeslut kan automatiseras. Med verktygen kan material i högre grad bli digitalt tillgängligt t.ex. inom beslutsfattande och forskning.
Utgångspunkter
Inom den offentliga sektorn produceras enorma mängder av informationsmaterial och data som med fördel kunde finnas tillgängligt för andra myndigheter, företag och medborgare, men som på grund av dataskyddsfrågor inte kan publiceras offentligt. Bättre tillgång till myndighetsbeslut och rättsfall ger möjlighet atta utnyttja tidigare beslut vid behandlingen av nya ärenden. Tillgången till detta material är viktigt också för forskning som gäller myndighetspraxis och rättstillämpning.
Projektet handlar om anonymisering av namngivna entiteter i dokument för att möjliggöra dokumentens användning och publicering. Problem i anslutning till skydd för personuppgifter eller integritetsskydd kan lösas genom pseudonymisering eller anonymisering av data som ska publiceras. Detta innebär att t.ex. personens namn systematisk ersätts med ett neutralt namn, såsom "Personen A". För enkelhetens skull används termen "anonymisering" i detta sammanhang även för pseudonymisering, i vilket det ursprungliga namnet kan lättare bli återställd med hjälp av kontextinformation. En gemensam utmaning såväl när det gäller anonymisering som innehållsbeskriving är att båda kräver sakkunskap och är dyrt manuellt arbete. Dessutom handlar det ofta om ett stort antal material. Projektet fokuserar speciellt på domstolsavgöranden, som på många sätt påverkar medborgare och företag.
Ytterligare uppgifter
Bättre tillgång till myndighetsbeslut och rättsfall skulle väsentligen förbättra transparensen av förvaltninger och rättssystemet. Både myndigheter och medborgare har nytta av de verktyg som ska tas fram i projektet. Projektet medför fördelar för produktionen, utdelningen och utnyttjande av myndighetsmaterial.
Tillsättande och organisering
-
Asettamispäätös PDF
Projektgrupp
Person
Roll, Mandattid
Hietanen, Aki
Kehittämispäällikkö
justitieministeriet
Roll: Ordförande
1.10.2018 – 31.12.2020
Hietanen, Aki
Kehittämispäällikkö
justitieministeriet
Roll: Ansvarig person
1.10.2018 – 31.12.2020
Aaltonen, Mikko
Erityisasiantuntija
justitieministeriet
Roll: Medlem
1.10.2018 – 31.12.2020
Husso, Tiina
Projektikoordinaattori
justitieministeriet
Roll: Medlem
1.10.2018 – 31.12.2020
Hyvönen, Eero
Professori
Aalto-yliopisto ja HELDIG
Roll: Medlem
1.10.2018 – 31.12.2020
Koho, Mikko
tutkija
HELDIG ja Aalto-yliopisto
Företräder aktör: HELDIG, Aalto-yliopisto
Roll: Medlem
1.2. – 31.12.2020
Leal, Rafael
tutkimusapulainen
Helsingin yliopisto
Roll: Medlem
1.10.2018 – 31.12.2020
Linhala, Jari
publishing manager
Edita Publishing Oy
Roll: Medlem
1.11.2019 – 31.12.2020
Oksanen, Arttu
Senior Software Developer
Edita Publishing Oy
Roll: Medlem
1.10.2018 – 31.12.2020
Talo, Risto
Software Development Manager
Edita Publishing Oy
Roll: Medlem
1.10.2018 – 31.12.2020
Tamper, Minna
Tohtorikoulutettava
Aalto-yliopisto
Roll: Medlem
1.10.2018 – 31.12.2020
Tuominen, Jouni
Tutkija
HELDIG ja Aalto-yliopisto
Roll: Medlem
1.10.2018 – 31.12.2020
Packalén, Saara
Projektipäällikkö
justitieministeriet
Roll: Projektchef
1.10.2018 – 31.7.2020
Packalén, Saara
Projektipäällikkö
justitieministeriet
Roll: Kontaktperson för projektet
1.10.2018 – 31.7.2020
Salminen, Oili
Erityisasiantuntija
justitieministeriet
Roll: Medlem
1.10.2018 – 30.6.2020
Styrgrupp
Person
Roll, Mandattid
Kumpula, Pasi
Kehittämispäällikkö
Tuomioistuinvirasto
Roll: Ordförande
1.6. – 31.12.2020
Kumpula, Pasi
Kehittämispäällikkö
justitieministeriet
Roll: Medlem
1.2.2019 – 31.12.2020
Husso, Tiina
Projektikoordinaattori
justitieministeriet
Roll: Sekreterare
1.8. – 31.12.2020
Aaltonen, Olli-Pekka
Tietojärjestelmäasiantuntija
KRIMO
Roll: Ersättare
1.2.2019 – 31.12.2020
Hietanen, Aki
Kehittämispäällikkö
justitieministeriet
Roll: Medlem
1.2.2019 – 31.12.2020
Hietanen, Aki
Kehittämispäällikkö
justitieministeriet
Roll: Ordförande
1.2.2019 – 31.5.2020
Hyvärinen, Tiina
hankejohtaja
Tuomioistuinvirasto
Roll: Medlem
1.1. – 31.12.2020
Hyvönen, Eero
Professori
Aalto-yliopisto ja HELDIG
Roll: Medlem
1.2.2019 – 31.12.2020
Koulu, Riikka
Apulaisprofessori
Helsingin yliopisto/HELDIG
Roll: Medlem
1.2.2019 – 31.12.2020
Kääriäinen, Juha
Tutkimusjohtaja
KRIMO
Roll: Medlem
1.2.2019 – 31.12.2020
Loisa, Marko
Hankejohtaja
Tuomioistuinvirasto
Roll: Ersättare
1.2.2019 – 31.12.2020
Norrman, Wilhelm
kansliapäällikkö
Korkein oikeus
Roll: Medlem
1.6. – 31.12.2020
Níkkilä, Juha
Business Director, Legal Information
Edita Publishing Oy
Roll: Medlem
1.10.2018 – 31.12.2020
Salonen, Jukka-Pekka
Esittelijäneuvos
Korkein oikeus
Roll: Ersättare
1.2.2019 – 31.12.2020
Tarkkanen, Satu-Maarit
Tietopalvelupäällikkö
Korkein hallinto-oikeus
Roll: Ersättare
1.2.2019 – 31.12.2020
Tuominen, Jouni
Tutkija
HELDIG ja Aalto-yliopisto
Roll: Ersättare
1.2.2019 – 31.12.2020
Waris, Emil
Kansliapäällikkö
Korkein hallinto-oikeus
Roll: Medlem
1.5.2019 – 31.12.2020
Packalén, Saara
Projektipäällikkö / Projektchef / Project Manager
justitieministeriet
Roll: Sekreterare
1.2.2019 – 31.7.2020
Vuorialho, Tommi
Kansliapäällikkö
Korkein oikeus
Roll: Medlem
1.2.2019 – 31.5.2020
Ogrupperade
Person
Roll, Mandattid
Husso, Tiina
Projektikoordinaattori
justitieministeriet
Roll: Kontaktperson för projektet
10.6. – 31.12.2020