Anoppi-hanke
Henkilötietoja sisältävien asiakirjojen automaattinen anonymisointi ja sisällönkuvailu (Anoppi)
OM042:00/2018 Kehittäminen
Ministeriöt toteuttavat hallitusohjelmaa, valmistelevat lakeja ja muita säädöksiä sekä vievät eteenpäin uudistuksia erilaisissa hankkeissa, työryhmissä ja toimielimissä.
Kaikkien ministeriöiden hankkeet löydät valtioneuvoston verkkosivuilta
Oikeusministeriön vetämässä Anoppi-hankkeessa toteutetaan kaksi kieliteknologiseen tekoälyyn perustuvaa työkalua, joiden avulla tuomioistuinratkaisujen ja muiden viranomaispäätösten anonymisointia ja sisällönkuvailua voidaan automatisoida. Sovelluksilla voidaan parantaa aineistojen sähköistä saatavuutta esimerkiksi päätöksenteossa ja tutkimuksessa.
Hankkeen perustiedot Käynnissä
Hankenumero OM042:00/2018
Asianumerot VN/5161/2018
Asettaja oikeusministeriö
Toimikausi/aikataulu 1.10.2018 – 31.12.2020
Asettamispäivä 26.10.2018
Tavoitteet ja tuotokset
Hankkeessa toteutettava oppiva anonymisointityökalu (ANOPPI) kykenee automaattisesti tunnistamaan ja merkitsemään dokumentissa anonymisoinnin kannalta keskeiset ilmaukset ja näiden väliset yhteydet, esimerkiksi eri tavoin tehdyt viittaukset samaan henkilöön. Analyysin perusteella työkalu tarjoaa anonymisoijalle valmiin ehdotuksen anonymisoidusta dokumentista sekä joustavat välineet mahdollisesti vielä tarvittavien muutosten tekemiseksi. Tässä työssä tarvittava kieli- ja semanttisen laskennan teknologia tunnistaa tekstidokumentissa olevia käsitteellisiä viittauksia henkilöihin, organisaatioihin, paikkoihin ja muihin tietoihin.
Samaa teknistä ratkaisua ja ohjelmistoja tullaan käyttämään myös aineistojen automaattiseen sisällönkuvailuun, jossa etsitään dokumentista sen sisällön kannalta keskeisiä käsitteitä. Tällainen oppiva automaattinen annotointi (APPI) mahdollistaa dokumenttien älykkään haun ja linkityksen muihin aineistoihin, esimerkiksi oikeustapausten yhdistämisen toisiin vastaaviin tapauksiin ja niihin liittyvään lainsäädäntöön. Oikeustapausten sisällönkuvailu esimerkiksi tuomioistuinten asianhallintajärjestelmissä (Ritu, Sakari, Tuomas, jne.), muiden viranomaisten asianhallinnassa ja Finlex-järjestelmässä on samalla tavalla kallista käsityötä kuin anonymisointikin, ja on siksi nykyisin hyvin puutteellista.
Tiivistelmä
Oikeusministeriön vetämässä Anoppi-hankkeessa toteutetaan kaksi kieliteknologiseen tekoälyyn perustuvaa työkalua, joiden avulla tuomioistuinratkaisujen ja muiden viranomaispäätösten anonymisointia ja sisällönkuvailua voidaan automatisoida. Sovelluksilla voidaan parantaa aineistojen sähköistä saatavuutta esimerkiksi päätöksenteossa ja tutkimuksessa.
Lähtökohdat
Julkisen sektorin eri toimijat tuottavat valtavia määriä tietoaineistoja ja dataa, jonka saaminen avoimesti muiden viranomaisten, yritysten ja kansalaisten käyttöön olisi hyödyllistä, mutta tietoon liittyvien tietosuojakysymysten takia se ei ole mahdollista. Julkishallinnon päätösten ja oikeustapausten parempi saatavuus mahdollistaa aiempien päätösten hyödyntämisen uusien asioiden käsittelyssä, ja on merkityksellistä viranomaiskäytännön ja lainkäytön tutkimuksessa.
Hankkeessa on kyse tekstidokumenteissa olevien nimettyjen entiteettien anonymisoinnista datan avointa käyttöä ja julkaisemista varten. Henkilötietojen suojaamiseen ja yksityisyyden suojaan liittyvät ongelmat voidaan ratkaista pseudonymisoimalla tai anonymisoimalla avoimesti julkaistavaa dataa. Tällöin esimerkiksi henkilöiden nimet korvataan systemaattisesti neutraaleilla nimillä, kuten ”Henkilö A”. Käytämme jatkossa yksinkertaisuuden vuoksi termiä “anonymisointi” viittaamaan myös hieman yksinkertaisempaan pseudonymisointiin, jossa alkuperäiset nimet ovat helpommin palautettavissa kontekstitiedon avulla. Yhteisenä haasteena sekä anonymisoinnissa että sisällönkuvailussa on, että molemmat ovat asiantuntemusta vaativaa kallista käsityötä ja aineistot ovat usein erittäin laajoja. Hankkeessa tarkastellaan viranomaisaineistoista erityisesti tuomioistuinten ratkaisuaineistoja, joilla on monilla tavoin vaikutusta kansalaisiin ja yrityksiin.
Lisätietoja
Hallinnon päätösten ja oikeustapausten avoin saatavuus parantaisi olennaisesti koko hallinnon ja oikeusjärjestelmän läpinäkyvyyttä. Hankkeessa toteutettavista työvälineistä hyötyvät sekä viranomaiset että kansalaiset ja yritykset. Hyödyt koskevat päätösten tuottamista, jakelua ja jatkohyödyntämistä.
Hankkeen hyödyt näkyvät julkishallinnossa myös erilaisia viranomaispäätöksiä koskevien tietopyyntöjen käsittelyn nopeutumisena.
Asettaminen ja organisointi
-
Asettamispäätös PDF
Projektiryhmä
Henkilö
Rooli, Toimikausi
Hietanen, Aki
Kehittämispäällikkö
oikeusministeriö
Rooli: Puheenjohtaja
1.10.2018 – 31.12.2020
Hietanen, Aki
Kehittämispäällikkö
oikeusministeriö
Rooli: Vastuuhenkilö
1.10.2018 – 31.12.2020
Aaltonen, Mikko
Erityisasiantuntija
oikeusministeriö
Rooli: Jäsen
1.10.2018 – 31.12.2020
Husso, Tiina
Projektikoordinaattori
oikeusministeriö
Rooli: Jäsen
1.10.2018 – 31.12.2020
Hyvönen, Eero
Professori
Aalto-yliopisto ja HELDIG
Rooli: Jäsen
1.10.2018 – 31.12.2020
Koho, Mikko
tutkija
HELDIG ja Aalto-yliopisto
Edustaa tahoa: HELDIG, Aalto-yliopisto
Rooli: Jäsen
1.2. – 31.12.2020
Leal, Rafael
tutkimusapulainen
Helsingin yliopisto
Rooli: Jäsen
1.10.2018 – 31.12.2020
Linhala, Jari
publishing manager
Edita Publishing Oy
Rooli: Jäsen
1.11.2019 – 31.12.2020
Oksanen, Arttu
Senior Software Developer
Edita Publishing Oy
Rooli: Jäsen
1.10.2018 – 31.12.2020
Talo, Risto
Software Development Manager
Edita Publishing Oy
Rooli: Jäsen
1.10.2018 – 31.12.2020
Tamper, Minna
Tohtorikoulutettava
Aalto-yliopisto
Rooli: Jäsen
1.10.2018 – 31.12.2020
Tuominen, Jouni
Tutkija
HELDIG ja Aalto-yliopisto
Rooli: Jäsen
1.10.2018 – 31.12.2020
Packalén, Saara
Projektipäällikkö
oikeusministeriö
Rooli: Projektipäällikkö
1.10.2018 – 31.7.2020
Packalén, Saara
Projektipäällikkö
oikeusministeriö
Rooli: Hankkeen yhteyshenkilö
1.10.2018 – 31.7.2020
Salminen, Oili
Erityisasiantuntija
oikeusministeriö
Rooli: Jäsen
1.10.2018 – 30.6.2020
Ohjausryhmä
Henkilö
Rooli, Toimikausi
Kumpula, Pasi
Kehittämispäällikkö
Tuomioistuinvirasto
Rooli: Puheenjohtaja
1.6. – 31.12.2020
Kumpula, Pasi
Kehittämispäällikkö
oikeusministeriö
Rooli: Jäsen
1.2.2019 – 31.12.2020
Husso, Tiina
Projektikoordinaattori
oikeusministeriö
Rooli: Sihteeri
1.8. – 31.12.2020
Aaltonen, Olli-Pekka
Tietojärjestelmäasiantuntija
KRIMO
Rooli: Varajäsen
1.2.2019 – 31.12.2020
Hietanen, Aki
Kehittämispäällikkö
oikeusministeriö
Rooli: Jäsen
1.2.2019 – 31.12.2020
Hietanen, Aki
Kehittämispäällikkö
oikeusministeriö
Rooli: Puheenjohtaja
1.2.2019 – 31.5.2020
Hyvärinen, Tiina
hankejohtaja
Tuomioistuinvirasto
Rooli: Jäsen
1.1. – 31.12.2020
Hyvönen, Eero
Professori
Aalto-yliopisto ja HELDIG
Rooli: Jäsen
1.2.2019 – 31.12.2020
Koulu, Riikka
Apulaisprofessori
Helsingin yliopisto/HELDIG
Rooli: Jäsen
1.2.2019 – 31.12.2020
Kääriäinen, Juha
Tutkimusjohtaja
KRIMO
Rooli: Jäsen
1.2.2019 – 31.12.2020
Loisa, Marko
Hankejohtaja
Tuomioistuinvirasto
Rooli: Varajäsen
1.2.2019 – 31.12.2020
Norrman, Wilhelm
kansliapäällikkö
Korkein oikeus
Rooli: Jäsen
1.6. – 31.12.2020
Níkkilä, Juha
Business Director, Legal Information
Edita Publishing Oy
Rooli: Jäsen
1.10.2018 – 31.12.2020
Salonen, Jukka-Pekka
Esittelijäneuvos
Korkein oikeus
Rooli: Varajäsen
1.2.2019 – 31.12.2020
Tarkkanen, Satu-Maarit
Tietopalvelupäällikkö
Korkein hallinto-oikeus
Rooli: Varajäsen
1.2.2019 – 31.12.2020
Tuominen, Jouni
Tutkija
HELDIG ja Aalto-yliopisto
Rooli: Varajäsen
1.2.2019 – 31.12.2020
Waris, Emil
Kansliapäällikkö
Korkein hallinto-oikeus
Rooli: Jäsen
1.5.2019 – 31.12.2020
Packalén, Saara
Projektipäällikkö / Projektchef / Project Manager
oikeusministeriö
Rooli: Sihteeri
1.2.2019 – 31.7.2020
Vuorialho, Tommi
Kansliapäällikkö
Korkein oikeus
Rooli: Jäsen
1.2.2019 – 31.5.2020
Ryhmittelemättömät
Henkilö
Rooli, Toimikausi
Husso, Tiina
Projektikoordinaattori
oikeusministeriö
Rooli: Hankkeen yhteyshenkilö
10.6. – 31.12.2020