Edilex-palvelut

Kirjaudu sisään

Siirry esitykseen

Puutteelliset hakuehdot

HE 72/2022
Hallituksen esitys eduskunnalle laeiksi tilastokeskuksesta annetun lain ja tilastolain muuttamisesta

HaVM 32/2022 vp HE 72/2022 vp

ESITYKSEN PÄÄASIALLINEN SISÄLTÖ

Esityksessä ehdotetaan muutettaviksi tilastokeskuksesta annettua lakia ja tilastolakia.

Esityksen mukaan tilastokeskuksen tehtäviin lisättäisiin tutkija- ja aineistopalvelun ylläpitäminen. Esityksen tarkoituksena on parantaa tilastokeskuksen tilastointitarkoitukseen keräämien aineistojen jakelua ja luovuttamista tutkija- ja aineistopalvelulle. Tutkija- ja aineistopalvelu on tarkoitettu tieteellisen tutkimuksen ja yhteiskuntaoloja koskevien tilastollisten selvitysten edistämiseen. Tilastokeskuksella olisi oikeus ottaa vastaan, käsitellä, koostaa, säilyttää, tarjota ja luovuttaa tutkimuskäyttöön tietoja tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä ja valmisaineistojen muodostamista varten myös sellaisia aineistoja, joita ei hyödynnetä tilastoinnissa eikä käytetä tilastotuotannossa.

Samalla selvennettäisiin, Euroopan unionin uudistuneen tietosuojalainsäädännön edellyttämällä tavalla, tilastokeskuksen ja muiden osapuolten asemaa sekä tietosuojaoikeudellisia rooleja rekisterinpitäjinä ja henkilötiedon käsittelijöinä. Tilastokeskus olisi tilastointitarkoituksiin kerätyn aineiston rekisterinpitäjä ja tutkija- ja aineistopalvelua varten vastaanotettujen tietojen rekisterinpitäjä, jos alkuperäisen rekisterinpitäjän kanssa on sovittu, että tiedoista muodostetaan tutkija- ja aineistopalvelussa säilytettävä valmisaineisto. Tilastokeskus olisi lisäksi tutkija- ja aineistopalvelua varten vastaanotettujen tietojen henkilötietojen käsittelijä, jos tiedot tulevat yksittäisen tutkimushankkeen käyttöön tutkija- ja aineistopalvelussa eikä niistä muodosteta valmisaineistoa.

Lisäksi tilastokeskuksen tiedonsaantioikeuksia laajennettaisiin maksu- ja velkatietoihin ja varhaiskasvatuksen henkilötietoihin sekä hyvinvointialueiden ja hyvinvointiyhtymien viranomaisilta saataviin tietoihin.

Ehdotetut lait on tarkoitettu tulemaan voimaan 1.1.2023.

PERUSTELUT

1 Asian tausta ja valmistelu

1.1 Tausta

Tilastotiedon yhteiskunnallinen merkitys

Luotettava tilastotieto on olennainen osa yhteiskunnallisen päätöksenteon ja tieteellisen tutkimuksen valmistelua. Lisäksi tilastotiedolla on merkitystä yleisemmin yhteiskunnallisena hyödykkeenä, arvona sinänsä, osana demokraattista yhteiskuntaa, yleistä mielipiteenmuodostusta ja yhteiskunnallista keskustelua. Tietoon perustuva yhteiskunnallinen päätöksenteko edellyttää nopeaan reagointiin kykenevää tutkimus- ja selvitystoimintaa ja nopeasti saatavilla olevia tilastoaineistoja. Esityksessä tilaston ja tilastotiedon käsitteillä viitataan aineistosta laadittuun tilastoon ja tämän tilaston sisältämään informaatioon (esimerkiksi työttömyysaste). Tilastoaineisto tai aineisto, josta tilasto muodostetaan, viittaa puolestaan aineistoon, josta tilasto lasketaan (esimerkiksi tieto kaikista työvoimaan kuuluvista ja siitä, onko henkilö työssä vai ei). Tilaston, tilastotiedon ja tilastoaineiston käsitteitä ei esityksessä ehdoteta määriteltäväksi laintasoisesti. Tilaston määritelmä on Suomea suoraan velvoittavassa Euroopan parlamentin ja neuvoston asetuksessa (EY) N:o 223/2009, annettu 11.3.2009, Euroopan tilastoista sekä salassapidettävien tilastotietojen luovuttamisesta Euroopan yhteisöjen tilastotoimistolle annetun Euroopan parlamentin ja neuvoston asetuksen (EY, Euratom) N:o 1101/2008, yhteisön tilastoista annetun neuvoston asetuksen (EY) N:o 322/97 ja Euroopan yhteisöjen tilasto-ohjelmakomitean perustamisesta tehdyn neuvoston päätöksen 89/382/ETY, Euratom kumoamisesta, jäljempänä EU:n tilastoasetus, jossa ’tilastoilla’ tarkoitetaan”määrällisiä ja laadullisia, aggregoituja ja edustavia tietoja, jotka kuvaavat kollektiivista ilmiötä tarkasteltavana olevassa perusjoukossa” (3 artiklan 1 kohta).

Yhteiskunnallista päätöksentekoa tukeva tutkimus käyttää hyödykseen yhä enemmän julkishallinnossa syntyviä aineistoja, joita käytetään laajasti myös muussa tutkimus- ja selvitystoiminnassa ja joita yhdistellään myös muihin kuin viranomaistoiminnan aineistoihin. Tilastokeskus kerää ja tuottaa laajoja tietoaineistoja, joista tuotettuja tilastoja voidaan hyödyntää yhteiskunnallisessa päätöksenteossa ja tämän ohella myös tutkimuksessa. Tieteellinen tutkimus ymmärretään esityksessä EU:n tietosuojasääntelyä myötäilevästi laajasti siten, että se tarkoittaa myös teknologian kehittämistä ja esittelyä, perustutkimusta, soveltavaa tutkimusta ja yksityisin varoin rahoitettua tutkimusta. Esimerkiksi viranomaisten tekemät selvitykset ja tutkimukset ovat soveltavaa tutkimusta. Sen sijaan esimerkiksi asiakasprofilointi ja markkinatutkimus eivät ole tieteellistä tutkimusta.

Tilastokeskuksen tutkijapalvelun toiminnasta

Tilastokeskuksessa toimii tutkijoiden ja muiden yksikkötasoisten aineistojen (mikroaineistot) perusteella erilaista selvitystyötä tekevien tietoaineistotarpeita palveleva Tutkijapalvelut-ryhmä, jäljempänä tutkijapalvelu. Tilastokeskus perusti vuonna 2010 keskitetyn tutkijapalvelun sujuvoittaakseen tutkijoiden asiointia ja palvellakseen tutkijoita mahdollisimman yhdenvertaisesti. Tätä ennen tietopyyntöjä mikroaineistoihin toimitettiin aineistoja hallinnoiviin tilastokeskuksen yksiköihin. Nykyisin kaikki tilastokeskukseen saapuvat aineistopyynnöt mikroaineistoihin käsitellään tutkijapalvelussa. Tutkijapalvelu koostaa ja luovuttaa tietopyyntöihin perustuvia mikroaineistoja tutkimuksia ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten.

Tutkijapalvelun nykyinen toiminta perustuu tilastokeskuksesta annetun lain (48/1992, jäljempänä TK-laki) 2 §:n 2 momentissa tarkoitetun tilastokeskukselle muutoin määrätyn tehtävän ohella tilastolain (280/2004) 13 §:n tilastoviranomaiselle antamaan oikeuteen luovuttaa tilastointitarkoitukseen keräämiään salassa pidettäviä tietoja tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten. Pykälän mukaan tilastoviranomainen ei saa luovuttaa näihin tarkoituksiin sellaisia tietoja, joiden perusteella tilastoyksikkö voidaan tunnistaa suoraan. Tilastoviranomainen voi kuitenkin antaa tilastolain 13 §:n 3 momentin nojalla käyttöoikeuden sellaisiin salassa pidettäviin tietoihin, joiden perusteella tilastoyksikkö voidaan tunnistaa välillisesti. Tilastolain 3 §:n mukaan lain tarkoitus on myös edistää tilastointitarkoitukseen kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä.

Tilastolain 19 §:n mukaisesti tilastokeskus voi luovuttaa tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten, salassapitosäännösten estämättä, tunnistetietoineen tiedot henkilön iästä, sukupuolesta, koulutuksesta, ammatista ja sosioekonomisesta asemasta. Tietojen saajan on osoitettava, että hänellä on tietosuojalainsäädännön mukainen oikeus käsitellä näitä tietoja. Nämä tiedot sekä lain viranomaisten toiminnan julkisuudesta (621/1999, jäljempänä julkisuuslaki) nojalla luovutettavat kuolemansyitä kuvaavat tiedot on mahdollista luovuttaa tunnisteineen fyysisesti käyttäjälle.

Tietoaineiston luovuttaminen perustuu aina käyttölupaan, jonka saamiseksi hakijan on perusteltava tietojen käsittelytarkoitus. Jos tutkimusaineistoon yhdistetään toisen rekisterinpitäjän tietoja, tulee hakijan saada käyttölupa myös tältä rekisterinpitäjältä. Käyttölupa voidaan myöntää vain tutkimussuunnitelmalla tai vastaavalla kuvauksella etukäteen määriteltyjen kysymysten selvittämiseen. Tietojen käyttö on tyypillisesti kertaluonteista ja aineistojen käyttö uusien kysymysten selvittämiseen edellyttää tyypillisesti uutta käyttölupaa.

Tilastokeskus tarjoaa tutkijoille tutkimuskohtaisesti räätälöityjä aineistoja, jolloin aineisto kootaan tutkimusryhmän tarpeisiin toimeksiannosta. Tutkijapalvelussa on myös muodostettu tietovarannoista tilastokeskuksen verkkosivuilla Taika-tutkimusaineistokatalogissa kuvattuja valmisaineistomoduuleja helpottamaan ja nopeuttamaan aineistojen luovuttamista. Valmisaineistoja muodostetaan tietyn aihealueen muuttujista (esimerkiksi perhetiedoista, tulotiedoista, yritysten ulkomaankaupasta) ja moduuliin kuuluu aikasarjatietoja kaikista aihealueen perusjoukoista (perheväestöön kuuluvista, ulkomaankauppaa käyvistä yrityksistä). Tutkimusaineistoihin voidaan erillisellä rekisterinpitäjän myöntämällä käyttöluvalla yhdistää muiden rekisterinpitäjien sellaisia tietoja, joita tilastokeskus ei kerää tilastointitarkoitukseen. Tällaiset aineistot toimitetaan tutkijapalvelulle yhdisteltäväksi joko käyttöluvan mukaisesti tai etukäteen tilastokeskuksen ja muun rekisterinpitäjän välillä tehdyn aineistoluovutussopimuksen mukaisesti. Tilastolaki sallii suoria tunnisteita sisältävien aineistojen luovuttamisen vain toiselle tilastoviranomaiselle tutkimusaineiston muodostamista varten.

Suurin osa tutkijapalvelun nykyisin vastaanottamista käyttölupahakemuksista koskee laissa kuolemansyyn selvittämisestä (459/1973) tarkoitettujen kuolemansyyaineistojen luovuttamista ja aineistojen käyttöä terveystutkimuksissa. Usein pyydettyjä tietoja ovat myös demografiset tiedot sekä työssäkäyntiin, tuloihin, koulutukseen, perheisiin ja asuntokuntiin liittyvät tiedot. Tutkijapalvelulta haetaan myös käyttölupia yritysaineistoihin sekä yritys- ja henkilöaineistojen yhdistelmiin. Tilastokeskuksen mikroaineistojen yhdistäminen esimerkiksi sosiaali- ja terveydenhuollon valtakunnallisen tilastoviranomaisen Terveyden ja hyvinvoinnin laitoksen, jäljempänä THL, hoitoilmoitusrekisterin tietoihin ja Kansaneläkelaitoksen, jäljempänä Kela, erikoiskorvattavien lääkkeiden rekisteriin on tehnyt mahdolliseksi muun muassa hyvinvoinnin ja terveyden sosioekonomisten yhteyksien tutkimisen.

Tietosuojan varmistamiseksi luovutettavat aineistot suojataan joko pseudonymisoimalla eli poistamalla niistä suorat tunnistetiedot tai anonymisoimalla eli poistamalla sekä suorat että epäsuorat tunnisteet. Euroopan parlamentin ja neuvoston asetuksessa (EU) 2016/679, annettu 27.4.2016, luonnollisten henkilöiden suojelusta henkilötietojen käsittelyssä sekä näiden tietojen vapaasta liikkuvuudesta ja direktiivin 95/46/EY kumoamisesta, jäljempänä tietosuoja-asetus, pseudonymisointi tarkoittaa henkilötietojen käsittelemistä siten, ettei henkilötietoja voida enää yhdistää tiettyyn rekisteröityyn käyttämättä lisätietoja ja edellyttäen, että tällaiset lisätiedot säilytetään erillään ja että niihin sovelletaan teknisiä ja organisatorisia toimenpiteitä, joilla varmistetaan se, ettei henkilötietojen yhdistämistä tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön tapahdu (4 artiklan 5 kohta). Pseudonymisoinnissa muun muassa henkilö- tai yritystunnukset, nimet ja osoitteet joko poistetaan kokonaan tai käsitellään salausalgoritmilla, jonka tuottamasta tunnisteesta ei ole mahdollista johtaa alkuperäistä tietoa. Anonymisointi on pseudonymisointia vahvempi suojauskeino, jossa tiedot esimerkiksi summataan karkeammalle tasolle, jolloin ne eivät enää sisällä lainkaan yksilöiviä tietoja.

Aineiston käyttöluvan saaminen edellyttää lupahakemuksen tekemistä, tilanteesta riippuen joko yhdeltä tai usealta rekisterinpitäjältä. Selvitys- ja tutkimushankkeissa yhdistetään tyypillisesti usean rekisterinpitäjän tietoja, jolloin luvan voi joutua hakemaan usealta viranomaiselta. Aineiston käyttöluvassa määritellään muun muassa tietojen käyttötarkoitus, tarvittavat aineistot, tutkimuksessa tarvittavat tiedot ja tutkijat, joilla on aineistoon pääsy, sekä käsittely-ympäristö ja hankkeen kesto. Tilastokeskus ja mahdollinen muu rekisterinpitäjä, kuten Kela, käsittelevät lupahakemukset omien prosessiensa mukaisesti. Myöntävän käyttöluvan saamisen jälkeen kukin tahollaan muodostaa seuraavaksi aineistot hallussaan olevista aineistoista. Mahdollinen yhteistyökumppanina oleva muu viranomainen lähettää tämän jälkeen aineistonsa tilastokeskukselle, joka käsittelee aineistoa esimerkiksi pseudonymisoimalla siinä mahdollisesti olevat henkilö- tai y-tunnukset. Kaikkien aineistojen valmistuttua luodaan etäkäyttöprojekti, johon aineistojen käyttäjät saavat käyttöoikeuden aineiston käyttöluvassa määritellyksi ajaksi. Jos tutkija on hakenut käyttölupaa tilastokeskuksessa jo valmiiksi muodostettuun valmisaineistoon, tutkijalle avataan käyttöoikeus etäkäyttöjärjestelmässä olevaan valmisaineistokansioon. Aineistot eivät etäkäyttöjärjestelmässä ole tutkijoiden omilla tietokoneilla, vaan ICT-palveluntarjoaja CSC - Tieteen tietotekniikan keskus Oy:n, jäljempänä CSC, palvelimilla. Tutkijat eivät tietoturvasyistä voi itse viedä etäkäyttöjärjestelmään tiedostoja tai ladata niitä ulos järjestelmästä, vaan aineistojen siirroista huolehtii tilastokeskuksen henkilöstö. Yksittäisiä aineistoja voi saada käyttöön myös suoraan aineistoja tuottavalta viranomaiselta, josta niiden käyttöön liittyvät järjestelyt riippuvat. Hankkeelle käyttöluvassa määritellyn keston jälkeen etäkäyttöyhteys suljetaan ja aineistot hävitetään tilastokeskuksen käytäntöjen mukaisesti.

Esimerkkejä tyypillisistä tutkijapalvelun käyttötapauksista

Tilastokeskuksen muodostamien tutkimusaineistojen avulla tehdään yhteiskuntapoliittista tutkimus- ja selvitystyötä sekä akateemisia opinnäytteitä. Tutkimusaineistojen keskeisiä käyttäjiä ovat tutkimusta tekevät organisaatiot, kuten yliopistot, ammattikorkeakoulut ja korkeakoulut sekä tutkimuslaitokset ja ajatuspajat. Tutkijat ovat pääsääntöisesti suomalaisia, mutta tutkimushankkeisiin osallistuu usein huomattava määrä ulkomaisia tutkijoita.

Tyypillinen käyttölupahakemus voi koskea tilastokeskuksen aikasarja-aineistojen saamista esimerkiksi sosioekonomisen eriarvoisuuden perustutkimusta varten, jossa käytetään laajasti tilastokeskuksen henkilöaineistoja yhdistettyinä muiden viranomaisten aineistoihin, kuten THL:n hoitoilmoitusrekisterin tietoihin ja Kelan erikoiskorvattavien lääkkeiden rekisteriin. Hakijat ovat usein tohtorikoulutettavia ja apurahatutkijoita, joiden laajat tutkimushankkeet koskevat muun muassa eriarvoisuutta, huono-osaisuutta tai koulutuksen periytyvyyttä ja alueellista eriytymistä. Tilastokeskuksen verkkosivuilla on luettelo tutkimusartikkeleista, joissa on käytetty tilastokeskukselta tilattuja yksikkötasoisia aineistoja (https://www2.tilastokeskus.fi/static/media/uploads/tup/mikroaineistot/julkaisut.pdf).

Pyynnöt liittyvät usein myös soveltavaan tutkimukseen ja selvitysten tekemisiin. Tutkijapalvelu on esimerkiksi muodostanut jo 1990-luvulla tutkimusaineistoja työvoimapoliittisten toimenpiteiden arvioinnista, minkä jälkeen tilastokeskuksessa muodostetuilla yksilöaineistoilla on hyvin laajasti tehty vaikuttavuusarviointeja lainsäädäntöuudistuksista ja poliittisista kokeiluista, kuten aktiivimallin vaikutuksista ja perustulokokeilusta. Pitkät aikasarjat mahdollistavat ajallisia vertailuasetelmia ennen ja jälkeen. Tilastokeskuksen yritysaineistot mahdollistavat myös yritysdemografian ja yritystukien vaikutusten tutkimista. Kuukausittain ja/tai vuosittain päivittyvät aineistot mahdollistavat seurantatutkimuksia ja mallintamista. Kaikissa mainituissa käyttötapauksissa toimintamalli työskenneltäessä etäkäyttöjärjestelmässä on tutkijoille ja tilastollisia selvityksiä tekeville pitkälti samankaltainen.

Tilastokeskuksen etäkäyttöjärjestelmä osana tutkijapalvelua

Tilastokeskus on vuosina 2009-2010 pilotoinut ja ottanut laajemmin vuonna 2011 käyttöön suunnittelemansa Fiona-etäkäyttöjärjestelmän, jäljempänä etäkäyttöjärjestelmä. Tutkijapalvelussa kehitetyn ja ylläpidetyn etäkäyttöjärjestelmän käyttöönoton perusta ja tarkoitus on turvata tilastointitarkoitukseen kerättyjen aineistojen tietoturvallinen käyttö tieteellisessä tutkimuksessa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä. Lisäksi on pyritty varmistamaan tutkijoille mahdollisimman yhdenvertainen kohtelu, kun heidän ei tarvitse matkustaa Helsinkiin käsittelemään aineistoja tilastokeskuksen tiloissa. Ennen etäkäyttöjärjestelmän kehittämistä tilastokeskuksen yksikkötasoisia aineistoja oli toimitettu tutkimus- ja selvityskäyttöön tilastokeskuksessa sijaitsevan tutkimuslaboratorion kautta tai välillisen tunnistamisen mahdollisuuden poistettuina otosaineistoina, joita luovutettiin fyysisesti. Myös tutkijapalvelussa kehitetyn mikrosimulointipalvelun aineistonkäsittely tapahtuu etäkäyttöjärjestelmässä.

Tunnisteellisia aineistoja ja kyselytutkimuksissa muodostettuja palveluaineistoja lukuun ottamatta kaikki tutkijapalvelun toimittamat tietoaineistot luovutetaan etäkäyttöjärjestelmässä, jonka kautta tutkija saa katseluyhteyden tutkijaa varten perustettuun hakemistoon, jossa aineisto sijaitsee ja jossa tutkija sitä käsittelee. Tutkija vastaa järjestelmästä ulos siirrettävien tulosten tietosuojaamisesta. Käyttöluvan voimassaolon päätyttyä tutkimushankkeen pääsy etäkäyttöjärjestelmään katkeaa. Tutkimushankkeen aineistot poistetaan pysyvästi määräajan kuluttua käyttöluvan päättymisestä.

Vuosina 2010-2020 toimeksiantojen ja käyttölupahakemusten lukumäärä sekä tilastokeskuksen keskitetyssä tutkijapalvelussa toimeksiantoja käsittelevien henkilöiden työvuosimäärä kasvoi merkittävästi, sillä palvelun perustamisvuonna 2010 henkilötyövuosimäärä oli viisi ja vuonna 2020 24, jolloin panostettiin jäljempänä jaksossa 5.1 kuvattavan Tilannehuoneen perustamiseen ja sen tietovarannon/tietoaltaan ylläpitoon. Vuonna 2020 käsiteltiin 509 käyttölupahakemusta (2021: 423) ja tehtiin noin 250 aineistotoimitusta. Vuodelta 2020 ei siirtynyt lupahakemuksia vuodenvaihteen yli, kuten aikaisempina vuosina, sillä loppuvuoden lupapiikki käsiteltiin jo joulukuussa. Lisäksi vuoden 2021 alussa voimaan tullut hinnoittelumuutos keskitti tutkimushankkeita suurempiin kokonaisuuksiin, joilla on myös laajempia aineistovarantoja.

Etäkäyttöjärjestelmässä oli noin 550 käyttäjää ja yli 200 hanketta. Tutkijapalvelun henkilömäärä on kasvanut tarkastelujaksolla 2010-2020 kuusinkertaiseksi (5, 30). Käyttölupahakemusten määrä kasvoi samalla tarkastelujaksolla 17-kertaiseksi (30, 509). Sen sijaan toimitusten määrä on jatkuvasti ollut käyttölupahakemusten määrää huomattavasti alemmalla tasolla, vaikka toimitusten määrä on kasvanut suhteellisesti jopa nopeammin (11, 260). Nopean kasvun seurauksena jonot tutkimushankekohtaisten räätälöitävien aineistojen tietopyyntöjen käsittelyssä ovat välillä kasvaneet peräti 10-12 kuukauden mittaisiksi. Keväällä 2021 tilanne parantui henkilöstön määrän noustua ja räätälöitävien tutkimusaineistopyyntöjen jono on alle neljä kuukautta. Muiden tietopyyntöjen tutkijat ovat saaneet tietoja kahden kuukauden kuluessa. Hakemukset ovat koskeneet kuolemansyyaineistojen, tunnisteellisena luovutettavien tutkimusaineistojen, palveluaineistojen, valmisaineistojen sekä räätälöityjen tutkimusaineistojen luovuttamista ja etäkäyttöä sekä mikrosimulointia, käyttölupien jatkoa ja laajennusta, ulkopuolisten aineistojen lisäämistä ja toimimista toisen viranomaisen antamalla luvalla; vuodesta 2020 lähtien on seurattu erikseen myös palveluaineistojen ja ulkopuolisten aineistojen hakemuksia. Lisäksi tutkijoiden käyttöön on tehty valmisaineistoja useista aihealueista.

Tilastolain 13 §:n 3 momentin mukaan tilastokeskus voi antaa käyttöoikeuden sellaisiin salassa pidettäviin tietoihin, joiden perusteella tilastoyksikkö voidaan tunnistaa välillisesti. Välittömiä tunnistetietoja tilastokeskus luovuttaa vain tilastolain 19 §:ssä luetelluista tiedoista ja tilastolain 12 §:ssä ja 18 §:ssä määriteltyjen julkisten tietojen yhteydessä sekä julkisuuslain 28 §:n perusteella luovutettavista kuolemansyytiedoista. Aineistojen yhdistäminen (yhtenäisten pseudotunnisteiden vieminen aineistoihin) tehdään aina tilastokeskuksessa, koska tilastokeskus ei luovuta tunnistetietoja. Tilastokeskus ei myöskään luovuta fyysisesti tutkimusaineistoja, joissa on riski mahdollisuudesta tilastoyksiköiden tunnistamiseen välillisesti, vaan näitä aineistoja tutkija saa käyttöönsä vain tilastokeskuksen tietoturvallisessa etäkäyttöjärjestelmässä. On kuitenkin tilanteita, jolloin etäkäyttöjärjestelmä ei sovellu tutkimusaineistojen käsittelyalustaksi esimerkiksi tutkimusaineiston suuren koon tai siinä tarvittavien erikoisjärjestelyjen takia, kuten biopankkitutkimuksissa, joissa isoja genomitiedostoja halutaan yhdistää tilastokeskuksen tietoihin. Toisaalta, koska tilastolaki estää tilastokeskusta luovuttamasta aineistoja, jotka sisältävät tilastoyksiköiden suoria tunnisteita, nämä poistetaan aina silloin, kun muun rekisterinpitäjän aineistoon liitetään tilastokeskuksen aineistoja. Suorien tunnisteiden poisto aineistoista tehdään ennen käyttöoikeuden antamista. Analyysimallien yhteiskehittämiseen osallistuu usein laajempi kansainvälinen tiedeyhteisö, kuten tuhansien kehittäjien verkostohankkeet rOpenSci & Bioconductor. Käytännössä kaikki tuhannet kehittäjät eivät saa pääsyä yksikköaineistoon, mutta he voivat, hankkeen niin halutessa, osallistua analyysia toteuttavien ohjelmakoodien kirjoittamiseen ja avoimen lähdekoodin kirjoittamiseen. Tieteellistä tutkimusta voidaan toteuttaa monin eri metodein ja niissä saatetaan tarvita erilaisia analyysityökaluja. Jäljempänä jaksossa 5.1 selostetaan data-analytiikan hyödyntämistä tietoon perustuvassa päätöksenteossa selvittävän työryhmän työtä.

Esimerkki. Jos tilastokeskukselle tutkijapalveluun toimitettavaan aineistoon ei yhdistetä tilastokeskuksen tilastotarkoituksiin kerättyjä tietoja, tarvetta tunnistetietojen poistamiseen ei ole. Pääsääntöisesti tiedot kuitenkin toimitetaan tilastokeskukseen, koska niihin halutaan yhdistää tilastokeskuksen tilastotarkoituksiin kerättyjä tietoja, jolloin tunnistetiedot on poistettava.

Etäkäyttöjärjestelmässä työskentely vastaa työtä omalla päätelaitteella. Aineistoa ei fyysisesti luovuteta tutkijalle vaan hän saa järjestelmään käyttöoikeuden ja katseluyhteyden tutkijaa varten perustettuun hakemistoon tilastolain 13 b §:n mukaisesti. Muista kuin tilastolain perusteella vastaanotetuista aineistoista peruste tiedon luovuttamiseen pohjautuu lakiin julkisen hallinnon tiedonhallinnasta (906/2019, jäljempänä tiedonhallintalaki) ja siinä tarkoitetun teknisen rajapinnan ja katseluyhteyden (näkymän) tutkijaa varten perustettuun hakemistoon, jossa hänelle tuotettu aineisto sijaitsee. Tilastokeskus korvaa tutkimusaineistossa olevat yksilöivät tunnisteet pseudotunnisteella ja vie suojauksen jälkeen aineiston etäkäyttöjärjestelmään, joka mahdollistaa tutkijoille tietoturvallisen käsittely-ympäristön tutkimuksessa tarvittaville yksikkötason aineistoille. Tietoturvallisen käsittely-ympäristön avulla voidaan antaa tutkijoille tilastolain 13 §:ssä säädetty käyttöoikeus salassa pidettäviin tietoihin, joista on poistettu vain suoran tunnistamisen mahdollistavat tiedot (nimi, osoite, julkisesti saatavilla oleva tunnistenumero). Ilman etäkäyttöjärjestelmää säännöksen soveltaminen ei olisi tilastokeskuksen käytännön mukaan mahdollista, sillä aineistosta on poistettava myös välillisen tunnistamisen mahdollistavat tiedot, jolloin aineistot eivät ole tutkimus- ja selvityskäyttöön yhtä kattavia. Käsiteltävä tutkimusaineisto on pseudonymisoitu, mikä tarkoittaa tietojen käsittelemistä siten, ettei tietoja voida enää yhdistää tiettyyn henkilöön tai yksikköön ilman lisätietoja, jotka tilastokeskus säilyttää erillään henkilötiedoista. Tutkijoille on annettu ohjeet järjestelmästä ulos siirrettävien tulosten tietosuojaamisesta. Tilastokeskus tarkastaa tulokset ennen tietojen siirtoa ulos järjestelmästä, joskin Tilannehuoneen tulokset on samaan tapaan kuin mikrosimuloinnissa tarkastettu vasta tietojen ulos siirtämisen jälkeen. Nyttemmin tilastokeskus selvittää siirtymistä pistotarkastuksiin samoin periaattein kuin THL:n ylläpitämä sosiaali- ja terveysalan tietolupaviranomainen, jäljempänä Findata, joka on jo selvittänyt siirtymistä vastaavaan menettelyyn. Vuonna 2015 etäkäyttöjärjestelmän tekninen ylläpito siirtyi ICT-palveluntarjoaja CSC:lle. Järjestelmää kehitettiin edelleen samassa Suomen itsenäisyyden juhlarahasto Sitran rahoittamassa Issacus-hankkeessa, jossa myös Findatan etäkäyttöjärjestelmä kehitettiin. Fiona-etäkäyttöjärjestelmä on auditoitu lain sosiaali- ja terveystietojen toissijaisesta käytöstä (552/2019, jäljempänä toisiolaki) edellytysten ja Findatan määräyksen mukaisesti keväällä 2021. Auditoinnissa havaittujen poikkeamien korjauksia sekä ICT-palveluntarjoaja CSC:n tilojen auditointi on tehty vuoden 2021 toisella puoliskolla. Poikkeamien korjaus jatkuu vuoden 2022 talven ja kevään aikana niin, että ne voidaan todentaa korjatuiksi Findatan määräyksen aikarajaan 1.5.2022 mennessä. Todennuksen jälkeen haetaan Sosiaali- ja terveysalan lupa- ja valvontaviraston, jäljempänä Valvira, Toini-rekisteristä (toisiokäyttöympäristöjen rekisteri) paikkaa Fiona-etäkäyttöjärjestelmälle. Findatan 5.10.2020 antama määräys etäkäyttöympäristöistä on päivitetty 19.1.2022. Päivitetyssä määräyksessä on määritetty perusteet, joiden mukaan ympäristölle voidaan myöntää todistus määräyksen vaatimusten toteutumisesta. Toistaiseksi (2022) Toini-rekisterissä on rekisteröityä toisiokäyttöympäristöä. Auditointi ei ole kaikilta osin viranomaisten auditointityökalun, jäljempänä Katakri, mukainen. Auditoinnin jälkeen Fiona-etäkäyttöjärjestelmässä voitaisiin käsitellä myös toisiolain perusteella luovutettuja aineistoja.

Tietojen luovuttaminen etäkäyttöjärjestelmässä pienentää tietojen käsittelyyn liittyviä riskejä. Etäkäyttöjärjestelmän käyttövarmuus ja turvallisuus on tärkeää turvata, myös ajoittain ilmenevissä pitkittyvissä teknisissä ongelmatilanteissa. Tietosuoja-asetuksen 5 artiklan yleiset periaatteet henkilötietojen käsittelystä samoin kuin tilastolain 13 § on otettava huomioon, kuten henkilötietojen käsittelyn rajoittuminen siihen, mikä on tarpeen suhteessa tarkoitukseen. Tietosuoja-asetuksessa tietojen minimointiperiaatteen toteuttamiselle on useita keinoja. Kansalliset tulkinnat ja viranomaiskäytännöt kuitenkin vaihtelevat, sillä esimerkiksi Findatan tulkinnan mukaan jokaisen muuttujan tarve pitää perustella erikseen. Tämä oli pitkään käytäntönä myös tilastokeskuksessa, joskin siihen on ollut myös yhteiskunnallisen päätöksenteon ajantasaista tietopohjaa edistäviä poikkeuksia (esimerkiksi ”työvoimapolitiikan vaikuttavuusaineisto”). Viranomaiskäytäntöjen erilaisuus johtunee pitkälti kutakin viranomaista koskevasta erityislainsäädännöstä, siinä kullekin viranomaiselle säädetyistä tehtävistä ja toimialasta sekä erilaisista kansallista tilastolainsäädäntöä ja EU:n tilastolainsäädäntöä koskevista tulkinnoista. Tilastokeskus on katsonut perustelluksi luvittaa tietosisällöltään ja aihealueeltaan rajattuja valmisaineistoja tiedostokohtaisesti, jos tutkija on ilmoittanut tarvitsevansa tiedoston koko tietosisältöä.

Esimerkki. Tilastokeskus ei nykyisin voi koostaa tutkimus- ja selvityskäyttöön valmisaineistoja muista kuin tilastointitarkoitukseen vastaanotetuista aineistoista. Tämä vähentää mahdollisuuksia Findatan ja tilastokeskuksen tutkijapalvelu- ja etäkäyttötoimintojen yhdistämiseen ja yhtenäistämiseen. Näitä haasteita ja mahdollisuuksia etäkäyttöjärjestelmien välisten synergiaetujen lisäämiseen on selvitetty viranomaisten kesken. Siitä, että tilastokeskuksella on nykyisin vain tilastointitarkoitukseen tarkoitettua tietoa, seuraa esimerkiksi sairauspoissaolotietoja selvitettäessä, että tutkija saa suoraan tilastokeskukselta vain osan keskeisistä tiedoista, jotka perustuvat tilastointitarkoitukseen, ja muilta osin laajempia tietoja on haettava suoraan toiselta rekisterinpitäjältä tai Findatalta.

Esimerkki. Tilastokeskuksessa käytäntönä on ollut, että tunnisteellinen data, jolle tutkija on saanut toiselta rekisterinpitäjältä luvan, tulee suoraan tilastokeskukseen, jossa on tarjota tietoturvallisia tapoja siirtää tunnisteita sisältäviä tietoja. Käytäntö on osoittautunut paremmaksi kuin se, että aineisto menisi tutkijan kautta. Toisaalta eräät rekisterinpitäjät ovat katsoneet, että niiden tulisi käyttöluvan tutkijalle myöntäneinä myös toimittaa tiedot suoraan tutkijalle. Tilastokeskus on vastuututkijan ja/tai tutkimuslaitoksen kanssa tekemässään tutkimuspalvelusopimuksessa sitoutunut toimimaan tutkijan ja/tai tutkimuslaitoksen lukuun henkilötietojen käsittelijänä.

Tilastokeskuksen kaikki aineistot, joissa yksikön tunnistaminen on välillisesti mahdollista, käsitellään etäkäyttöjärjestelmässä – samoin kuin kaikki muut aineistot (mukaan lukien tutkijoiden itse keräämät aineistot), jos niitä halutaan yhdistää tilastokeskuksen aineistoihin. Tilastokeskus on viime vuosina vahvistanut tutkijapalvelun kykyä vastata tilastoaineistojen kasvaneeseen kysyntään. Tutkijapalvelun tarjoamisesta ja etäkäyttöjärjestelmän ylläpidosta ja kehittämisestä ei kuitenkaan ole nimenomaisesti säädetty laissa, vaan tehtävä perustuu tilastolain 13 §:n tilastoviranomaiselle antamaan oikeuteen luovuttaa tilastointitarkoitukseen keräämiään salassa pidettäviä tietoja tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten sekä TK-lain 2 §:n 2 momentin tarkoittamalla tavalla tilastokeskukselle muutoin määrättyyn tehtävään. Koska viranomaisen toiminnan on perustuttava lakiin ja tutkijapalvelun merkitys on viime vuosina kasvanut, palvelun lakisääteisen aseman täsmentäminen on tullut tarpeelliseksi. Tilastolain muutos vuonna 2013 vaikutti ratkaisevasti etäkäyttöjärjestelmän kehittämiseen ja käyttömäärien kasvamiseen. Tilastolain 3 §:n mukaan lain yhtenä tarkoituksena on edistää tilastointitarkoitukseen kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä. Tilastolain 13 §:n 3 momentin mukaan tilastoviranomainen voi antaa käyttöoikeuden tilastointitarkoitukseen kerättyihin tietoihin, joista tilastoyksikkö on välillisesti tunnistettavissa. Käytännössä käyttöoikeuden myöntäminen tapahtuu etäkäyttöjärjestelmässä. Henkilötietojen käsittelyperusteen määrittää rekisterinpitäjä eli tutkija tai tutkimushanke. Yleisin käsittelyperuste tutkimushankkeissa on tietosuoja-asetuksen 6 artiklan 1 kohdan e-alakohta ja tietosuojalain (1050/2018) 4 §:n 1 momentin 3 kohta. Etäkäyttöjärjestelmän tekninen ylläpito ulkoistettiin sopimusteitse vuonna 2015 Suomen valtion sekä yliopistojen ja korkeakoulujen yhteisesti omistamalle erityistehtäväyhtiölle, ICT-palveluntarjoaja CSC:lle, joka toimii henkilötietojen käsittelijänä. Tutkijapalvelun tuloista nykyisin suurin osa (noin 65-70 %) käytetään etäkäyttöjärjestelmän ylläpitämiseen liittyviin kustannuksiin. Nykyinen etäkäyttöjärjestelmän versio otettiin käyttöön vuonna 2020.

Tilannehuone

Tilastoaineiston keskeinen merkitys yhteiskunnallisen päätöksenteon valmistelun ja tieteellisen tutkimuksen tausta-aineistona edellyttää, että myös kansallinen tilastolainsäädäntö on ajantasaista. Lisäksi on tärkeää varmistaa, etteivät kansallinen tilastolainsäädäntö, EU:n tilastoasetus, ja tilastotoimen kansainvälisesti sovellettavat yleiset periaatteet aseta esteitä tai rajoituksia tilastokeskuksen edellytyksille tehokkaasti vastata tilastoaineistojen kasvaneeseen kysyntään yhteiskunnassa. Myös tilastokeskuksen tehtävien kehittäminen palvelu- ja tieto-organisaation suuntaan sekä avoimen datan periaatteen noudattaminen (myös etäkäyttöympäristössä, jossa se on haasteellisempaa) ja tiedon pitäminen ilman aiheetonta viivytystä ja tietoturvallisessa käsittely-ympäristössä sekä mahdollisimman tasapuolisesti ja ajantasaisena tiedontarvitsijoiden saatavilla puoltavat sitä, että etenkin TK-lakia on modernisoitava.

Keväällä 2020 koronaepidemian alkaessa selvisi, ettei käytössä olevilla tilastointijärjestelmillä saada riittävän nopeasti luotettavaa tietoa koronaepidemian ja erilaisten rajoitustoimien vaikutuksista yhteiskunnassa. Tämän johdosta Helsinki Graduate School of Economics – Taloustieteen keskus Helsinki GSE:n, jäljempänä Helsinki GSE, tilastokeskuksen ja valtioneuvoston eri ministeriöiden kesken käydyt keskustelut johtivat Tilannehuoneen perustamiseen. Tilannehuone on tehokkaammaksi kehitetty tutkijapalvelun toimintamalli työskentelystä etäkäyttöjärjestelmästä, jollaista tilastokeskus on vuodesta 2010 tarjonnut palvellakseen säännönmukaisesti kasvavan, noin 700 henkilöä käsittävän tutkijayhteisön tutkimustarpeita. Helsinki GSE:n tutkijoiden lisäksi Tilannehuoneessa on aktiivisesti työskennellyt Valtion taloudellisen tutkimuskeskuksen, jäljempänä VATT, useiden tutkijoiden lisäksi Turun yliopiston, valtiovarainministeriön, jäljempänä VM, ja tilastokeskuksen tutkijoita.

Tilastokeskuksen työjärjestys, joka annetaan TK-lain 3 §:n ja 4 §:n asetuksenantovaltuuden nojalla, antaa pääjohtajalle keskusvirastoille tyypilliseen tapaan laajat toimivaltuudet, mikä muun muassa on mahdollistanut päätöksen Tilannehuoneen hyväksi toteutetusta erillispalvelusta saada ajantasaista tilastoaineistoa muista tiedontarvitsijoista poikkeavin ehdoin. Koronaepidemian seurantaan ja torjuntaan liittyvien, nopeasti yhteiskunnallisen päätöksenteon valmisteluun saatettavien lähdeaineistojen analysoimiseksi tilastokeskuksen pääjohtaja on 1.4.2020 määrännyt eräitä tilastoaineistoja luovutettavaksi ajantasaisina tutkimuskäyttöön (scientific purposes) ennen aineistoihin perustuvien tilastojen julkaisemista. Päätös poikkesi tilastokeskuksen aikaisemmasta käytännöstä, jonka mukaan tilastoaineistoa ei voida käyttää toissijaiseen tarkoitukseen ennen kuin sitä on käytetty ensisijaiseen käyttötarkoitukseen. Tilannehuoneen tiedonsaantioikeus on käyttölupahakemuksen mukaisesti rajoittunut koronaepidemian vaikutusten tarkasteluun. Päätös (tai erillislupa) on ollut tarkoitettu väliaikaiseksi ja varmistamaan Tilannehuoneen toimintaedellytykset koronaepidemian ajaksi. Tilannehuoneella on poikkeusoloissa ollut tietosuoja-asetuksen edellyttämä käyttötarkoitus ja tutkimussuunnitelma ”korona-pandemian talousvaikutusten selvittämisestä”. Järjestelyn perusteella tilastokeskus on toimittanut käyttölupapäätöksellä ja mainitulla pääjohtajan päätöksellä erillispalvelun saaneelle Tilannehuoneelle tilastoaineistoa ennen kuin aineistoista muodostetut tilastot on julkaistu muille tiedontarvitsijoille. Tilannehuoneelle ei siten ole toimitettu tietoja myöhemmin julkaistuista tilastoista. Samalla Tilannehuone on saanut normaalista jonotusprosessista poikkeavan erillispalvelun käyttölupahakemustensa käsittelyyn. Tilastokeskus teki käyttölupapäätöksen aineistojen luovuttamisesta Tilannehuoneelle ennen tilastojen valmistumista, mutta pyrki nopeuttamaan tilastojen tuotantoa niin nopeaksi, ettei luovuttaminen ennen tilastojen julkaisemista ole tarpeellista. Päätöksen oikeusperustana voidaan pitää tilastolain 13 §:n 2 momentin 1 kohtaa (”Tilastoviranomainen voi luovuttaa tilastointitarkoitukseen keräämiään salassa pidettäviä tietoja: 1) tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten”). Tilastolain 13 §:n perusteluissa on voimakkaasti kannustettu tilastokeskusta yhteistyöhön tutkijayhteisön kanssa.

Helsinki GSE on merkittävä akateemisen taloustieteellisen osaamisen keskittymä, tutkijakoulu ja tutkimusyksikkö Suomessa ja sen tutkijat ovat tehneet Tilannehuoneen aineistoilla useita hyödyllisiä selvityksiä koronaepidemian aikana. Käytännön kokemukset Tilannehuoneen toiminnasta osoittavat, että sen saamasta erillispalvelusta on ollut merkittävä hyöty ja että nopeasti saatavilla oleville tilastoaineistoille on myös suuri kysyntä yhteiskunnassa. Tilannehuoneen perustamiseen johtanut tarve koronaepidemian taloudellisten vaikutusten arviointiin koskee yhtä lailla ja varsinkin kiireellisten lainvalmisteluhankkeiden vaikutusten arviointia. Määräaikaiset hallinnolliset järjestelyt eivät kuitenkaan riittävästi vastaa näihin haasteisiin. Tilastokeskus on tämän johdosta uudistanut VM:lle aloitteensa kiireellisiin lainsäädäntötoimiin ryhtymiseksi Tilannehuonetta palvelevan tutkijapalvelun aseman selkeyttämiseksi sekä sellaisen säädöspohjan täsmentämiseksi ja vahvistamiseksi, joka toimii muulloinkin kuin koronaepidemian aiheuttamissa poikkeuksellisissa tai sen kaltaisissa vaikeissa olosuhteissa. Tutkijapalvelu ei ole pystynyt vastaamaan esiintyvään kysyntään siinä laajuudessa kuin on ollut tarvetta osittain sen vuoksi, että sen juridinen asema osana tilastokeskusta on ollut täsmentämättä. Tutkijapalvelun oikeuspoliittisena perustana voidaan pitää tilastolain 3 §:n viimeistä virkettä: ”Lain tarkoituksena on myös edistää tilastointitarkoituksia varten kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä.” Tilastokeskuksen aloitetta on käsitelty VM:n ja tilastokeskuksen tulosohjausneuvotteluissa toukokuussa 2021 ja sovittu, että tarpeellisten lainmuutosten selvittäminen aloitetaan viipymättä.

VM on alustavasti asettanut neljä reunaehtoa, joiden toteuttamismahdollisuuksia tilastokeskuksen aloitteeseen perustuvassa selvityksessä ja esityksen valmistelussa on painotettu seuraavin näkökohdin: (i) tilastokeskuksen tehtävien kehittäminen palvelu- ja tieto-organisaation suuntaan, (ii) avoimen datan periaatteen noudattaminen ja tiedon pitäminen mahdollisimman tasapuolisesti ja ilman aiheetonta viivytystä tutkija- ja viranomaisyhteisön sekä muiden tiedontarvitsijoiden saatavilla, (iii) kustannustehokkuuden vaaliminen, mikä yhtäältä puoltaa uudistuksen toteuttamista tilastokeskuksen omin voimavaroin ja toisaalta tarvetta rahoituksen uudelleenjärjestämiselle, ja (iv) mahdollisuus valtioneuvoston elinkeino-, talous- ja laajemmin yhteiskuntapolitiikan sekä erityisesti valtion talousarvion valmistelua varten kiireellisesti tarvittavien tilastoaineistojen parempaan saatavuuteen, muiden tiedontarvitsijoiden tasapuolista kohtelua olennaisella tavalla ja perusteettomasti kuitenkaan vaarantamatta.

Valtioneuvoston kanslia, jäljempänä VNK, toteutti keväällä 2021 viranomaisaineistojen käytön pilottihankkeen, jossa kokeiltiin viranomaisten toiminnassa syntyvien niin sanottujen hallinnollisten rekisteriaineistojen käyttöä yhteiskunnallisen päätöksenteon tukena. Suomessa on saatavilla poikkeuksellisen kattava, ajantasainen ja luotettava julkishallinnon aineisto, jonka laaja hyödynnettävyys mahdollistaa laadukkaan tietoon perustuvan yhteiskunnallisen päätöksenteon. Lisäksi aineistoilla on suuri ja kasvava merkitys empiirisessä akateemisessa tutkimuksessa. Suomalaiset hallinnolliset rekisteriaineistot mahdollistavat erilaisten aineistolähteiden linkittämisen tavalla, joka ei ole useissa muissa maissa mahdollista. Vaikka rekisterit näyttävät tilastoilta, ne eivät ole virallisia tarkistettuja tilastoja. Suomessa on perinteisesti ollut muiden Pohjoismaiden tavoin globaalissa vertailussa parhaat edellytykset tehdä tietoon pohjautuvaa politiikkavalmistelua ja tutkimusta. Erilaisten aineistojen määrän ja käytön kasvaessa on noussut esiin myös haasteita, joiden ratkaiseminen on ensiarvoisen tärkeää, jotta aineistoista on mahdollisimman suuri hyöty yhteiskunnalle. Vuonna 2019 säädetyssä sosiaali- ja terveysalan tutkimusaineistojen saatavuutta parantaneessa toisiolaissa määriteltiin Findata vastuulliseksi viranomaiseksi hoitamaan sosiaali- ja terveysalan tutkijapalvelua ja myös Findatan oikeudellinen asema suhteessa sen toiminnassa käsiteltyihin aineistoihin. Muutoin tutkimusaineistojen luovutus perustuu rekisteriä koskevaan erityislainsäädäntöön tai julkisuuslain 28 §:ään. Tilastokeskuksen ja muiden valtion viranomaisten tilastointitarkoitukseen kerättyjen tietojen luovuttamisesta tutkimus- ja selvityskäyttöön on säädetty tilastolain 13 §:ssä ja lisäksi eräiden salassa pidettävien tietojen luovuttamisesta myös tunnistetietoineen tilastolain 19 §:ssä. TK-laissa tutkijapalvelua ei ole erikseen määritelty tilastokeskuksen tehtäväksi. Esitys kytkeytyy siten tiiviisti myös tutkijapalvelun oikeuspoliittiseen perustaan tilastolain 3 §:n viimeisessä virkkeessä.

Esityksellä pyritään lisäksi parantamaan erityisesti elinkeino-, talous- ja laajemmin yhteiskuntapolitiikan valmisteluun liittyvää eduskunnan tiedonsaantia suoraan valtioneuvostosta, mitä eduskunnan perustuslakivaliokunta on yleisesti edellyttänyt (PeVL 30/2020 vp, Selvitys eduskunnan perustuslaissa turvatun tiedonsaantioikeuden toteutumisesta, 2.10.2020) sekä vahvistamaan tilastoviranomaisten vastuunalaisuuden varmistamiseksi eduskunnan asemaa EU:n tilastoasetusta täydentävien käytännesääntöjen noudattamisen ja täytäntöönpanon valvonnassa (Euroopan tilastoja koskevat käytännesäännöt. Jäsenvaltioiden kansallisia tilastoviranomaisia ja Eurostatia (EU:n tilastoviranomaista) varten Euroopan tilastojärjestelmää käsittelevän komitean hyväksymä. 16.11.2017, Code of Practice).

Lisäksi esitystä valmisteltaessa on edellytetty selvitettäväksi, mitä reunaehtoja Suomea velvoittava EU:n tilastosääntely asettaa ja salliiko se tilastojen laatimiseksi kerätyn aineiston jakamisen Tilannehuonetta laajemmin tutkimus- ja selvityskäyttöön ennen kuin aineistosta on laadittu tilasto. Aineisto ei läheskään aina ole keskeneräinen, kun se on kerätty tilastokeskukseen ja sen laatu varmistettu, joten se on valmis ja viimeistelty. Koska tilasto tulee julkistaa heti, kun aineisto on valmis ja viimeistelty, julkistus tehdään käytännössä muutamien päivien viiveellä aineiston valmistumisesta.

Esimerkki. Selvityksen kannalta keskeistä on, voidaanko tilastoinnissa käytettäviä rekisteriaineistoja hyödyntää tutkimus- ja selvityskäytössä teknisen validoinnin jälkeen jo ennen tilastokeskuksen tekemää laadunvarmistusta ja julkistamista. Toisaalta esimerkiksi Eläketurvakeskuksen, jäljempänä ETK, rekisterien viimeistely voi tilastokeskuksessa kestää useita vuosia ennen kuin aineistot luovutetaan tutkimus- ja selvityskäyttöön. Etenkin työssäkäyntitilaston julkaiseminen on hidasta ja muut aineistot ovat voineet joutua odottamaan sen julkaisemista, vaikka ne eivät olisi olleet viimeistelemättömiä. ETK on samaan aikaan saattanut ilman tilastokeskuksen teknistä validointia julkaista tilastoja, joita on sittemmin käytetty SVT-tilastoissa ja joiden perusteella on maksettu eläkkeet. On esitetty, että teknisen validoinnin viivästynyt aikataulu äärimmillään tarkoittaa maksettujen eläkkeiden oikeellisuuden haastamista.

1.2 Valmistelu

Esitys on valmisteltu VM:ssä. Valmistelussa on kuultu etenkin tilastokeskuksen edustajia sekä oikeusministeriön, jäljempänä OM, opetus- ja kulttuuriministeriön, jäljempänä OKM, sosiaali- ja terveysministeriön, jäljempänä STM, sekä työ- ja elinkeinoministeriön, jäljempänä TEM, samoin kuin Tietosuojavaltuutetun toimiston ja Verohallinnon edustajia. Asian kiireellisyyden vuoksi selvitys on toteutettu suoraan hallituksen esityksen muotoon, minkä lisäksi esityksen valmistelussa on pyritty mahdollisuuksien mukaan hyödyntämään kansallisen tilastolainsäädännön uudistamistarpeita ja mahdollisuuksia parantaa tilastoaineiston saamista tutkimus- ja selvityskäyttöön selvittäneiden VM:n kahden työryhmän julkistamia muistioita: (i) 22.11.2016, VM048:00/2015, jäljempänä Sovalan työryhmä, ja (ii) 15.6.2020, VN/5797/2020 ja VM086:00/2020, Julkishallinnon aineistojen hyödyntämistä tutkimuksessa selvittävän työryhmän loppuraportti, VM:n julkaisuja 2020:54, jäljempänä Spolanderin työryhmä.

Sovalan työryhmä ei saavuttanut yksimielisyyttä kaikista ehdotuksistaan. Ehdotetusta muutoksesta TK-lakiin ja tilastokeskuksen tehtävästä valtion tilastotoimen koordinointiviranomaisena ei muodostunut yksimielistä näkemystä tilastoviranomaisten kesken. Työryhmä ehdotti myös tilastokeskuksen tiedonkeruuvaltuuksien laajentamista yksityisen sektorin aineistoihin, mistä ei muodostunut kaikilta osin yhtenäistä näkemystä. Tarkasteltuaan tiedonantovelvollisia koskevan lakisääteisen uhkasakon käyttökelpoisuutta työryhmä totesi, että rikemaksun käyttöönotto tilastolaissa vaatii vielä muun muassa vaikutusarvioinnin lisäselvitystä. Tilastolakiin lisättäväksi ehdotetusta säännöksestä, joka koski velvollisuutta kuulla tilastokeskusta silloin, kun viranomaiset harkitsevat muuttavansa tai lopettavansa olemassa olevia tietovarantoja ja rekistereitä, joiden tietoja käytetään tilastointitarkoitukseen, ei myöskään saavutettu yksimielisyyttä. Yksimielistä näkemystä ei myöskään muodostunut tietoturvallisen käyttöympäristön kehittämisestä.

Spolanderin työryhmä selvitti mahdollisuuksia parantaa julkishallinnon dataan perustuvien tutkimusaineistojen saatavuutta ja ehdotti aineistojen saatavuuden parantamiseksi aineistojen keräämisen keskittämistä, aineistojen täsmällistä luokittelua, aineistojen tarjoamisen keskittämistä tuottajilta käsittelijöille, vähän käsitellyn tiedon laajempaa jakamista käyttäjille ja metadatan laadun parantamista. Työryhmä ehdotti myös keskitettyä tutkimusaineistojen luvitusta, lupakäsittelyn ohjeistuksen parantamista sekä tilastokeskuksen ja Findatan sopimuskäytäntöjen yhtenäistämistä. Tilastokeskuksen etäkäyttöjärjestelmän kehittämistä pidettiin tärkeänä, samoin kuin tiiviimpää yhteistyötä aineistojen tuottajien, hankkeiden suunnittelijoiden ja aineiston käyttäjien kesken. Työryhmä ehdotti myös, että infrastruktuuri on budjettirahoitteista ja että pyydetty hinta kattaa aineiston tarjoamisen rajakustannukset. Tärkeänä pidettiin myös aineistoinfrastruktuurien yhteensopivuutta sekä lainsäädännön ajantasaisuutta ja sen tulkinnan yhdenmukaisuutta.

Spolanderin työryhmän ehdotuksista on tilastokeskuksessa jo toteutettu eräitä teknisiä suosituksia sähköisestä käyttöluvasta ja hinnoittelusta sekä yhteistyöstä Findatan kanssa, minkä lisäksi tutkijapalvelun nykyinen rahoitusmalli, mukaan lukien asiakasmaksut, on otettu tarkasteluun. Esitystä valmisteltaessa on lisäksi seurattu tilastokeskuksen johdolla toimivan Varallisuustutkimuksen ja varallisuustilastoinnin kehittämisprojektin ohjausryhmän keskustelua ja selvitystä, johon ovat osallistuneet VM, Suomen Pankki, jäljempänä SP, ja rahoitusvakausvirasto, jäljempänä RVV. Esitystä on näistä syistä täydennetty useilla konkreettisilla esimerkeillä, joilla tarkemmin perustellaan syitä sille, miksi tilastokeskuksen tutkija- ja aineistopalvelusta on tarpeen säätää tarkemmin laissa.

Spolanderin työryhmä teki useita ehdotuksia aineistojen saatavuuden parantamiseksi. Työryhmän työssä tärkeää oli tunnistaa selkeästi ”aineiston käsittelijöiden” rooli tutkimusaineistojen käytössä. Raportti kuvaa roolia seuraavasti: ”Aineistojen käsittelijöillä tarkoitetaan toimijoita, joiden nimenomaisena tehtävänä on tarjota aineistoja politiikan valmistelu- ja tutkimuskäyttöön. Tällaisia tahoja Suomessa ovat erityisesti tilastokeskus ja tänä vuonna [2020] toimintansa aloittanut Findata. Ne toimivat aineistoja kokoavina ja niitä käyttöön tarjoavina organisaatioina keräten ja yhdistäen tietoja eri lähteistä, luoden niistä erityisesti politiikan valmistelu- ja tutkimuskäyttöön tarkoitettuja valmisaineistoja ja myöntäen niihin käyttölupia silloin, kun kyse on tietosuojalainsäädännön piirissä olevista tiedoista. Näille toimijoille on tärkeää erityisesti selkeä lainsäädännöllinen mandaatti aineistojen käyttöön tarjoamiselle sekä ohjaavan ministeriön selkeät linjaukset esimerkiksi toiminnan prioriteeteista.”

Aineistokokonaisuuksia tarjoavien palveluntuottajien roolin tunnistaminen on sikäli tärkeää, että aikaisemmassa asiaan liittyvässä lainsäädännön kehittämisessä on yleensä tunnistettu vain kaksi roolia, rekisteriviranomainen ja tutkija. Tällöin jää pohtimatta aineistojen käsittelijäorganisaatioille tärkeä sääntely siitä, millä ehdoilla ne voivat palvelujaan tarjota. Raportin keskeinen suositus käsittelijöiden – tässä tapauksessa tilastokeskuksen tutkijapalvelun – toiminnan parantamiseksi on se, että lisätään tilastolakiin toisiolain mukainen kirjaus siitä, että tilastokeskus voi koostaa tutkimuskäyttöön valmisaineistoja myös muista kuin tilastointitarkoitukseen vastaanotetuista aineistoista.

Spolanderin työryhmän ehdotuksesta poiketen esityksessä ehdotetaan, että mainittu muutos tehdään TK-lakiin eikä tilastolakiin. Ehdotuksen perustelu on, että lainsäädäntö nykyisin mahdollistaa tilastokeskuksen toimimisen aktiivisesti vain niistä tietoaineistoista, jotka on hankittu tilastokeskukseen tai jotka muut tilastoviranomaiset (esimerkiksi Tulli) ovat hankkineet tilastolainsäädännön perusteella. Aineistojen kerääminen tilastokeskukseen edellyttää nykylainsäädännön puitteissa tilastointitarkoitusta, eikä pelkästään tutkimustarkoitukseen voida kerätä aineistoja. Tällöin ei voida varautua yhdisteltyjen tutkimusaineistojen kysyntään. Vaikka kysytyimmät tietoryhmät ja aineistot ovat usein samoja eri tutkimuksissa, ne joudutaan nykylainsäädännön mukaisesti kokoamaan aina erikseen ja uudelleen, kun uusi käyttäjä aineistoa tarvitsee.

2 Nykytila ja sen arviointi

Tilastokeskusta koskevan lainsäädännön ajantasaisuus

Tilastolain 2 §:n 1 momentin 1 kohdan mukaan tilastoviranomaisella tarkoitetaan tilastokeskusta ”valtion tilastotoimen yleisviranomaisena sekä Luonnonvarakeskusta, Tullia sekä Terveyden ja hyvinvoinnin laitosta niiden hoitaessa laissa säädettyjä tilastojen laadintaan liittyviä tehtäviä”. Tilastokeskuksen tehtävät määritellään tilastolaissa ja TK-laissa. Lakien keskinäisen dynamiikan mukaan tilastolaki on toiminnallinen säädös, joka koskee kaikkien valtion viranomaisten tilastotuotantoa ja sisältää EU:n tilastosääntelyn vaatimukset, kun taas TK-laki on suppea hallinnollinen säädös, joka tilastoviranomaisista koskee vain tilastokeskusta. Yleispiirteisyydessään TK-laki sallii tilastokeskukselle laajat oikeudet käsitellä tietoja tilastointitarkoitusta varten sekä rekisterinpitäjinä toimivilta muilta viranomaisilta että yksityisen sektorin tiedonantajilta. Lisäksi tilastolaki antaa mahdollisuuden hankkia tilastointitarkoitukseen sopimusperusteisesti tietoaineistoja yksityiseltä sektorilta. Sopimukset saattavat sisältää ehtoja, jotka voivat estää tutkimus- ja selvitystarpeiden täysimääräisen toteutumisen. Tilastolakia, jonka 5 luku (14-19 §:t) sisältää tilastokeskuksen tilastotointa koskevia erityissäännöksiä, on muutettu sen voimassaoloaikana (1.5.2004 alkaen, jolloin aikaisempi tilastolaki (62/1994) kumottiin) kuudesti pääasiallisesti muussa lainsäädännössä tapahtuneen kehityksen johdosta. TK-laki on puolestaan ajalta ennen Suomen EU-jäsenyyttä ja sitä on muutettu vain kerran. Toisaalta EU:n tilastosääntely on samanaikaisesti merkittävästi laajentunut ja sitä on kehitetty sääntelyrakenteeltaan aikaisempaa huomattavasti moniportaisemmaksi ja yksityiskohtaisemmaksi. Näistä syistä selvityksen keskeinen johtopäätös on, että etenkin TK-laki on ajantasaistamisen ja mahdollisen kokonaistarkastelun tarpeessa. Kumpaakin lakia kehitettäessä on puolestaan otettava huomioon EU:n voimakkaasti uudistunut tietosuojasääntely. TK-lain ja tilastolain välisen suhteen selventämiseksi sekä rinnakkaisten etäkäyttöjärjestelmien välisen työnjaon selkeyttämiseksi ja tutkija- ja aineistopalvelun kuormittumisen estämiseksi esityksen lakiehdotukset sisältävät myös eräitä teknisluontoisia informatiivisia säännöksiä.

Talouspolitiikan ja etenkin elinkeino-, finanssi- ja veropolitiikan valmistelun toimintaympäristö on Suomen EU-jäsenyyden aikana sekä yhteisen valuutan käyttöönoton ja euroalueen yhteistyön syventymisen seurauksena voimakkaasti muuttunut. Erityisesti tämä kehitys puoltaa valtioneuvoston näkökulmasta kansallisen tilastolainsäädännön ajantasaistamistarpeiden tarkastelua. Samanaikaisesti tiedonhallintaa sekä tiedon julkisuutta, saatavuutta ja maksullisuutta koskeva kansallinen lainsäädäntö ja EU-sääntely on laajentunut ja yksityiskohtaistunut. Vaatimukset julkisen hallinnon toiminnan avoimuudesta ovat myös kasvaneet.

Hallinnollisten rekisteriaineistojen keskeinen merkitys yhteiskunnallisen päätöksenteon valmistelun ja tieteellisen tutkimuksen tausta-aineistona on kasvanut ja edellyttää myös kansallisen tilastolainsäädännön ajantasaisuutta. Tämän vuoksi on tärkeää varmistaa, etteivät kansallinen tilastolainsäädäntö, EU:n tilastoasetuksen soveltamiskäytäntö ja tilastotoimen yleiset periaatteet aseta esteitä tai rajoituksia tilastokeskuksen edellytyksille tehokkaasti vastata hallinnollisten rekisteriaineistojen kasvaneeseen kysyntään yhteiskunnassa. Esityksessä pannaan tarkemmin kansallisesti täytäntöön EU:n tilastoasetuksen 17 a artiklaan liittyvä käytännesääntöjen kohta 8.6, jossa arvioidaan artiklan vaatimusten toteutumista.

Tilastokeskus saa nykyisin kerätä vain sellaisia tietoja, joita se tarvitsee tilastointitarkoitukseen. EU:n tilastoasetuksen 1, 2 ja 17 a artikloissa säädetään, että tilastointitarkoitus sisältää myös tilastojen kehittämisen ja laadunparannuksen. Tilastokeskus voi luovuttaa tilastointitarkoitukseen kerättyjä tietoja tieteelliseen tutkimukseen ja yhteiskuntaoloja koskeviin tilastollisiin selvityksiin, mutta se ei saa kerätä tietoja suoraan niitä varten. Näin on syntynyt tilanteita, joissa suuri osa viranomaisten henkilörekistereistä siirtyy tilastokeskukseen tilastointia varten, mutta osa jää siirtämättä, koska tilastokeskus ei tarvitse näitä tilastointitarkoitukseen. Tutkija joutuu hakemaan erillislupaa rekisteriä pitävältä toiselta viranomaiselta, jos hän tarvitsee tutkimuksessaan tietoja, joita ei ole siirretty tilastokeskukseen. Hallinnollisen taakan keventämisen ja norminpurun näkökulmasta lainsäädännön selventämisen tarve on ilmeinen.

Tilastokeskuksen etäkäyttöjärjestelmä

Tietoturvallisen käsittely-ympäristön avulla voidaan tutkijoille antaa tilastolain 13 §:ssä säädetty käyttöoikeus salassa pidettäviin tietoihin, joista on poistettu vain suoran tunnistamisen mahdollistavat tiedot (nimi, osoite, julkisesti saatavilla oleva tunnistenumero). Muuhun kuin tietoturvalliseen käsittely-ympäristöön luovutettavasta aineistosta on poistettava myös välillisen tunnistamisen mahdollistavat tiedot, jolloin aineistot eivät ole tutkimus- ja selvityskäyttöä varten yhtä kattavia. Myös EU:n tilastoasetuksen 23 artiklan vaatimus tukee julkisen tiedon hyväksikäytön edistämistä koskevia tilastolain 13 §:n tavoitteita, joissa on korostettu tieteellisen tutkimuksen käyttöoikeutta välillisesti tunnistettaviin tietoihin ja pyrkimystä tieteen vapauden turvaamiseen. Tilastolain esitöissä ei kuitenkaan aseteta tilastokeskukselle erityistä velvoitetta antaa käyttöoikeutta tietyllä teknisellä ratkaisulla, sillä säännöksessä ei ”otettaisi kantaa tietojen luovuttamisen tai käyttöoikeuden tekniseen toteuttamistapaan, vaan niiden osalta noudatettaisiin lain 13 b §:n säännöksiä” (HE 154/2012 vp, s. 33). Esitöiden mukaan käyttöoikeuden haltijalla on velvollisuus hävittää tai palauttaa fyysisesti luovutetut tiedot tilastokeskukselle käyttöoikeuden päätyttyä (HE 154/2012 vp, s. 34). Tietosuojaa vahvistaakseen tilastokeskus noudattaa komissiolle toimitettuja salassa pidettäviä tietoja koskevan, EU:n tilastoasetusta täydentävän komission asetuksen (EU) N:o 557/2013, annettu 17.6.2013, Euroopan tilastoista annetun Euroopan parlamentin ja neuvoston asetuksen (EY) N:o 223/2009 täytäntöönpanosta tieteellisiin tarkoituksiin käytettävien salassapidettävien tietojen käyttöoikeuden osalta ja komission asetuksen (EY) N:o 831/2002 kumoamisesta, jäljempänä komission asetus, mukaista linjausta myös omassa toiminnassaan. Tilastokeskuksen linjauksen mukaan salassa pidettäviä tietoja, joihin ei ole sovellettu muita tilastotietojen suojausmenetelmiä, luovutetaan vain tietoturvallisessa käyttöympäristössä.

Esimerkki. Aineistojen yhdistäminen edellyttää yhteistä tunnistetta. Koska tilastolain 13 §:n mukaisesti suorat tunnisteet poistetaan, on aineistojen yhdistämiseksi luotava korvaava pseudotunniste. Pseudotunnisteen avulla tutkija voi yhdistää niitä aineistokokonaisuuksia, joihin hän on saanut tutkimusta varten käyttöluvan. Aineistosta tai aineistokokonaisuudesta voidaan joissakin tapauksissa tunnistaa tilastoyksikkö epäsuorasti. Lisäksi muu julkisesti saatavilla oleva tieto voi lisätä paljastumisriskiä. Esimerkiksi liikenneonnettomuus, jota on käsitelty mediassa, voidaan onnettomuuspaikan perusteella yhdistää aineistossa olevaan yksilöön ja tätä kautta koko aineiston tiedot yksilöstä paljastuvat. Tätä kutsutaan epäsuoraksi tunnistamiseksi. Tilastokeskus edellyttää aineiston käsittelijöiltä salassapitositoumusta. Lisäksi käyttöluvassa määrätään, ettei käsittelijä saa yrittää tunnistaa epäsuorasti tai muuten tietojen kohteita.

Etäkäyttöjärjestelmässä voidaan myös yhdistää muiden rekisterinpitäjien tietoja tai tutkijoiden itse keräämiä tietoja tilastokeskuksen tietoihin tutkimusaineistojen muodostamiseksi. Toinen rekisterinpitäjä tai tutkija toimittaa yhdistettävän aineiston tilastokeskukseen, jossa aineistossa olevat yksilöivät tunnisteet korvataan pseudotunnisteella ja viedään aineiston suojauksen jälkeen etäkäyttöjärjestelmään. Etäkäyttöjärjestelmän käyttö on laajentunut ja sen kautta jaetaan tilastokeskuksen aineistojen lisäksi muidenkin viranomaisten (esimerkiksi Tullin, THL:n ja TEM:n) aineistoja silloin, kun niitä yhdistetään tilastokeskuksen aineistoihin. Tilastokeskus avaa, muiden viranomaisten antamien käyttölupien mukaisesti, sille toimitetut valmiit aineistokokonaisuudet tutkijoiden käyttöön etäkäyttöjärjestelmässä. Aineistoihin voidaan myös liittää tutkijoiden itse keräämiä aineistoja, kuten kyselyaineistoja. Päätöksen tietojen luovuttamisesta tutkimukseen tekee rekisterinpitäjänä toimiva viranomainen tai muu taho.

Tutkimusaineistojen jakelijan ja käyttäjän kannalta etäkäyttöjärjestelmä on kustannustehokas, koska kaikkien viranomaisten aineistot, joita käytetään tutkimuksissa, voivat olla yhdessä järjestelmässä. Tutkijoita helpottaa myös se, ettei heidän tarvitse huolehtia aineistojen säilytyksestä. Tilastokeskus on tarjonnut etäkäyttöjärjestelmää myös muiden viranomaisten aineistojen jakelualustaksi, jotta tutkijoilla on etäkäyttöjärjestelmän kautta helposti saatavilla kaikki tutkimuksen kannalta olennainen tutkimusaineisto. Tämä parantaa tilastokeskuksen palvelutasoa sekä helpottaa ja tehostaa tutkijoiden työtä ja säästää aineistojen valmisaineisto- ja hallinnointikustannuksia tutkimushankkeissa.

Esimerkki. Tutkimusaineiston saatavuuden ongelma ei rajoitu suomalaisiin toimijoihin. TEM ja Helsinki GSE ovat tuoneet esiin, etteivät etäkäytön edellytykset ole tutkimuksen näkökulmasta optimaaliset. Esimerkiksi Taloudellisen yhteistyön ja kehityksen järjestön (OECD) vertailevat tutkimukset suomalaisella aineistolla ovat TEM:n mukaan merkittävästi viivästyneet, koska ulkomaisten tutkijoiden datan etäkäyttö tilastokeskuksen etäkäyttöjärjestelmässä on edellyttänyt (i) teknisen käyttöyhteyden, yliopiston käyttäjätunnukset ja tähän sovelletun vahvan tunnistautumisen, (ii) salassapitosopimuksen tilastokeskuksen kanssa, (iii) etäkäyttösitoumuksen ulkomailta tilastokeskukselle, (iv) liittymisen TEM:n organisaatiosopimukseen, (v) TEM:n datojen käyttöluvan, (vi) ELY-keskusten ja TE-toimistojen kehittämis- ja hallintokeskuksen (KEHA-keskus) datojen käyttöluvan, ja (vi) tilastokeskuksen käyttöluvan Fiona-etäkäyttöjärjestelmään. Ongelma koskee Helsinki GSE:n mukaan myös tilanteita, joissa suomalainen tutkija on tutkimusvierailulla ulkomailla, etenkin muualla kuin Euroopan talousalueella. Osasyynä ovat tietosuojan haasteet, jotka liittyvät Yhdysvaltojen tiedusteluviranomaisten laajoihin tiedonsaantioikeuksiin.

Eduskunnan tiedonsaanti

Esityksellä pyritään parantamaan erityisesti elinkeino-, talous- ja laajemmin yhteiskuntapolitiikan valmisteluun liittyvää eduskunnan tiedonsaantia suoraan valtioneuvostosta, mitä eduskunnan perustuslakivaliokunta on yleisesti edellyttänyt (PeVL 30/2020 vp) sekä vahvistamaan eduskunnan edellytyksiä välillisesti seurata komission harjoittamaa EU:n tilastoasetusta täydentävien käytännesääntöjen noudattamisen ja täytäntöönpanon valvontaa tilastoviranomaisten vastuunalaisuuden varmistamiseksi. Valiokunta on katsonut, että eduskunnan oikeus saada pyytämänsä tiedot on ehdoton eikä valtioneuvostolla ole toimivaltaa kieltäytyä luovuttamasta pyydettyjä tietoja. Lisäksi valiokunta muun muassa on edellyttänyt, että eduskunnalle on tarpeen selvittää riittävän seikkaperäisesti ratkaisujen ja esimerkiksi talousarvioehdotuksen mitoituksen perusteet perusteluineen. Valiokunta kokosi lausuntoaan varten laajasti palautetta eduskunnan muilta valiokunnilta tiedonsaannissa esiintyneistä ongelmista.

Helsinki GSE:stä saatujen tietojen valossa ajantasaiset aineistot voivat olla hyvinkin tärkeitä yllättävissä tilanteissa, eivätkä vain niissä. Esimerkiksi koronaepidemian aikana myönnettyjen kustannustukien perusteluissa on ollut keskeistä voida seurata tulorekisterin ja muiden rekisterien avulla palkkasummaa sekä lomautettujen ja irtisanottujen määrää (talousvaliokunta). Samoin rokotekattavuuden seuranta toimialoittain ja ammateittain on osoittautunut merkitykselliseksi ja esimerkiksi Kansallinen rokotusasiantuntijaryhmä (KRAR) on ollut tältä osin pitkälti Tilannehuoneen raporttien varassa (sosiaali- ja terveysvaliokunta). Normaaliaikoina verotulojen kertymän seuranta valtio- ja kuntatasolla on tarpeen, sillä ainakin kunnat ovat usein huonosti perillä siitä, miten niiden verotulokertymä kehittyy vuoden aikana (valtiovarainvaliokunta). Osa Tilannehuoneen raporteista kiertää eduskunnan käyttöön valtioneuvoston kautta, kuten raportti hoitajien siirtymisestä pois toimialalta (työ- ja elinkeinoministeriö).

Lisäksi kansanedustajien aktiivisessa käytössä oleva eduskunnan tietopalvelu hyötyy välillisesti esitykseen sisältyvistä ehdotuksista. Näistä syistä eduskunnan ja sen valiokuntien ajankohtaisiin tietoaineistotarpeisiin vastaamista on tarpeen tehostaa eikä sen ohjaaminen valtioneuvostosta suoraan saatavan valmistelutyön asemesta Tilannehuoneen kaltaiseen yksittäiseen tutkimusorganisaatioon ole muuna kuin väliaikaisena ratkaisuna enää perusteltua. Toisaalta nopeasti saatavilla oleville, EU:n tilastoasetuksen 17 a artiklassa tarkoitetuille hallinnollisille rekisteriaineistoille on suuri kysyntä yhteiskunnassa, minkä vuoksi on tärkeää varmistaa tutkija- ja viranomaisyhteisön muiden tiedontarvitsijoiden mahdollisimman tasapuolinen kohtelu ja tietoturvallinen käsittely-ympäristö. Myös Tilannehuoneesta saadut kokemukset, etenkin kun se on osoittautunut tutkijapalvelun tehokkaaksi toimintamalliksi työskentelystä etäkäyttöjärjestelmässä, puoltavat samanlaisen järjestelyn toteuttamista laajemmin myös muun tutkija- ja viranomaisyhteisön saataville.

Euroopan unionin tilastosääntely

EU:n tilastosääntelyn oikeusperusta on EU:n toiminnasta tehdyn sopimuksen, jäljempänä SEUT, 338 artikla (aiempi EY-sopimuksen 285 artikla), jonka 2 kohdan mukaan: ”Tilastojen laatimisessa noudatetaan puolueettomuutta, luotettavuutta, objektiivisuutta, tieteellistä riippumattomuutta, kustannustehokkuutta ja tilastosalaisuutta; tilastojen laatimisesta ei saa aiheutua kohtuutonta rasitetta taloudellisille toimijoille”.

EU:n tilastosääntelyn keskeinen säädös on EU:n tilastoasetus, jonka etusija suhteessa kansalliseen tilastolainsäädäntöön tunnustetaan tilastolain 1 §:n 3 momentissa: ”Tämän lain säännöksiä sovelletaan [Euroopan yhteisön tilasto-ohjelmaan sisältyviin] tilastoihin siltä osin kuin edellä mainittu asetus ei tule sovellettavaksi”. EU:n tilastoasetus on velvoittava silloin, kun laaditaan Euroopan tilasto-ohjelmaan kuuluvia tilastoja, jollaisia suurin osa tilastokeskuksen tilastoista on. Yksi EU:n tilastoasetuksen keskeisistä tilastoperiaatteista on puolueettomuus, mikä tarkoittaa sitä, että tilastoja on kehitettävä, tuotettava ja jaettava neutraalilla tavalla ja että kaikkia käyttäjiä on kohdeltava yhdenvertaisesti (2 artiklan 1 b kohta). EU:n tilastoasetusta muutettiin vuonna 2015 (Euroopan parlamentin ja neuvoston asetus (EU) 2015/759, annettu 29.4.2015, Euroopan tilastoista annetun asetuksen (EY) N:o 223/2009 muuttamisesta) ja sitä sovelletaan Euroopan tilastoihin ja Euroopan tilasto-ohjelmassa määriteltyihin tilastoalueisiin. Tilastojen asemesta uusissa EU-asetuksissa operoidaan käsitteillä ”aihealue”, ”aihe” ja ”yksityiskohtainen aihe”. Yksittäisistä toimitettavista tiedoista säädetään erillisissä tilastokohtaisissa asetuksissa sekä puiteasetuksissa (framework regulation), joiden nojalla annetuissa komission täytäntöönpanosäädöksissä tuotettavat tiedot määritellään tarkemmin. Tilasto-ohjelmasta säädetään EU:n tilastoasetuksen 13 artiklassa. Euroopan parlamentin ja neuvoston yhteispäätösmenettelyssä hyväksytty ohjelma 2021-2027 julkaistiin äskettäin ja se sisältää tilastojen lisäksi selvitystehtäviä uudesta tiedontuotannosta ja tilastoinnin tuotantoteknologian kehittämistoimia. Tilastojen sisältöä sääntelevät EU-asetukset ovat muuttuneet pääosin puiteasetuksiksi eikä niissä enää ole erotettavissa perinteisiä tilastoja, vaan sen sijaan tietoelementtejä ja teema-alueita. Muutosten seurauksena on yhä vaikeampaa vetää rajaa kansallisen ja EU-tilastoinnin välille.

Jäsenvaltioiden kansallisten tilastoviranomaisten mahdollisuudesta luovuttaa tilastointia varten vastaanottamiaan tietoja tutkimuskäyttöön on säädetty EU:n tilastoasetuksen 23 artiklan ensimmäisessä kappaleessa seuraavasti: ”Komissio (Eurostat) tai kansalliset tilastolaitokset tai muut kansalliset viranomaiset voivat toimivaltansa puitteissa myöntää käyttöoikeuden sellaisiin salassa pidettäviin tietoihin, joiden perusteella tilastoyksiköt on mahdollista tunnistaa ainoastaan välillisesti, tutkijoille, jotka suorittavat tilastollisia analyyseja tieteellisiä tarkoituksia varten. Jos tiedot on luovutettu komissiolle (Eurostatille), vaaditaan tiedot toimittaneen kansallisen tilastolaitoksen tai muun kansallisen viranomaisen hyväksyntä.” On huomionarvoista, ettei valtuutuksessa mainita etäkäyttöjärjestelmiä, jollaiset olivat artiklan säätämisen aikaan Euroopassa harvinaisia ja ovat sitä edelleen. Sen sijaan tällaisia tulkintoja voitaisiin välillisesti johtaa komissioon (Eurostatiin) sovellettavasta komission asetuksesta. Koska kyseistä asetusta ei sovelleta jäsenvaltioiden kansallisiin tilastoviranomaisiin, niiden tulisi pidättäytyä tekemästä siitä johtopäätöksiä oman toimintansa järjestämiseen.

Tilastolain 13 b §:n mukaan tilastointitarkoituksiin kerättyä tietoa varten voidaan antaa käyttöoikeus ”teknisen käyttöyhteyden avulla, muussa teknisesti tai sähköisesti käsiteltävässä muodossa, kirjallisesti tai muulla tarkoitukseen soveltuvalla turvallisella ja luotettavalla tavalla”. EU:n tilastoasetuksen 19 artiklaan perustuvan tilastolain 13 a §:n mukaan taas sellaista tietoa, joista tilastoyksikköä ei voida tunnistaa suoraan eikä välillisesti, voi tuottaa ja antaa julkiseen käyttöön salassapitovelvollisuuden estämättä. EU:n tilastoasetuksen 19 artiklan mukaan tunnistetietojen poistamisessa ja tietoja muutoin käsiteltäessä on otettava huomioon kaikki keinot, joita kolmannen osapuolen voidaan kohtuudella odottaa käyttävän.

EU:n tilastoasetuksen valtuutus on suoraan sovellettavaa lainsäädäntöä, joka koskee vain EU:n tilastointia varten hankittuja tietoja. Vastaavanlaisia kirjauksia on sittemmin tehty kansallisiin tilastolakeihin niin, että ne kattavat myös kansalliseen käyttöön tarkoitetut tilastoaineistot. Tilastolakiin lisättiin vuonna 2013 mahdollisuus luovuttaa pseudonymisoitua tilastoaineistoa tutkimus- ja selvityskäyttöön eli tietoa, josta on poistettu mahdollisuus suoraan tunnistamiseen. Tämä osaltaan lisäsi voimakkaasti tutkimusaineistojen kysyntää, ja esimerkiksi tutkijapalvelun toiminnan volyymi on mainitun lainmuutoksen jälkeen kasvanut noin nelinkertaiseksi verrattuna lainmuutosta edeltäneeseen aikaan.

EU:n tilastosääntely jättää kuitenkin eräiltä osin kansallista liikkumavaraa tilanteisiin, joissa tilastoaineistojen tarkoituksenmukaista käyttöä ja käytettävyyttä halutaan lisätä, mihin Suomessakin on esiintynyt kysyntää ja tarvetta. Kansallista liikkumavaraa on käytetty esimerkiksi Tilannehuoneen kanssa toteutetussa järjestelyssä, josta on erillinen tilastokeskuksen pääjohtajan päätös ajantasaisen tilastoaineiston luovuttamisesta tutkimuskäyttöön ennen aineistoihin perustuvien tilastojen julkaisemista. Käytännesääntöjen kohdan 15.4 mukaan ”Yksikköaineistoihin pääsy sallitaan tutkimustarkoituksiin, ja siinä noudatetaan erityisiä sääntöjä tai protokollaa”.

Datahallintosäädös

Salassa pidettävien tietojen jakamismenettelyistä tullaan EU:ssa säätämään komission marraskuussa 2020 antamassa ehdotuksessa EU:n datahallintosäädökseksi (Data Governance Act, jäljempänä EU:n datahallintosäädös), joka monin tavoin vaikuttanee tilastokeskuksen tehtäviin (datan toisiokäytön palvelujen tekninen tukipiste, tutkijapalvelun etäkäyttöjärjestelmän hoitaman tehtävän laajennus, kansallinen keskitetty yhteyspiste tiedon toisiokäytölle). Ehdotus kuuluu komission datastrategiaan (Valtioneuvoston kirjelmä eduskunnalle komission ehdotuksesta Euroopan parlamentin ja neuvoston asetukseksi eurooppalaisesta datahallinnosta (datahallintosäädös, U 1/2021 vp) ja täydentää Euroopan parlamentin ja neuvoston uudelleenlaaditun direktiivin, annettu 20.6.2019, avoimesta datasta ja julkisen sektorin hallussa olevien tietojen uudelleenkäytöstä (EU) 2019/1024, jäljempänä avoimen datan direktiivi, sääntelyä. EU:n datahallintosäädöksessä on tunnistettu, samoin kuin Spolanderin työryhmän raportissa, aineistojen käsittelijäorganisaatioiden keskeinen rooli aineistojen tutkimus- ja muussa toisiokäytössä. EU:n datahallintosäädös on äskettäin viimeistelty neuvoston ja Euroopan parlamentin välisissä lainsäädäntöneuvotteluissa (trilogit), joihin komissio osallistui välittäjän ominaisuudessa. EU:n datahallintosäädöksen kansallisen täytäntöönpanon erikseen tapahtuvan valmistelun ja EU:n tilastoasetukseen kuluvana vuonna komissiossa valmisteltavien muutosehdotusten, joissa otetaan huomioon EU:n datahallintosäädöksen vaikutus, vuoksi esityksessä on pidättäydytty tekemästä EU:n datahallintosäädöksen täytäntöönpanoon liittyviä ehdotuksia. EU:n datahallintosäädös määrittelee EU:n datan jakamisen periaatteiden puitteet, jolloin viranomaisten on esimerkiksi tarjottava nykyistä enemmän tukea datan toisiokäytölle. EU:n datahallintosäädöksessä kuvataan jäsenvaltioiden julkishallinnon tiedon toisiokäytön tukeen liittyvät tehtävät ja velvollisuudet mutta ei oteta kantaa siihen, miten vaatimusten toteutus kansallisesti järjestetään. Kaikkien toisiokäyttöön tietoja luovuttavien viranomaisten edellytetään käyttävän tietoturvallista käsittely-ympäristöä ja muun muassa pseudonymisointia tai anonymisointia, mikä johtanee tietoturvallisten käyttöympäristöjen ja käyttölupahallintaprosessien kysynnän kasvuun.

EU:n datahallintosäädöksen mukaan kunkin jäsenvaltion on nimettävä yksi tai useampi toimivaltainen elin, joka voi olla alakohtainen, tukemaan julkisen sektorin elimiä niiden hoitaessa pääsyn myöntämistä koskevaa tehtävää datan luokkiin uudelleenkäyttöä varten. Tukeen on sisällyttävä tarvittaessa (a) tekninen tuki turvatun käsittely-ympäristön tarjoamisesta dataan pääsyyn uudelleenkäyttöä varten, (b) tekninen tuki sellaisten testattujen tekniikoiden soveltamisessa, joilla varmistetaan datan käsittely siten, että säilytetään dataan, jonka uudelleenkäyttö on sallittua, sisältyvien tietojen yksityisyyden suoja, kuten tekniikat henkilötietojen pseudonymisoimiseksi, anonymisoimiseksi, yleistämiseksi, poistamiseksi ja satunnaistamiseksi, (c) julkisen sektorin elinten avustaminen tarvittaessa siinä, että uudelleenkäyttäjät saavat suostumuksen tai luvan datan uudelleenkäyttöön altruistisiin tai muihin tarkoituksiin datan haltijoiden erityisten päätösten mukaisesti, kuten päätökset oikeudenkäyttöalueesta tai -alueista (jurisdictions), joilla datankäsittelyn on tarkoitus tapahtua, sekä (d) julkisen sektorin elinten avustaminen uudelleenkäyttäjän tekemien sitoumusten asianmukaisuuden kannalta. Toimivaltaisille elimille voidaan myös antaa EU:n tai kansallisen lainsäädännön, jossa säädetään dataan pääsyn myöntämisestä, nojalla tehtäväksi myöntää pääsy datan luokkiin uudelleenkäyttöä varten.

Toimivaltaisella elimellä tai toimivaltaisilla elimillä on oltava riittävät oikeudelliset ja tekniset valmiudet ja asiantuntemus, jotta ne voivat noudattaa asiaankuuluvaa EU:n tai kansallista lainsäädäntöä, joka koskee datan luokkiin pääsyn järjestelyjä. Jäsenvaltioiden on ilmoitettava komissiolle nimetyt toimivaltaiset elimet. Niiden on myös ilmoitettava komissiolle kaikki näiden elinten tietoihin myöhemmin tehtävät muutokset. EU:n datahallintosäädöksessä kuvatut tutkijapalvelutehtävät on kansallisesti osoitettava jollekin viranomaiselle. Esityksen mukaan tilastokeskus toimii yhtenä datahallintapalvelujen tarjoajana.

Kansallisesti päätettäväksi edellytetään yksi tai useampi tekninen tukipiste, joka muun muassa tukee datan löytämisessä ja käyttämisessä (i) tarjoamalla tietoturvallisen käyttöympäristön (nykyisin Suomessa Findatan Kapseli-etäkäyttöympäristö ja tilastokeskuksen Fiona-etäkäyttöjärjestelmä), (ii) toteuttamalla pseudonymisointi- ja anonymisointimenettelyt (nykyisin Suomessa Findata ja tilastokeskuksen tutkijapalvelu) ja (iii) hankkimalla tiedon toisiokäyttäjien suostumuksista (ei kenenkään vastuulla nykyisin Suomessa). Lisäksi jäsenvaltioiden edellytetään nimeävän (i) yhden kansallisen, keskitetyn yhteyspisteen, joka välittää pyyntöjä teknisille tukipisteille sekä pitää niistä luetteloa ja kuvauksia, (ii) viranomaisen, joka hoitaa välityspalvelujen tarjoajien rekisteröimistä ja valvontaa, sekä (iii) viranomaisen, joka vastaa data-altruismipohjaisten organisaatioiden rekistereistä ja valvonnasta.

Mikrosimulointimallit

Tutkijapalvelun yhteydessä ylläpidetään mikrosimulointimallia, jolla voidaan tehdä arvioita etenkin henkilövero- ja etuuslainsäädännön muutosten vaikutuksista mutta myös liikenne- ja yritystutkimuksessa sekä epidemiologisissa mallinnuksissa. Mikrosimulointi on mallintamistekniikka, joka toimii yksittäisten toimijoiden tasolla, kuten henkilöt, kotitaloudet, ajoneuvot ja yritykset. Mikrosimuloinnilla viitataan yleisesti menetelmään, jossa ohjelmoituja sääntöjä sovelletaan yksikkötason aineistoon. Mikrosimuloinnissa tarkastellaan pääasiassa jakautumisen muutoksia, joten sitä käytetään arvioitaessa taloudellisten ja väestötieteellisten muutosten vaikutusta yhteiskuntaan. Toinen kasvava soveltamisala on liikennevirtojen jakautumisen arviointi katuverkossa. Mikrosimulointi liittyy läheisesti muihin yksikkötason mallintamisen näkökulmiin: soluautomaattiin (cellular automation, CA) ja agenttipohjaiseen mallintamiseen (agent-based modeling, ABM).

Esimerkki. Vero- ja sosiaaliturvamalleissa mikrosimulointimalliin on ohjelmoitu vero- ja sosiaaliturvajärjestelmän säännöt, joita sovelletaan taustatietoja sisältävään rekisteriaineistoon. Rekisteritieto voi sisältää esimerkiksi henkilön iän, sukupuolen, siviilisäädyn, työllisyystilanteen ja tulotiedot. Rekisterin yksiköihin sovelletaan sääntöjä, jotka johtavat simuloituihin muutoksiin yksiköiden tilassa. Säännöt voivat olla varsin deterministisiä, jolloin niiden muutoksista johtuva vaikutus voidaan arvioida suurella todennäköisyydellä, kuten verotuksen vaikutus tiettyyn tuloon. Toisaalta sääntöihin voi liittyä epävarmuutta, kuten laskelma odotettavissa olevasta eliniästä tai tulema harkinnan varaisesta toimeentulotuesta. Tulos on arvio näiden sääntöjen soveltamisesta, mahdollisesti useiden peräkkäisten soveltamisvaiheiden jälkeen.

Toisaalta mikrosimulointimallien kehittämistyössä on vuodesta 2017 lähtien todettu, ettei tilastokeskus voi luovuttaa työttömyysturvan jaksoaineistoa käyttäjille simulointia varten ennen kuin tilastokeskuksen virallinen ohjelmakoodi on täysin valmis. Palvelun tuottajana tilastokeskus päättää, milloin palvelu on valmis tai kypsä esiteltäväksi. Ongelmaksi on muodostunut se, että malliin liitettävän uuden aineiston täydellisen mallinnusohjelman valmistuminen on voinut kestää jopa neljä tai viisi vuotta. Toisaalta esimerkiksi Kelan toimeentulotukirekisterin liittäminen mikrosimulointimalliin antaa nopeasti, käytännössä parissa päivässä, erittäin hyödyllistä tilastoaineistoa nopeisiin ajankohtaisiin tietoaineistotarpeisiin vastaamiseen.

Mikrosimulointi on keskeinen tutkimus- ja selvityskäytön väline, joka on erikseen resursoitu ja jonka ylläpitoon on nimetty erilliset henkilöt, eikä mikrosimulointiin ole tutkijapalvelun kaltaisia jonoja. Myös mikrosimuloinnin palvelutasoa on mahdollista parantaa, koska on osoittautunut mahdolliseksi tarjota Tilannehuoneelle tutkija- ja viranomaisyhteisön muille tiedontarvitsijoille tarjotusta palvelusta poikkeavaa nopeaa ja räätälöityä erillispalvelua. Lisäksi mikrosimuloinnilla on tätä varten oma rahoituksensa. Koska esityksen tavoitteena on laajentaa tätä toimintatapaa myös tutkija- ja viranomaisyhteisön muille tiedontarvitsijoille, on kiinnitetty huomiota mikrosimulointimallin asiakkaisiin. Mikrosimulointimalli ei ole tilasto vaan palvelu, johon liittyvät aineistot julkaistaan joka tapauksessa tavanomaisesti sangen hitaasti. Tällä hetkellä mallissa toimii edelleen aineistovuosi 2018, josta kaikki relevantit tilastot on jo julkaistu, esimerkiksi työssäkäyntitilasto 2018 yli vuosi sitten (https://tilastokeskus.fi/til/tyokay/2018/01/tyokay_2018_01_2020-04-17_tie_001_fi.html). Lisäaineistojen, kuten työttömyysturvan ja toimeentulotuen yhdistäminen päämalliin on erittäin hyödyllistä, mutta senkin tulisi tapahtua ketterästi ja nopeasti. Sen määrittely, milloin tilasto on valmis julkaistavaksi, liittyy tilastotuotannon itsenäisyyteen sekä tilastokeskuksen riippumattomuuteen ja tilastosalaisuuteen, jotka perustuvat EU:n tilastoasetuksessa (2 artikla) säädettyihin tilastoperiaatteisiin. Esityksellä ei siten ole tarkoitus puuttua tilastotuotantoon tai siihen, milloin tilasto on valmis julkaistavaksi, vaan erityisesti siihen, että hallinnollisia rekisteriaineistoja saadaan tutkimus- ja selvityskäyttöön ennen kuin niitä hyödyntävä laajempi tilastoaineisto on valmis ja julkistettu, sekä mikrosimuloinnin tapauksessa mahdollistamaan käyttäjien aktiivisempi osallistuminen kehityskäyttöön ennen kuin varsinainen mikrosimulointimalli käyttää aineistoa.

Tutkimustiedon käytön haasteet

VNK:n koordinoimalla valtioneuvoston yhteisellä tutkimus- ja selvitystoiminnalla, jäljempänä TEAS, tuotetaan tietoa yhteiskunnallisen päätöksenteon, tiedolla johtamisen ja toimintakäytäntöjen tueksi. Tilastoaineistojen saatavuus TEAS-hankkeissa toteutettavien selvitysten edellyttämään tutkimus- ja selvityskäyttöön on tärkeää etenkin, koska tilastokeskuksen tutkijapalvelu tarjoaa nykyisin yksikkötason aineistoja käytettäväksi tieteellisiin tutkimuksiin ja tilastollisiin selvityksiin. TEAS-hankkeiden lisäksi valtioneuvoston piirissä tehdään laajasti muitakin selvityksiä. Tutkijapalvelua käyttävät valtioneuvoston, sen ministeriöiden ja sen alaisten viranomaisten, kuten VATT:n ja Kilpailu- ja kuluttajaviraston, jäljempänä KKV, lisäksi erityisesti muut merkittävät yhteiskunnalliset toimijat, etenkin tutkimusta tekevät organisaatiot, kuten yliopistot, korkeakoulut, ammattikorkeakoulut, tutkimuslaitokset ja ajatuspajat, jotka ovat tutkijapalvelun pääasiallisia asiakkaita.

Tutkijapalvelun räätälöityjen aineistopyyntöjen käyttölupahakemusten käsittely on käytössä olevien resurssien vuoksi ruuhkautunut ja tutkimustulosten saamiseen on voinut kulua kaikkiaan jopa yli kaksi vuotta aineistojonojen vuoksi (käyttöluvan jonotus, aineiston muodostaminen sekä tutkimus- ja analyysityö). Tutkijoiden rajallisista rahoituskausista kuluu edelleen siten paljon aikaa käyttölupapäätösten odotteluun, mikä on ongelmallista, koska tutkimukseen liittyvät reaaliaikavaatimukset ovat kasvaneet.

Esimerkki tilastokeskuksen toiminnasta uusilla toimialoilla. Kasvihuonekaasupäästöjen lopulliset tiedot valmistuvat tilastokeskuksen raportointiaikataulun vuoksi noin 15 kuukauden kuluttua tilastovuoden päättymisestä, jolloin ne raportoidaan EU:lle ja kuukautta myöhemmin Yhdistyneiden kansakuntien, jäljempänä YK, ilmastosopimukselle (sopimuksen osapuolikokousten päätösten mukaisesti). Pikaennakolliset päästötiedot lasketaan hieman karkeammilla menetelmillä ja ennakollisilla tiedoilla, joten ne julkistetaan jo viiden kuukauden kuluttua tilastovuoden päättymisestä, ja ennakolliset päästötiedot noin vuoden kuluttua tilastovuoden päättymisestä. Ennakkotietojen, jotka myös ovat tilastoja, joulukuussa tapahtuvan julkistuksen jälkeen tehdyt muutokset ovat kuitenkin vähäisiä. Myös pikaennakon kokonaispäästöjä koskevat tiedot ovat muista kuin maankäytön tiedoista lopullisten lukujen tasolla, joskin prosentin tai parin prosentin muutokset ovat olleet tavallisia. Kasvihuonekaasupäästöjen raportointi kattaa päästötietojen lisäksi muun muassa laajan kansallisen inventaarioraportin ja päästövähennystavoitteiden seurannan. Raportoinnin sisältöä ja raportointisykliä koskevat ilmastosopimuksen ohjeet, kansainvälisen ilmastopaneelin (The Intergovernmental Panel on Climate Change, IPCC) ohjeet ja EU-lainsäädäntö. Laskenta tulee päivittää ja julkaista myös koko aikasarjalle takautuvasti pientenkin laskentamuutosten vuoksi.

Tilastokeskus toimii VM:n tulosohjauksessa, jossa asetetaan tutkijapalvelulle tavoitteita muun muassa käyttölupahakemusten määrästä, aineistotoimitusten tavoiteajasta sekä valmisaineistojen ja räätälöityjen etäkäyttötoimitusten mediaanitoimitusajoista. VM:n ja tilastokeskuksen väliseen vuoden 2019 tulossopimukseen oli kirjattu tutkijapalvelun valmisaineistojen mediaanitoimitusaikoja seuraavasti: vuonna 2017 toteuma oli 36 päivää, 2018 arvio 72 päivää sekä 2019 tavoite 50 päivää, 2020 tavoite 40 päivää ja 2021 tavoite 35 päivää. Tutkijapalvelun seurannan mukaiset toimitusajat olivat 2017 43 päivää, 2018 72 päivää, 2019 84 päivää, 2020 78 päivää ja 2021 98 päivää. Vanhimman hakemuksen odotusaika on tutkimushankekohtaisesti räätälöitäville aineistopyynnöille ollut pidempi kuin valmisaineistoille eli tyypillisesti vähintään kuusi kuukautta. Pitkät toimitusajat eivät vastaa tulosohjauksessa asetettuja tavoitteita. Tulossopimuksessa sovitaan muun muassa tilastokeskuksen palvelukyvyn tavoitteista. Vuoden 2020 tulossopimuksessa on asetettu tutkijapalvelulle käyttölupahakemusten määriä ja toimitusaikoja koskevat tavoitteet. Uusimman tulossopimuksen tulosmittarien perusteella hakemusten lukumäärä ja niiden toimitusajat kasvoivat ilman, että tehtävien suorittamiseen olisi kohdennettu lisävoimavaroja. Koska hakemusten määrä kasvoi, toimitusajat olisivat kasvaneet, jollei tilastokeskus olisi kohdentanut vuonna 2020 merkittävästi lisävoimavaroja tutkijapalveluun perustamalla yhteensä seitsemän uutta virkaa. Kesäkuussa 2021 kaikki jonossa olleet käyttölupahakemukset olivat saapuneet vuoden 2021 aikana. Vuoden 2021 lopussa vanhin käsittelyä odottava valmis käyttölupahakemus oli saapunut lokakuussa 2021, joten hakemuksen käsittelyyn ottamiseen kuluva aika oli lyhentynyt, mutta toimitusajat olivat kasvaneet.

Tutkimusaineistojen hidas saatavuus on osoittautunut ongelmaksi tutkimustyössä. Rajalliset voimavarat tutkijapalvelussa ja Findatassa sekä siitä seuraava aineistojen viivästynyt saatavuus vaikeuttavat merkittävästi selvitys- ja tutkimushankkeiden edistymistä. Poikkeus on Tilannehuone, joka erikseen resursoitiin mahdollistamaan nopea toiminta vastaamaan koronaepidemian aiheuttamaan akuuttiin tietoaineistotarpeeseen.

Esimerkki. Tutkijat ovat myös kertoneet, että esimerkiksi puoli vuotta käyttölupahakemuksen toimittamisen jälkeen heille ei ole nimetty edes yhteyshenkilöä tutkijapalvelussa. Hallintolain (434/2003) 23 §:n 2 momentin mukaan viranomaisen ”on esitettävä asianosaiselle tämän pyynnöstä arvio päätöksen antamisajankohdasta sekä vastattava käsittelyn etenemistä koskeviin tiedusteluihin”. Laillisuusvalvonnassa apulaisoikeuskansleri on pitänyt riittävänä toimenpiteenä, että virasto ilmoittaa kiinnittävänsä huomiota käsittelyaika-arvion antamiseen ja varmistavansa sisäisellä koulutuksella ja ohjeistuksella, että vastaisuudessa käsittelyaika-arvio annetaan jokaiselle pyydettäessä (OKV/1973/1/2017, 10.10.2018). Tutkijapalvelussa määrätään yhteyshenkilö kuitenkin vasta sitten, kun yhteyshenkilö voi ottaa hankkeen käsittelyyn. Tutkijapalvelussa päivystää lisäksi henkilö, joka vastaa tutkijoiden kysymyksiin muun muassa käsittelyajasta. Käyttölupahakemusten käsittelyyn liittyvät toistuvat ongelmat voivat vaarantaa nopeisiin ajankohtaisiin tietoaineistotarpeisiin vastaamiseen tarkoitettujen TEAS-hankkeiden sekä muiden selvitysten aikataulun ja toteutuksen. Esimerkiksi työttömyysturvan jaksoaineistoihin liittyvät tiedonsaantiongelmat uhkasivat vaarantaa huomattavalla tavalla Työttömyysturvan kehittämisen työryhmän (STM:n raportteja ja muistioita 2021:11) työtä. Vain nopea ennakoiva toiminta, jossa vaihtoehtoisia aineistoja lähdettiin selvittämään, ratkaisi tilanteen ja mahdollisuuden laadukkaaseen vaikutusarviointityöhön. Asetelma vaikuttaa osaltaan hankaloittavan pääministeri Sanna Marinin hallitusohjelman työllisyyspoliittisten tavoitteiden toteutumista samoin kuin hallitusohjelman mukaisen tiedolla johtamisen periaatteen soveltamista ja hallituksen lupauksen toteuttamista tietoon perustuvasta päätöksenteosta.

Yleisesti on tärkeää, että käyttölupahakemuksiin vastataan hallintolain 23 §:n mukaisella tavalla ilman aiheetonta viivytystä, koska aineistojen merkitys ja kysyntä yhteiskunnassa kasvavat jatkuvasti. Aineistojen hidas saatavuus on näkynyt viivästyksinä käyttölupahakemusten ja aineistojen käyttöön saamisessa. Aineistojen hidas saatavuus voi johtua resurssipulasta käyttölupahakemusten käsittelyssä tai puutteellisista hakemuksista, joita täydennetään kysymällä hakijalta. Silloin kun hakija yhdistää hankkeelle useiden viranomaisten aineistoja, saatavuutta hidastavat usean viranomaisen erilliset lupaprosessit sekä eri viranomaisten aineistojen vastaanottamiseen, yhdistämiseen ja pseudonymisointiin kuluva aika. Työvaiheet ovat kohtuullisen nopeita silloin, kun kaikki on kunnossa, mutta jos aineistossa, prosessissa tai hakemuksessa on puutteita, aikaa kuluu merkittävästi enemmän. Valmisaineisto sisältää eri tilastoaineistoista suoraan poimittuja sekä eri tavoin muodostettuja kompakteja aineistokokonaisuuksia, joita yhdistelemällä kootaan tutkijoille tutkimussuunnitelman edellyttämä tutkimusaineisto. Tietosuojan toteutumista tukee tietoturvallinen etäkäyttöjärjestelmä, jossa tutkijat voivat käsitellä tilastokeskuksen aineistoja suojatusti ja ottaa tulosteita ulos järjestelmästä sen jälkeen, kun tilastokeskus on varmistanut sen, etteivät tulosteet sisällä tilastoyksiköitä paljastavia tietoja. Etäkäyttöjärjestelmä on tilastokeskuksen ensisijainen kanava aineistojen tarjoamisessa tutkimus- ja selvityskäyttöön. Kuolemansyyaineistoja, tilastolain 19 §:ssä määriteltyjä tietoja sekä kyselyaineistoista tehtyjä pseudonymisoituja palveluaineistoja voidaan luovuttaa muullakin tietoturvallisella tavalla. TK-laissa on siten tarkoitus edelleen mahdollistaa erilaisia teknisiä vaihtoehtoisia ratkaisuja kuolemansyyaineistojen toimittamiseen. Tavanomaisesti luovutus tapahtuu suojatun sähköpostin liitteenä.

Tilastokeskuksen aineistot ovat tutkimus- ja selvityskäytössä tärkeä osa mahdollisuutta yhteiskunnallisesti relevantin tutkimuksen tuottamiseen. Tilastokeskus on kartoittanut tutkijapalvelun kehittämiseen, palveluaikataulun nopeuttamiseen ja asiakasyhteistyön parantamiseen liittyviä haasteita. Tilastokeskuksen keväällä 2019 käynnistämien kehittämistoimien tavoitteena on yksittäisin toimenpitein parantaa tutkijapalvelua, kuten kuolemansyyaineistojen ja tunnisteellisten aineistojen poimintakoodia kehittämällä, uusia valmisaineistoja kehittämällä ja tuottamalla, valmisaineistoja vuosittain päivittämällä ja valmisaineistokokonaisuuksia hallinnoimalla sekä niin sanottuja metatietoja tuottamalla ja metatietojen kuvausjärjestelmiä ylläpitämällä ja kehittämällä. Lisäksi on havaittu prosessuaalisia ongelmia, sillä palveluja ei ole tuotteistettu, eri asiakasryhmien palveluntarvetta on edelleen tarpeen tarkentaa sekä hakumenettelyä ja palveluun liittyvää ohjeistusta ja lomakkeita on tarpeen selkeyttää. Tutkijapalvelun asiakastyytyväisyyskyselyt (2019, 2020) kertoivat yleisestä tyytyväisyydestä ja henkilöstö sai kiitosta työstään, mutta kriittistä palautetta tuli erityisesti hakuprosessin kokonaispituudesta ja henkilöstövoimavarojen riittävyydestä. Asiakastyytyväisyyden kouluarvosanat olivat vuonna 2019 8,27 ja 2020 8,97. Esityksellä pyritään tukemaan tilastokeskuksen omia kehittämistoimia.

Esimerkki. Kuluttajahintaindeksin laadintaa varten on kerätty kassa-aineistoa, jonka kaltaista kulutusta kuvaavaa määrä- ja hinta-aineistoa ei ole muutoin olemassa. Kassa-aineistot on saatu tilastokeskukseen sopimuspohjaisesti eikä tilastokeskus saa luovuttaa niitä tutkimus- ja selvityskäyttöön. TEM:ssä valmisteilla olevassa (7.4.2022) Valtioneuvoston Kaupan toimialan tulevaisuusselonteossa, jota valmistellaan avoimeen kirjalliseen kuulemiseen. Selonteko on tarkoitus luovuttaa eduskunnalle kevätistuntokaudella 2022, on tarkoitus tehdä kehittämisehdotus kaupan alan virallisesta tilastointijärjestelmästä vastaamaan ajan tarpeita, myös kehittämistyöhön (järjestelmä ei nykyisin vastaa kaikilta osin nykyisiin tarpeisiin: sirpaleinen, luokitukset ajantasaistettava sekä uutena verkkokaupan tilastointimenetelmät). Ehdotuksella ei siten ole merkitystä etenkään tutkimustarkoitukseen tarvittavan kassadatan käytön näkökulmasta. Lisäksi tietojen saatavuus tilastokeskuksen ylläpitämän, vuodesta 2013 laajaan käyttöön tarkoitetun Sisu-mikrosimulointimallin kehittämiseksi on merkityksellistä. Nykyisin Sisu-mikrosimulointimallilla on 80 käyttäjää 22 eri organisaatiosta. Pelkästään Sisu-mallin, joka on henkilöverotuksen ja sosiaaliturvalainsäädännön suunnitteluun, seurantaan ja arvioimiseen tarkoitettu laskentaväline, ylläpito vie paljon voimavaroja tilastokeskuksen mikrosimulointitiimiltä, jonka suorituskykyä on kuitenkin heikentänyt se, että henkilöstön vaihtuvuus on ollut suurta jo kymmenen vuoden ajan. Sisu-mallin kehittämistyötä on tehty jo useita vuosia samojen aihealueiden parissa. Onkin tarpeen arvioida, voidaanko kehittämistyötä tehdä nykyistäkin enemmän käyttäjälähtöisesti niin, että myös Sisu-mallin käyttäjät voivat osallistua kehittämistyöhön. Tällöin kehittämistyö saattaa lisävoimavarojen avulla tehostua ja monipuolistua, sillä erityinen substanssiosaaminen on usein käyttäjillä. Tämä edellyttää, että käyttäjät pystyvät ohjelmoimaan ehdotuksensa tilastokeskuksen ylläpitämään mikrosimulointimalliin sen arkkitehtuurin mukaisesti. Muussa tapauksessa kokonaisuus ei pysy eheänä.

Yhdistäminen ulkopuolisiin aineistoihin ja rekisterinpito tiedostojen pseudonymisoinnissa

Tutkijapalvelusta tilatut tutkimusaineistot muodostetaan pääsääntöisesti tilastokeskuksen laajoista tietovarannoista, jotka ovat muodostuneet vuosien varrella tilastokeskukseen tilastointitarkoitukseen eri rekisterinpitäjien luovuttamista tai suoraan tiedonantajilta kerätyistä tiedoista.

Tutkimuksessa tarvitaan usein myös tietoja, jotka eivät sisälly tilastokeskuksen tilastointitarkoitukseen hankkimiin aineistoihin. Tällöin on mahdollista yhdistellä tutkijan itsensä keräämiä tai tutkijoiden muilta rekisterinpitäjiltä hankkimia aineistoja tilastokeskuksen aineistoihin. Tutkijan, joka on saanut käyttöluvan aineistoon rekisterinpitäjältä, on pyydettävä, että tunnisteita sisältäviä aineistoja toimitetaan suoraan tilastokeskukseen, jossa tutkijapalvelun henkilöstö muuntaa suorat tunnisteet pseudotunnuksiksi ja siirtää aineiston tutkijan käsiteltäväksi etäkäyttöjärjestelmään. Aineistoja toimittavat rekisterinpitäjät ovat pitäneet järjestelyä usein hyvänä, koska tietosuoja toteutuu paremmin kuin silloin, jos aineisto toimitetaan suoraan tutkijalle. Aineistojen toimittajien kanssa on toisinaan ollut epäselvyyksiä tilastokeskuksen tietosuojaoikeudellisesta roolista. Tilastokeskus tekee aina tutkimushankkeen kanssa tutkijapalvelusopimuksen, jossa määritellään tilastokeskuksen rooli sille tutkimustarkoitukseen toimittujen aineistojen henkilötietojen käsittelijänä tutkimushankkeen lukuun. Yhdistely ja aineistojen käsittely tilastokeskuksessa tapahtuu aina tutkimushankekohtaisesti. Kertaalleen yhdisteltyjä aineistoja ei voida käyttää uudelleen toisen tutkimushankkeen palvelemiseksi. Tietosuojalainsäädäntö edellyttää tutkimushankekohtaisesti määriteltyä käyttötarkoitusta, jotta aineisto voidaan säilyttää. Se, että kerran muodostettuja aineistoja ei voida hyödyntää muissa tutkimushankkeissa, lisää tilastokeskuksen työmäärää ja osaltaan aiheuttaa aineistotoimitusten ruuhkautumista.

Muiden aineisto-omistajien (alkuperäisten rekisterinpitäjien) aineistot toimitetaan tutkijapalvelulle joko yksittäisiin tutkimushankkeisiin tutkijan aineisto-omistajalta saaman käyttöluvan mukaisesti (ad hoc) tai etukäteen tilastokeskuksen ja aineisto-omistajan välisen erillisen aineistoluovutussopimuksen mukaisesti. Aineisto-omistajien mikroaineistot yhdistetään korvaamalla aineistoissa olevat suorat tunnukset yhtenäisillä pseudotunnuksilla, jotta käyttäjä voi yhdistää aineistot etäkäyttöjärjestelmässä tilastokeskuksen aineistoihin. Tilastolaki ei salli suoria tunnisteita sisältävien aineistojen luovuttamista tutkimustarkoituksiin (paitsi tilastolain 19 §:ssä mainitut tiedot). Tietoja voidaan luovuttaa tutkimusaineiston teknistä yhdistämistä varten toiselle tilastoviranomaiselle. Kuolemansyyasiakirjoja luovutetaan julkisuuslain 28 §:n mukaisesti.

Esimerkki. Kelan tutkimushankkeen (Sosiaali- ja terveyspalvelujen sekä sosiaalietuuksien käyttö ja kustannukset Oulussa 2013–2018) tavoitteena oli (i) selvittää rekisteriaineistolla sosiaali- ja terveydenhuollon eri sektorien järjestämien palvelujen ja sosiaaliturvaetuuksien käyttöä eri väestöryhmissä ja (ii) tuottaa tietopohjaa ja tutkimustietoa sote-uudistuksen ja sosiaaliturvauudistuksen tueksi. Erityinen mielenkiinto kohdistui eri sektorien järjestämien palvelujen ja etuuksien käytön yhdistelmiin ja rinnakkaiskäyttöön aineistossa. Aineisto muodostaa ainutlaatuisen ja tärkeän tietolähteen sosiaali- ja terveyspalveluissa, ja sen vahvuus on eri aineistolähteiden yhdistäminen. Rekisteriaineistossa olivat kaikki Oulussa vuosina 2013–2018 asuneet (vuosittain 191 000 – 202 000 henkilöä, yhteensä noin 240 000). Oulu on Suomen viidenneksi suurin kunta ja aineisto edustaa ainakin kaupunkiseutuja. Olisi käytännössä kunnianhimoista koota tällainen aineisto kaikista kunnista, mutta helpompaa se olisi koota kaikista hyvinvointialueista. Työnekonomisista syistä aineiston kerääminen ja ylläpito olisi syytä tehdä vain kerran ja keskitetysti alustalla, josta sen käyttö tutkimus- ja selvitystyössä voitaisiin laajamittaisesti mahdollistaa. Tilastokeskus olisi yksi luonteva hallinnollinen vaihtoehto tällaiseksi alustaksi.

Tutkimushankekohtaisissa yhdistelyissä käyttäjän on haettava käyttölupa muiden aineisto-omistajien tietoihin suoraan näiltä aineisto-omistajilta. Tilastokeskus pyytää kopiot muiden aineisto-omistajien luvista ennen kuin se voi yhdistää aineistot. Käyttäjästä tai käyttäjän organisaatiosta tulee aineisto-omistajan käyttäjälle poimitun tutkimusaineiston rekisterinpitäjä ja jollei aineisto-omistajaa koskeva lainsäädäntö rajoita luovuttamista, aineisto-omistaja voi toimittaa aineiston fyysisesti käyttäjälle jopa tunnuksineen. Tilastokeskuksen ja käyttäjän välisessä tutkimuspalvelusopimuksessa sovitaan rekisterinpitäjän (toimeksiantaja) ja henkilötietojen käsittelijän (tilastokeskus) välisistä oikeuksista ja velvollisuuksista tietosuoja-asetuksen 28 artiklan edellyttämällä tavalla silloin, kun tilastokeskus toimii henkilötietojen käsittelijänä tutkimusaineiston rekisterinpitäjänä olevan toimeksiantajan lukuun. Sopimuksessa tehtävän määritykseksi kirjataan, että tilastokeskus vastaa tietojen pseudonymisoinnista ja viennistä etäkäyttöjärjestelmään, jolloin aineisto-omistaja voi siirtää käyttäjän pyynnöstä aineistot suoraan tilastokeskukseen pseudonymisoitavaksi. Kun tilastokeskus on suorittanut sopimukseen kirjatun tehtävänsä, sillä ei ole oikeutta ylläpitää aineistoa, vaan aineistot tuhotaan tilastokeskuksen palvelimelta. Aineistot säilytetään etäkäyttöjärjestelmässä vain niin kauan kuin tutkimuksen tekeminen edellyttää ja/tai käyttölupa on voimassa.

Tilastokeskus on tarjonnut tietoturvallisen etäkäyttöjärjestelmän myös muiden viranomaisten valmiiksi koottujen ’geneeristen’ tutkimusaineistojen eli valmisaineistojen jakelualustaksi. Tilastokeskuksen ja aineisto-omistajan välinen sopimus koskee kunkin organisaation tehtäviä ja vastuita suhteessa aineistoon. Sopimuksen mukaan aineisto-omistaja on muodostetun valmisaineiston rekisterinpitäjä ja tilastokeskus toimii henkilötietojen käsittelijänä rekisterinpitäjän lukuun. Sopimuksessa sovitaan valmisaineiston sisällöstä, päivityksestä, säilyttämisestä, pseudonymisoinnista, kuvausten viemisestä Taika-katalogiin ja siitä, että tilastokeskus avaa tutkijoille pääsyn aineistoon aineisto-omistajan tilastokeskukselle toimittaman tutkimushankekohtaisen käyttöluvan mukaisesti. Tilastokeskus on sopinut eräiden aineisto-omistajien kanssa kevyestä käyttölupamenettelystä, jossa (i) käyttäjä hakee käyttöluvan aineisto-omistajan valmisaineistoon tilastokeskuksen käyttölupalomakkeella ja (ii) tilastokeskus lähettää tiedon hakemuksesta aineisto-omistajalle, jolla on 10 päivää aikaa reagoida hakemukseen siinä tapauksessa, ettei käyttölupaa voida myöntää.

Tilastokeskus rekisterinpitäjänä

Tilastokeskus on tietosuojalainsäädännössä tarkoitettu rekisterinpitäjä tilastointitarkoitukseen keräämistään tiedoista. Tutkija- ja aineistopalvelua varten saaduista tiedoista rekisterinpitäjyys säilyy alkuperäisellä rekisterinpitäjällä, joita voivat olla esimerkiksi muut viranomaiset tai tutkijat itse keräämistään aineistoista. Kun tutkimusaineisto on luovutettu käyttöluvansaajalle, tämä vastaa tietojen käsittelystä omassa toiminnassaan ja toimii rekisterinpitäjänä käsittelemilleen tiedoille.

Esimerkki. Tutkija- ja aineistopalvelun tietosuojaoikeudellisten roolien mukaisesti esimerkiksi Opetushallitus, jäljempänä OPH, toimisi rekisterinpitäjänä tutkija- ja aineistopalveluun toimittamistaan tiedoista, kunnes tilastokeskus henkilötietojen käsittelijänä luovuttaisi tiedot käyttöluvan saajalle OPH:n lukuun. OPH vastaisi luovutusta varten tehtävien käsittelytoimien lainmukaisuudesta (kuten tarvittavien teknisten ja organisatoristen turvatoimien riittävyydestä) aina siihen asti, kunnes tiedot katsottaisiin luovutetuiksi uudelle rekisterinpitäjälle. OPH:n rooli rekisterinpitäjänä tarkoittaisi myös sitä, että tietojen luovutus OPH:n tietovarannoista ja rekistereistä määräytyisi niitä koskevan erityis- tai yleislainsäädännön perusteella. Sillä, onko OPH ulkoistanut luovuttamiseen liittyviä käsittelytoimia (kuten tietojen säilyttäminen, muokkaus ja lopullinen luovuttaminen käyttöluvan saajalle) toiselle taholle (kuten tutkija- ja aineistopalvelulle), ei ole näiltä osin arvioinnissa merkitystä. Huomionarvoista on, että tiedonhallintalain mukaisesti tietoja voidaan luovuttaa katseluyhteyden välityksellä vain toiselle viranomaiselle. Jos tutkija- ja aineistopalvelussa olevia tietoja olisi tarkoitus luovuttaa OPH:n lukuun Fiona-etäkäyttöjärjestelmässä, aineistoon voitaisiin avata katseluyhteys vain toiselle viranomaiselle.

Tilastokeskus on lisäksi rekisterinpitäjä tunnisteille ja pseudonymisointitunnisteille, jotka se tallettaa ja säilyttää kokoamistaan, yhdistelemistään ja pseudonymisoimistaan tiedoista. Tilastokeskus on tutkija- ja aineistopalvelua varten vastaanotettujen tietojen rekisterinpitäjä, jos alkuperäisen rekisterinpitäjän kanssa on sovittu, että tiedoista muodostetaan tutkija- ja aineistopalvelussa säilytettävä valmisaineisto. Tilastokeskus on lisäksi tutkija- ja aineistopalvelua varten vastaanotettujen tietojen henkilötietojen käsittelijä, jos tiedot tulevat yksittäisen tutkimushankkeen käyttöön tutkija- ja aineistopalvelussa eikä niistä muodosteta valmisaineistoa. Rekisterinpitäjänä tilastokeskuksella on tutkija- ja aineistopalvelun toteuttamiseksi oikeus käsitellä välttämättömiä henkilötietoja ja erityisiin henkilötietoryhmiin kuuluvia tietoja sekä rikostuomioihin ja rikkomuksiin liittyviä henkilötietoja.

Pelkistetysti tilastokeskuksen tietosuojaoikeudellisten roolien kehittämiseksi on muissa kuin tilastolain perusteella tilastointitarkoituksiin kerättävissä valmisaineistoissa kaksi vaihtoehtoa: (i) tilastokeskus toimii tutkija- ja aineistopalveluun vastaanotetussa aineistossa henkilötietojen käsittelijänä rekisterinpitäjän lukuun, jolloin (a) aineistojen luovutus perustuu rekisterinpitäjän päätökseen, (b) valmisaineistot perustuvat sopimuksiin, jolloin käytännössä valmisaineistot sisältävät usein rekisterinpitäjän tietoja, ja (c) luovutus perustuu rekisterinpitäjää koskevaan lainsäädäntöön; tai (ii) valmisaineistoissa tilastokeskus on rekisterinpitäjä, joka (a) päättää käyttöoikeuksista, (b) päättää säilytyksestä, ja (c) jonka asema perustuu lakiin.

Tietosuoja-asetuksen 9 artiklassa tarkoitettujen erityisiin henkilötietoryhmiin kuuluvien tietojen luovuttaminen on tietosuoja-asetuksen mukaan mahdollista, jos ”käsittely on tarpeen yleisen edun mukaisia arkistointitarkoituksia taikka tieteellisiä ja historiallisia tutkimustarkoituksia tai tilastollisia tarkoituksia varten” (9 artiklan 2 kohdan j-alakohta). Tieto uskonnosta, ammattiliiton jäsenyydestä, sairaudesta, ammattitaudista tai työtapaturmasta aiheutuneen poissaolon kestosta voidaan kuitenkin luovuttaa. Tietoja käsiteltäessä on noudatettava asianmukaisia suojatoimia tietoturvallisessa käsittely-ympäristössä. Tiedot on pseudonymisoitava ennen niiden siirtämistä analysoitavaksi. Julkaistavat tulokset on anonymisoitava tai koostettava eli aggregoitava siten, ettei yksittäistä henkilöä voi tiedoista tunnistaa.

Tutkimusaineiston tilaaja (käyttöluvanhakija, tutkimushankkeen vastuullinen johtaja tai tutkimusorganisaatio) toimii puolestaan tutkimusaineiston rekisterinpitäjänä sen jälkeen, kun aineisto on luovutettu käyttöön etäkäyttöjärjestelmässä. Tilastokeskus toimii sopimuspohjaisesti henkilötietojen käsittelijänä rekisterinpitäjän lukuun, kun se ylläpitää tutkimusaineistoa etäkäyttöjärjestelmässä. Tilastokeskus vastaa (i) tehtävän edellyttämästä toiminnasta sekä teknisestä käyttöyhteydestä tietojen tallentamisessa, käsittelyssä ja luovutuksessa, (ii) tietojärjestelmien käytettävyydestä sekä tietojen eheydestä, muuttumattomuudesta, suojaamisesta ja säilyttämisestä, sekä (iii) rekisterinpitäjän lukuun tietojen säilyttämisestä, hävittämisestä ja arkistoinnista, joista säädetään tarkemmin tietosuoja-asetuksessa, tietosuojalaissa ja arkistolaissa (831/1994). Asiasta sovitaan rekisterinpitäjän (toimeksiannon antajan) ja tilastokeskuksen välillä toimeksiantosopimuksessa, joka sisältää myös tietosuoja-asetuksessa tarkoitetun sopimuksen rekisterinpitäjän ja henkilötietojen käsittelijän välillä (28 artiklan 3 kohta). Yhteiset palveluntuottajat, virastot ja laitokset toimivat edelleen alkuperäisten tietolähteiden rekisterinpitäjinä ja vastaavat toimitettavien tietojen sisällöstä, virheettömyydestä ja ajantasaisuudesta. Tilastokeskus ylläpitää tutkija- ja aineistopalvelussa myös muiden viranomaisten aineistoista tehtyjä valmisaineistoja, jolloin rekisterinpitäjän tehtävä säilyy alkuperäisellä rekisterinpitäjällä.

Henkilötietojen käsittelyn edellytyksistä säädetään tietosuoja-asetuksen 28 ja 29 artiklassa. Henkilötietojen käsittelijä tai sen alaisuudessa toimiva henkilö ei saa käsitellä henkilötietoja muutoin kuin rekisterinpitäjän ohjeiden mukaisesti, ellei lainsäädännössä niin vaadita (29 artikla). Asetuksen 28 artiklaa on noudatettava, kun henkilötietojen käsittelijä toimii rekisterinpitäjän lukuun. Rekisterinpitäjä saa käyttää vain sellaisia henkilötietojen käsittelijöitä, jotka toteuttavat riittävät suojatoimet asianmukaisten teknisten ja organisatoristen toimien täytäntöönpanemiseksi niin, että käsittely täyttää asetuksen vaatimukset ja sillä varmistetaan rekisteröidyn oikeuksien suojelu (28 artiklan 1 kohta). Henkilötietojen käsittelijä ei saa käyttää toisen henkilötietojen käsittelijän palveluksia ilman rekisterinpitäjän erityistä tai yleistä kirjallista ennakkolupaa (28 artiklan 2 kohta).

Henkilötietojen käsittelijän toimintaa on määritettävä sopimuksella taikka muulla EU:n tai jäsenvaltion lainsäädännön mukaisella oikeudellisella asiakirjalla, joka sitoo henkilötietojen käsittelijää suhteessa rekisterinpitäjään ja jossa vahvistetaan käsittelyn kohde ja kesto, käsittelyn luonne ja tarkoitus, henkilötietojen tyyppi ja rekisteröityjen ryhmät, rekisterinpitäjän velvollisuudet ja oikeudet. Lisäksi säädetään tarkemmin seikoista, jotka asiakirjassa on ilmaistava (28 artiklan 3 kohta).

Henkilötietojen käsittelijän on käsiteltävä henkilötietoja vain rekisterinpitäjän antamien dokumentoitujen ohjeiden mukaisesti, jollei henkilötietojen käsittelijään sovellettavassa EU:n tai jäsenvaltion lainsäädännössä toisin vaadita. Tällöin henkilötietojen käsittelijän on tiedotettava rekisterinpitäjälle tästä oikeudellisesta vaatimuksesta ennen käsittelyä, jollei tällaista tiedottamista ole lainsäädännössä kielletty yleistä etua koskevien tärkeiden syiden vuoksi. Tiedottaminen ei kuitenkaan olisi tarpeen jokaista käsittelykertaa varten erikseen, vaan riittävää olisi tiedottaa lakisääteisestä oikeudesta käsitellä henkilötietoja kerran, esimerkiksi silloin, kun käsittelijän ja rekisterinpitäjän välistä asiakirjaa laaditaan (28 artiklan 3 kohdan a alakohta).

Henkilötietojen käsittelijää koskee lakisääteinen salassapitovelvollisuus. Henkilötietojen käsittelijän on autettava rekisterinpitäjää mahdollisuuksien mukaan täyttämään rekisterinpitäjän velvollisuus vastata pyyntöihin rekisteröidyn oikeuksien käyttämisestä. Rekisterinpitäjä ja henkilötietojen käsittelijä voisivat keskinäisin järjestelyin sopia esimerkiksi siitä, että henkilötietojen käsittelijä toimittaa rekisterinpitäjälle tarvittavat tiedot rekisteröidyn oikeuksien toteuttamiseksi, tai että rekisterinpitäjä pyytää rekisteröityä kääntymään suoraan henkilötietojen käsittelijän puoleen (28 artiklan 3 kohdan b- ja e -alakohdat).

Rekisterinpitäjän ja henkilötietojen käsittelijän väliseen asiakirjaan on otettava kohta siitä, miten tietoja palvelujen tarjoamisen päätyttyä käsitellään. Vaihtoehtona ovat tietojen poistaminen tai palauttaminen rekisterinpitäjän käsittelyyn ja niiden olemassa olevien jäljennösten poistaminen, jollei lainsäädännössä vaadita säilyttämään henkilötiedot. Tietojen säilyttämisestä ja säilytysajoista palvelujen tarjoamisen päätyttyä on kansallisia säännöksiä muun muassa julkisuuslaissa. Lisäksi arkistolaissa säädetään asiakirjojen arkistoinnista. Lainsäädäntö kieltää henkilötietojen käsittelijää sopimuksen päättymisen jälkeen käyttämästä tietoja omiin tarkoituksiinsa. Niitä olisi kuitenkin säilytettävä muun muassa valvontatarkoituksia varten (28 artiklan 3 kohdan g-alakohta).

Tilastokeskuksen lakisääteisistä tehtävistä (esimerkiksi sen myöntämistä käyttöluvista tilastointitarkoitukseen keräämiinsä tietoihin) seuraa esimerkiksi rekisterinpitäjän tai henkilötiedon käsittelijän tietosuojaoikeudellinen asema. Tilastokeskus on rekisterinpitäjä tilastointitarkoitukseen keräämiinsä tietoihin sekä henkilötiedon käsittelijä tutkija- ja aineistopalveluun vastaanottamiinsa tietoihin, jolloin tilastokeskus toimii sopimuspohjaisesti muiden rekisterinpitäjien lukuun henkilötietojen käsittelijänä ja käyttölupaprosessi säilyy muilla rekisterinpitäjillä. Henkilötietojen käsittely perustuu lähtökohtaisesti rekisterinpitäjän lakisääteiseen velvollisuuteen (tietosuoja-asetuksen 6 artiklan 1 kohdan c-alakohta). Rekisterinpitäjän ja henkilötietojen käsittelijän velvollisuuksista säädetään myös tietosuoja-asetuksen IV luvussa. Tietoja kerätään muiden viranomaisten suunnittelu-, ohjaus- ja tilastokäyttöön, lähinnä johtamista tukemaan. Käyttötarkoitus muistuttaa tietosuojalain 6 §:n 1 momentin 7 kohdassa tarkoitettua tilastokäyttöä.

Käsittelyperuste johdetaan tietosuoja-asetuksen 6 artiklasta ja erityisistä henkilötietoryhmistä, kuten terveystiedoista ja geneettisistä tiedoista, lisäksi 9 artiklasta. Kun käyttölupaviranomainen ja muut tietoja luovuttavat rekisterinpitäjät käsittelevät henkilötietoja, niillä on oikeus käsitellä tietoja tietosuoja-asetuksen 6 artiklan 1 kohdan e-alakohdan perusteella, jonka mukaan henkilötietojen käsittely on lainmukaista, jos se on tarpeen yleistä etua koskevan tehtävän suorittamiseksi tai rekisterinpitäjälle kuuluvan julkisen vallan käyttämiseksi. Tämä ei kuitenkaan tarkoita sitä, ettei tietoja voida näissä tarkoituksissa käsitellä tietyissä tilanteissa muullakin perusteella, joka seuraa suoraan tietosuoja-asetuksesta. Siltä osin kuin henkilötietojen käsittelyperuste ei seuraa tietosuoja-asetuksen 6 artiklasta, laissa esitettyjen käyttötarkoitusten tarkemmat 6 ja 9 artiklan mukaiset perusteet esitetään kunkin käyttötarkoituksen kannalta tarkemmin asiayhteydessään.

Tilastokeskus vastaa rekisterinpitäjänä tietosuoja-asetuksessa säädettyjen rekisteröidyn oikeuksien toteutumisesta. Rekisteröidyllä ei ole tietosuoja-asetuksen 21 artiklassa tarkoitettua oikeutta vastustaa henkilötietojensa käsittelyä, sillä vastustamisoikeus ei koske lakisääteisen velvollisuuden noudattamiseksi tapahtuvaa henkilötietojen käsittelyä. Vastustamisoikeuden puuttuminen ei kysymyksessä olevassa käyttötarkoituksessa vaaranna rekisteröidyn oikeuksia. Tiedon perusteella ei esimerkiksi tehdä rekisteröityä koskevia päätöksiä. Tieto on myös luonteeltaan välillistä, jolloin henkilöiden tunnistetiedot, kuten nimet tai henkilötunnukset, eivät käy ilmi, vaan henkilö voi olla tunnistettavissa vain välillisesti. Siltä osin kuin tilastokeskus toimii henkilötietojen käsittelijänä, tietosuoja-asetuksen mukaisten velvollisuuksien toteutumisesta rekisteröidyn oikeuksissa vastaavat henkilötietojen käsittelystä huolehtivat rekisterinpitäjät, joita ovat esimerkiksi tilastolain 15 §:ssä tarkoitetut valtion viranomaiset. Henkilötietojen käsittelyn vastustaminen ei ole käytännössä noussut tilastokeskuksen toiminnassa merkittävään asemaan, vaan tällaiset rekisteröityjen pyynnöt ovat olleet hyvin harvinaisia.

Rekisterinpitäjän velvollisuutena on tietoturvallinen tietojen käsittely ja varmistuminen tarkoituksenmukaisin keinoin siitä, että sen palvelun tuottamiseen käytettävä tietojärjestelmä on suunniteltu, valmistettu ja toimii tietoturvallisuutta ja tietosuojaa koskevien lakien ja niiden nojalla annettujen säännösten sekä yhteentoimivuutta koskevien kansallisten määritysten mukaisesti. Tietojen siirto tietojärjestelmistä ei olennaisesti lisää tilastokeskuksen hallinnollista taakkaa, vaan on osa sen normaalia toimintaa. Tiedonhallintalaki edellyttää virastojen tietojärjestelmien yhteentoimivuutta, mikä Suomessa on toteutettu niin sanottua viranomaisasioinnin yhden luukun periaatetta edistävällä tietoteknisellä rajapintayhteistyöllä. Toistaiseksi tämä periaate ei toteudu tilastoaineistoja koskevissa etäkäyttöjärjestelmissä (esimerkiksi Findatan Kapseli ja tilastokeskuksen Fiona). Automatisoitu sähköinen rajapinta on tietotekninen ratkaisu, jolla helpotetaan viranomaisasiointia ja jonka mukaan viranomaisille tulee ilmoittaa sama tieto vain kerran, minkä jälkeen tieto siirtyy tietoteknisten rajapintojen avulla niille viranomaisille, joilla on tiedonsaantioikeus. Tietoturvallisuudella tarkoitetaan tiedon luottamuksellisuuden, eheyden ja käytettävyyden suojaamista, mikä tarkoittaa sekä hallinnollisia että teknisiä toimia, joilla varmistetaan, että (i) käsiteltävät tiedot ovat vain niiden käyttöön oikeutettujen saatavilla, (ii) tietoja eivät voi muuttaa muut kuin siihen oikeutetut, sekä (iii) tiedot ja tietojärjestelmät ovat niiden käyttöön oikeutettujen hyödynnettävissä. Tietoturvallisuuden määritelmä ehdotetaan, kuten myös turvallisuusluokituksen taso, laaja-alaisuutensa ja horisontaalisen luonteensa vuoksi jätettäväksi perustelujen tasolle. Tietoturvallisella käyttöympäristöllä tarkoitetaan esimerkiksi toisiolain 3 §:n 11 kohdassa ”teknistä, organisatorista ja fyysistä tietojen käsittelyn toimintaympäristöä jossa tietoturvallisuus on varmistettu asianmukaisin hallinnollisin ja teknisin toimin.”

Esityksellä pyritään selkeyttämään tilastokeskuksen ja eräiden muiden viranomaisten roolia tilastokeskuksen yhdistäessä ja pseudonymisoidessa aineistoja tutkimus- ja selvityskäyttöä varten. Nykyisin etäkäyttöjärjestelmään siirrettävien aineistojen rekisterinpitäjinä ovat (ennen tutkimuksen aloittamista) ja niiden käytöstä tutkimuksessa päättävät (i) tilastokeskus (tilastointitarkoitukseen tilastolain perusteella kerätyt aineistot), (ii) muut rekisterinpitäjät (esimerkiksi TEM, THL ja Tulli) niistä tiedoista, jotka ne ovat siirtäneet valmisaineistoina tilastokeskukseen erillissopimuksella, sekä (iii) tutkijat ja tutkimusryhmät esimerkiksi muilta viranomaisilta käyttöluvalla saaduille aineistoille, verkkokyselyissä keräämistään aineistoista ja käsitellessään pseudonymisoitua tutkimusaineistoa etäkäyttöjärjestelmässä.

Tietojen säilytysajat

Tilastointitarkoitukseen kerättyjen tietojen säilytysaikaa koskee tilastolain 10 a §, jonka mukaan tilastoja laativa viranomainen saa säilyttää keräämänsä tiedot niin kauan kuin se on tilastolain tarkoituksen toteuttamisen kannalta välttämätöntä, jollei tietojen säilyttämisestä säädetä toisin kyseistä viranomaista koskevassa muussa laissa. Tilastolain tarkoitus on myös edistää tilastointitarkoitukseen kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä, mikä myös on otettava huomioon tietojen säilytysajasta päätettäessä. Säännöksen perustelujen mukaan tietojen säilyttämisen välttämättömyyden arvioinnissa tulee soveltaa tietosuoja-asetuksen säännöksiä ilman erityistä viittausta tietosuoja-asetukseen eli ottaa erityisesti huomioon tietojen minimointiperiaate (5 artiklan 1 kohdan c-alakohta). Tämän jälkeen tiedot on hävitettävä yhden vuoden kuluessa, jollei Kansallisarkisto arkistolain nojalla määrää tietoja säilytettäviksi pysyvästi. Tilastolain 10 a § vahvistaa sen, että tilastointitarkoitukseen kerättävien tietojen käsittelyyn sovelletaan tietosuoja-asetusta, tietosuojalakia sekä julkisuuslakia, jollei tilastolaissa tai muussa laissa toisin säädetä (tilastolain 1 §:n 2 momentti).

Kansallisarkisto on tehnyt arkistolain mukaisesti tilastokeskuksen tietoaineistoista useita seulonta- eli säilytysaikapäätöksiä. Kansallisarkiston käytäntö ulottuu analogisista aineistoista tilastotuotannon digitaalisiin aineistoihin, kuten videoihin ja puheäänitteisiin. Esityksen kannalta keskeinen on Kansallisarkiston vuonna 2018 tekemä päätös tarkimman tason digitaalisten tilastoaineistojen pysyvästä säilyttämisestä vuodesta 1995 eteenpäin. Arkistolain mukaisesti tilastokeskus on itse määritellyt määräajan säilytettävien tietoaineistojen säilytysajat. Tilastotuotannon digitaalisten tietoaineistojen määräaikaisesta säilyttämisestä tehtiin päätös keväällä 2021.

Tilastotuotannon digitaalisten tietoaineistojen määräaikaisia säilytysaikoja määritettäessä on otettu huomioon tietoaineiston alkuperäisen käyttötarkoituksen mukainen tarpeellisuus tilastokeskuksen toiminnassa. Tiedot on kerätty tilastokeskukseen tilastointitarkoitukseen: (i) Analyysivaiheen tietoaineistot muodostuvat tilastojen lopullisista yksikkötason aineistoista sekä aggregoiduista makrotietoaineistoista. Yksikkötason tiedot säilytetään Kansallisarkiston tekemän päätöksen mukaan pysyvästi tietovarannoissa alkuperäisessä käyttötarkoituksessaan. Lisäksi yksikkötason lopulliset tietoaineistot arkistoidaan aineistojen hyvin pitkäaikaisen säilymisen varmistamiseksi; (ii) Epäsuoran tiedonkeruun (hallinnolliset rekisteriaineistot) massamuotoisia tietoaineistoja, jotka tulevat aineistojen vastaanottoprosessin kautta, säilytetään keruuvaiheen viimeisissä tietovarannoissa raaka-aineiston varastossa vuoden ajan tiedonkeruurekisteriin merkitystä aineiston saapumispäivämäärästä. Lisäksi on katsottu, että aineisto voidaan pyytää toimittajalta uudelleen samanlaisena tai lähes samanlaisena; (iii) Suunnitteluvaiheessa syntyvät tietoaineistot säilytetään kahden vuoden ajan (AMS2019) aineiston viitevuoden viimeisestä päivästä. Jos aineistoja on viivästyksen takia tai muista syistä tarve säilyttää kauemmin, ennen säilytysajan päättymistä tehdään uusi päätös. Jos syntyneet aineistot ovat valideja alkavan tilastotuotannon kannalta, ne tulee siirtää osaksi tilastotuotannon kyseisen vaiheen tietoaineistoa ja poistaa kehitys- tai testiympäristöstä. Vuosi-, neljännesvuosi- ja kuukausitilastojen käsittelyvaiheen tietoaineistojen säilytysaika on kolme vuotta tuoreimman viitevuoden päättymisestä. Harvemmin, määrävuosina tehtävien tilastojen säilytysaika määräytyy vastaavalla tavalla.

Tilastokeskuksessa yksittäisille tutkimushankkeille muodostetuilta tutkimusaineistoilta puuttuu Kansallisarkiston arvonmääritys eli säilytysaikapäätös. Koska tutkimusaineistot on usein muodostettu yhdistelemällä tilastoaineistoja, tutkimusaineistojen säilyttämiselle sen jälkeen, kun tutkimus on suoritettu loppuun, ei ole ollut säilytysperustetta, koska alkuperäiset tiedot säilytetään tilastoaineistoissa ja tutkimusaineistoa on siten mahdollista muodostaa uudelleen. Yhdistettäessä tutkimusaineistoon ulkopuolisen toimijan tietoja tilastokeskus toimii aineiston rekisterinpitäjän lukuun ja voi säilyttää aineiston vain niin kauan kuin rekisterinpitäjän ja henkilötietojen käsittelijän (tilastokeskuksen) välisessä sopimuksessa sovitut toimenpiteet edellyttävät.

Tutkijapalvelun valmisaineistot muodostavat oman erillisen tietokokonaisuutensa, jolle valmistellaan esitystä Kansallisarkistolle seulontapäätöksen tekemiseksi. Valmisaineistot perustuvat pitkälti tilastoaineistoihin, mutta ne sisältävät joskus myös tietoja suoraan raaka-aineiston varastosta tai tuotantoprosessivaiheesta. Joidenkin valmisaineistojen aikasarjat on harmonisoitu tai muulla tavalla jalostettu, jolloin niiden säilyttämiselle on peruste. Toinen perustelu säilyttämiselle on se, että monet tutkimushankkeet käyttävät valmisaineistoja tutkimuksissaan ja viittaavat niihin aineistolähteinä.

Erityisiin henkilötietoryhmiin kuuluvien tietojen säilyttämisen tarve tulee arvioida säännöllisesti, joskaan kyseisiä tietoja koskevasta poistoajasta ei jäljempänä jakson 12 säätämisjärjestysperusteluissa selostettavista syistä ehdoteta säädettäväksi täsmällisesti. Muutoin tietojen säilytysaikoihin sovelletaan, mitä tietosuoja-asetuksessa, tietosuojalaissa ja tiedonhallintalaissa säädetään. Tietosuoja-asetuksen 5 artiklan 1 kohdan e-alakohdan mukaan henkilötiedot ”on säilytettävä muodossa, josta rekisteröity on tunnistettavissa ainoastaan niin kauan kuin on tarpeen tietojenkäsittelyn tarkoitusten toteuttamista varten; henkilötietoja voidaan säilyttää pidempiä aikoja, jos henkilötietoja käsitellään ainoastaan yleisen edun mukaisia arkistointitarkoituksia taikka tieteellisiä tai historiallisia tutkimustarkoituksia tai tilastollisia tarkoituksia varten 89 artiklan 1 kohdan mukaisesti edellyttäen, että tässä asetuksessa vaaditut asianmukaiset tekniset ja organisatoriset toimenpiteet on pantu täytäntöön rekisteröidyn oikeuksien ja vapauksien turvaamiseksi (”säilytyksen rajoittaminen”)”. Tietoja säilytetään, jos tietosuoja-asetuksen 5 artiklan 1 kohdan e-alakohdan edellytykset täyttyvät, toistaiseksi, koska käyttötarkoitukseen liittyy tarve aikasarjoihin ja vastaavaan pitkäaikaiseen seurantaan. Siirtäminen arkistoon tapahtuu arkistolain perusteella.

Esimerkki. Valtiokonttori toimii valtionhallinnon analysointi- ja raportointipalvelujen tietojen rekisterinpitäjänä. Analysointi- ja raportointipalveluissa käsiteltävistä tiedoista rajataan ulkopuolelle, jäljempänä mainittua poikkeusta lukuun ottamatta, tietosuoja-asetuksen 9 artiklan tarkoittamat erityisiin henkilötietoryhmiin kuuluvat tiedot. Henkilötietojen, joista muun ohella ilmenee poliittisia mielipiteitä, uskonnollinen tai filosofinen vakaumus tai ammattiliiton jäsenyys, sekä biometristen tietojen henkilön yksiselitteistä tunnistamista varten tai terveyttä koskevien tietojen käsittely, on tietosuoja-asetuksen 9 artiklan 1 kohdan mukaisesti pääsääntöisesti kielletty. Kun luovutetaan tietoja rekistereistä analysointi- ja raportointipalveluun, hakuehdot laaditaan siten, ettei mainittuja tietoja pääsääntöisesti siirry alkuperäisistä rekistereistä analysointi- ja raportointipalveluissa käsiteltäviin tietoihin.

Analysointi- ja raportointipalvelujen lähdejärjestelmät sisältävät erityisiin henkilötietoryhmiin kuuluvia tietoja sekä tietosuojalain voimaan tullessa kumotun henkilötietolain (523/1999) mukaisia arkaluonteisia tietoja. Näitä ovat ammattiliiton jäsenmaksutieto, tieto ulosottovelallisuuden perusteesta, turvakiellon piirissä olevien henkilöiden osoitetiedot tai tunnisteelliset henkilötiedot sekä sairauspoissaolotieto. Kyseisiä tietoja luovutetaan, myös tietoja sairaudesta, ammattitaudista tai työtapaturmasta aiheutuneen sairauspoissaolon kestosta, joka on tärkeä indikaattoritieto hyödynnettäväksi toiminnan kehittämisessä, ohjaamisessa ja johtamisessa. Ilmaisua ”erityisiin henkilötietoryhmiin kuuluvat tiedot” käytetään momentissa viitatussa tietosuoja-asetuksessa (HE 20/2020 vp, s. 27-28).

Tilastokeskuksessa tiedot pseudonymisoidaan, jolloin niistä ei suoraan esimerkiksi näe, mihin ammattiliittoon kukin kuuluu, vaan tutkimusta varten on toteutettava erillisiä kyselyjä. Tärkeää on myös, että (i) tietoja käsiteltäessä noudatetaan asianmukaisia suojatoimia tietoturvallisessa käsittely-ympäristössä, (ii) tiedot on pseudonymisoitava ennen niiden siirtämistä analysoitavaksi, sekä (iii) julkaistavat tulokset on anonymisoitava tai aggregoitava siten, ettei yksittäistä henkilöä voi tiedoista tunnistaa. Toistaiseksi pseudonymisoitua aineistoa ei ole kyselytutkimuksista muodostettuja palveluaineistoja lukuun ottamatta luovutettu etäkäyttöjärjestelmän ulkopuolella. EU:n datahallintosäädös tulee edellyttämään tietoturvallista käsittely-ympäristöä, mihin on tarpeen varautua.

Aggregoitu eli koostettu tilastoaineisto tarkoittaa tilastomuotoista, luotettavasti anonymisoitua ja summattua tietoa. Asianmukaisilla suojatoimilla tarkoitetaan sellaisia teknisiä ja organisatorisia toimenpiteitä, joilla varmistetaan henkilötietojen käsittelyn lainmukaisuus, kun otetaan huomioon käsittelyn luonne, laajuus, asiayhteys, tarkoitus ja rekisteröityjen oikeuksiin kohdistuvat riskit. Pseudonymisointi tarkoittaa henkilötietojen käsittelemistä siten, ettei henkilötietoja voida enää yhdistää tiettyyn henkilöön ilman lisätietoja ja että tällaiset lisätiedot säilytetään huolellisesti erillään henkilötiedoista. Julkaistavat tulokset anonymisoidaan eli henkilötietoja sisältävä tietoaineisto käsitellään siten, ettei yksittäistä henkilöä voi siitä enää tunnistaa ja henkilötietojen tunnistaminen estyy peruuttamattomasti eikä ulkopuolinen taho voi myöskään hallussaan olevilla tiedoilla muuttaa tietoja takaisin tunnistettaviksi. Tiedot voidaan myös summata laajempien havaintoyksikköjen tasolle eli aggregoida tai muuttaa tilastoksi, jossa tilastoeettistä rajaa (kolmen tai vähemmän kuin kolmen tilastoyksikön summatuloksia) pienempien joukkojen tietoja ei julkaista. Nämä suojatoimet varmistavat, että julkaistavat tiedot ovat sellaisessa muodossa, ettei niistä pysty tunnistamaan yksittäistä henkilöä eikä salassa pidettäviä tietoja käy ilmi.

Tilastokeskuksen salassapitovelvollisuus

EU:n tilastoasetuksen toinen keskeinen tilastoperiaate, puolueettomuuden ohella, on tilastosalaisuus, mikä tarkoittaa sitä, että ”suoraan tilastollisiin tarkoituksiin tai välillisesti hallinnollisista tai muista lähteistä saatuja yksittäisiin tilastoyksiköihin liittyviä salassapidettäviä tietoja suojataan, ja mikä edellyttää, että estetään saatujen tietojen käyttö muihin kuin tilastollisiin tarkoituksiin ja tietojen laiton paljastaminen” (2 artiklan 1 kohdan e-alakohta). Tilastosalaisuus ei siis tarkoita sitä, että laadittu tilasto olisi salainen, vaan sitä, että tilastointitarkoituksessa kerätyt tiedot ovat salassa pidettäviä. Henkilötiedot ovat jo muusta syystä salassa pidettäviä. Tilastosalaisuudella ei siten ole merkitystä esimerkiksi tietojen luovuttamisen ajankohdan kannalta edellyttäen, että tilastolain 13 §:n säännöstä salassa pidettävien tietojen luovuttamisesta noudatetaan.

Tilastosalaisuuden määritelmää täsmentävät eräät muut määritelmät:

- Tilastoyksiköllä tarkoitetaan tarkastelun perusyksikköä eli luonnollista henkilöä, kotitaloutta, talouden toimijaa ja muita yrityksiä, johon tiedot viittaavat (3 artiklan 6 kohta).

- Salassa pidettävillä tiedoilla tarkoitetaan tietoja, joiden avulla on mahdollista suoraan tai välillisesti tunnistaa tilastoyksiköt ja siten paljastaa yksikkötietoja. Määritettäessä, onko tilastoyksikkö tunnistettavissa, on otettava huomioon kaikki kyseeseen tulevat keinot, joita kolmannen osapuolen voidaan kohtuudella odottaa käyttävän tilastoyksikön tunnistamiseksi (3 artiklan 7 kohta).

- Suoralla tunnistamisella tarkoitetaan tilastoyksikön tunnistamista sen nimen tai osoitteen tai julkisesti saatavilla olevan tunnistusnumeron perusteella (3 artiklan 9 kohta).

- Välillisellä tunnistamisella tarkoitetaan tilastoyksikön tunnistamista millä tahansa muulla keinolla kuin suoralla tunnistamisella (3 artiklan 10 kohta).

Salassapitovelvollisuus kohdistuu siten tunnistettavissa oleviin yksikkökohtaisiin tietoihin, mikä on tietosuojan näkökulmasta olennaista. Aggregaattitiedot eivät ole salassa pidettäviä.

Tilastoperiaatteita on täsmennetty EU:n tilastoasetuksen 11 artiklan mukaisissa käytännesäännöissä, joiden toteuttamista seurataan (i) asetuksen 11 artiklassa kuvatulla tavalla, jota Euroopan tilastohallinnoinnin riippumaton neuvoa-antava ESGAB-lautakunta (European Statistical Governance Advisory Board) seuraa ja huomauttaa tarvittaessa julkisesti, (ii) osana Euroopan tilintarkastustuomioistuimen, jäljempänä ETT (EU Court of Auditors, ECA), tarkastuksia ja (iii) riippumattomalla vertaisarviointimenettelyllä (Peer Review). Tilastotoiminnan puolueettomuuden, riippumattomuuden ja tilastosalaisuuden kansainvälistä valvontaa on tehostettu etenkin sen jälkeen, kun kansainvälisen finanssikriisin yhteydessä puhjenneen eurooppalaisen valtionvelkakriisin syitä selvitettäessä kävi ilmi, että erään jäsenvaltion viranomaiset olivat vääristelleet tilastoaineistoja ja asettaneet maan tilastoviraston pääjohtajan aseman ja riippumattomuuden kysymyksenalaiseksi. Tuolloisten tapahtumien voidaan katsoa olevan esimerkki siitä, miten erilaisin keinoin voidaan murentaa suoraan tai välillisesti tilastoviranomaisten riippumattomuutta ja miten päättäjät voivat ajatella, että tilastojen laadinnassa pitää huolehtia kansallisesta edusta. Samantapaista mutta alueellista tilastoaineiston vääristelyä ilmeni kahdessa muussa jäsenvaltiossa. Tilastojen käyttäjistä koostuva, vuonna 2008 perustettu ESAC-tilastokomitea (European Statistical Advisory Committee) vaalii osaltaan tilastoviranomaisten riippumattomuuden kulttuuria. Eurooppalaisen tilastojärjestelmän puitteissa tapahtuvan yhteistyön ja yhteensovittamisen merkitystä korostaa se, että luotettavilla tilastoaineistoilla (esimerkiksi bruttokansantuotteesta) on keskeinen merkitys talouspolitiikan koordinaatiossa ja erilaisten EU-tukirahojen kohdentumisessa. Lisäksi tilastoaineistoilla on laajemminkin merkitystä muun muassa rahoitusmarkkinoiden toiminnassa. Toisaalta, vaikka tilastoaineistot ovat luonteeltaan hyvin sensitiivisiä, ne ovat siitä huolimatta keskeinen osa EU:n arkipäivän toimintaa.

Etäisyys tilastoviranomaisten ja eduskunnan välillä turvaa tilastoviranomaisten riippumattomuutta. Toisaalta eduskunnan tiedonsaantioikeus on turvattava etenkin, kun eduskunnan perustuslakivaliokunta on kiinnittänyt siihen painokkaasti huomiota myös talousarvioehdotuksen mitoituksen perusteiden ja niiden perustelujen näkökulmasta (PeVL 30/2020 vp). Tilastoviranomaisten riippumattomuuden turvaamiseksi valtioneuvoston ja sen ministeriöiden käyttölupahakemusten ehdotettu etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden on siten rajattava kiireelliseksi ilmoitettuihin (esimerkiksi TEAS-hanketta koskeviin) käyttölupahakemuksiin. Tilastoviranomaisten vastuunalaisuuden varmistamiseksi on myös tarpeen vahvistaa eduskunnan edellytyksiä välillisesti seurata komission harjoittamaa EU:n tilastoasetusta täydentävien käytännesääntöjen noudattamisen ja täytäntöönpanon valvontaa.

ETT:n tarkastuksen kohteena vuonna 2012 oli käytännesääntöjen noudattamisen valvonta ja seuraava tarkastus koskee EU:n tilastoviranomaisen (Eurostat) suhdetta jäsenvaltioiden kansallisiin tilastoviranomaisiin. Vertaisarviointikierroksia tehdään noin viiden vuoden välein ja kolmas kierros toteutetaan vuosina 2021-2022. Tarkastuskäynti Suomeen oli 8.-12.11.2021 ja sen johdosta annettiin 14 tilastojärjestelmän kehittämistä koskevaa suositusta, joiden mukaisten kehittämistoimien etenemistä komissio (Eurostat) tulee vuosittain valvomaan. Suomi ei saanut yhtään huomautusta käytännesääntöjen vastaisesta toiminnasta. Tarkastuskäyntiin liittyen tilastokeskuksessa on valmisteltu itsearviointi siitä, kuinka hyvin käytännesääntöjä noudatetaan. Tilastolain esitöiden mukaisesti on tulkittu, että käytännesääntöjen sisältö katetaan ja varmistetaan Suomessa tilastolain, jonka 2 §:ssä on säädetty käytännesääntöjen periaatetta 1 vastaavalla tavalla ammatillisesta riippumattomuudesta, ohella myös muussa lainsäädännössä, kuten TK-laki, julkisuuslaki, rikoslaki (39/1889) ja valtion virkamieslaki (750/1994). EU:n tilastoasetus edellyttää ammatillista riippumattomuutta, ”millä tarkoitetaan sitä, että tilastoja on kehitettävä, tuotettava ja jaettava riippumattomasti, erityisesti siltä osin kuin on kyse käytettävien tekniikoiden, määritelmien, menetelmien ja lähteiden valinnasta ja kaikenmuotoisen jakelun ajoituksesta ja sisällöstä, sekä sitä, että kyseisten tehtävien suorittaminen on vapaata kaikesta poliittisten ryhmien tai eturyhmien taikka unionin tai kansallisten viranomaisten painostuksesta” (2 artiklan 1 kohdan a-alakohta). Esitykseen sisältyvissä ehdotuksissa ei loukata tilastokeskuksen ammatillista riippumattomuutta. Ammatillisen riippumattomuuden ei myöskään ole EU:n tilastosääntelyä koskevassa akateemisessa kirjallisuudessa ymmärretty rajoittavan jäsenvaltion kansallisen tilastoviranomaisen edellytyksiä ottaa huomioon julkisen vallan tarpeita. Ammatillinen itsenäisyys koskee tilastojen laatimista, kehittämistä ja jakelua eikä sovellu esityksessä säädettäväksi ehdotettuun tilastokeskuksen tutkija- ja aineistopalveluun vastaanotettujen tietojen jakamiseen.

Suomessa on allekirjoitettu tilastokeskuksen, muiden tilastoviranomaisten (Luonnonvarakeskus, jäljempänä Luke, THL ja Tulli) sekä Euroopan tilastojärjestelmään (European Statistical System, jäljempänä ESS) kuuluvien ESS-viranomaisten (Maahanmuuttovirasto, jäljempänä Migri, ja Suomen ympäristökeskus, jäljempänä Syke) sekä julkisoikeudellisen yhteisön (Työterveyslaitos) pääjohtajien käytännesääntöjen periaatteen 4 noudattamista tukeva laatulupaus. Laatulupauksessa on kysymys lupauksesta laatuun sitoutumisesta. EU:n tilastoasetuksen mukaisen sitoumuksen tavoitteena on varmistaa luottamus Euroopan tilastoihin ja samalla edistää käytännesääntöihin sisältyvien tilastoperiaatteiden täytäntöönpanoa. EU:n tilastoasetuksen (4 artikla) ESS muodostaa kumppanuuden, johon osallistuvat EU:n tilastoviranomainen, joka on komissio (Eurostat), sekä kansalliset tilastolaitokset ja muut kansalliset viranomaiset, jotka vastaavat kussakin jäsenvaltiossa Euroopan tilastojen kehittämisestä, tuottamisesta ja jakelusta. Laatuperiaatteita ovat relevanssi, tarkkuus, oikea-aikaisuus ja täsmällisyys, saatavuus ja selkeys sekä vertailukelpoisuus ja johdonmukaisuus. Tilastokeskus on toisaalta arvioinut komission saattavan tulevaisuudessa jatkaa sen edellyttämistä, että sitoumus käytännesääntöjen noudattamisesta on annettava poliittisella tasolla tai kytkentä käytännesääntöihin on vietävä selkeämmin kansalliseen lainsäädäntöön.

Valtioneuvoston etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden

Tietoon perustuva yhteiskunnallinen päätöksenteko edellyttää nopeaan reagointiin kykenevää tutkimus- ja selvitystoimintaa ja nopeasti viranomaisten saatavilla olevia tutkimusaineistoja. Yhteiskunnallista päätöksentekoa tukeva tutkimus hyödyntää yhä enemmän julkishallinnon, myös tilastotoimen, toiminnassa syntyviä aineistoja. Tilastolain 13 §:n mukaan tilastokeskus voi luovuttaa tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten sille tilastointitarkoitukseen kerättyjä salassa pidettäviä tietoja. Näitä tietoja ei saa luovuttaa käytettäväksi tutkinnassa, valvonnassa, oikeudenkäynnissä, hallinnollisessa päätöksenteossa eikä muussa vastaavassa henkilöä, yritystä, yhteisöä tai säätiötä koskevan asian käsittelyssä. Tilastokeskus päättää tietojen luovuttamisesta ja käyttöoikeuden antamisesta, jolloin se arvioi sille toimitetun käyttölupahakemuksen perusteella, onko hakemuksessa kuvattu käyttötarkoitus hyväksyttävissä. Tilastokeskuksessa kaikki yksikkötasoisiin aineistoluovutuksiin liittyvät käyttölupahakemukset ja aineistoluovutukset käsitellään tutkijapalvelussa. Tutkimusaineistojen kysyntä ja käyttölupahakemusten määrä on kasvanut ja esimerkiksi tutkijapalvelun etäkäyttöjärjestelmän käyttäjämäärä on neljän viime vuoden aikana kaksinkertaistunut. Tutkijapalvelun henkilöresursseja ei kuitenkaan ole samassa suhteessa lisätty, mikä johti vuosina 2019-2020 pidentyneisiin aineistojen toimitusaikoihin ja yhteiskuntapoliittisesti tärkeiden tutkimusten viivästymiseen. Lisäämällä tutkijapalvelun henkilöresursseja ja tarjoamalla yhä enemmän valmisaineistoja tutkijoiden käyttöön samalla, kun tutkimushankkeet keskittivät tilauksia yhä isompiin hankekokonaisuuksiin, jonotilanne on parantunut vuonna 2021. Käyttölupahakemusten jono on yhä 2-3 kuukautta ja aineistotoimitukset voivat kestää useita kuukausia riippuen tilauksen laadusta ja toimeksiannon laajuudesta.

Tiedonhallintalaki, tietosuoja-asetus ja EU:n tilastoasetus eivät estä valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien (esimerkiksi TEAS-hanketta koskevien) käyttölupahakemusten asettamista etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden. Ehdotus mainitusta etusijasta merkitsee muutosta nykytilaan, joten tilastokeskus ei enää voi vedota keskeneräiseen tilastotuotantoon myöskään sellaisissa tapauksissa, joissa alkuperäinen aineisto-omistaja on jo tuottanut julkisesti saatavilla olevia tilastoaineistoja. Esimerkiksi ETK ja TEM ovat julkaisseet omista alkuperäisistä data-aineistoistaan tilastoja, joiden tietoja tilastokeskuksessa on muokattu ennen niiden käyttämistä tilastoissa. Samaten operatiivista tuotantoa toteuttavista viranomaisista Verohallinto tuottaa veronsaajien tiedot ja verotilaston sekä Kela toimeentulotuen Kelastossa. Julkaisut tietokantataulukoissa ovat usein hyvinkin reaaliaikaisia, kuukauden tai parin viiveellä. Tilastokeskus tarjoaa veloituksettomassa StatFin-tilastotietokannassa alustan TEM:n työnvälitystilastojen tietojen julkaisuun, jossa on jo vuoden 2021 tietoja (https://pxnet2.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__tym__tyonv__k1/statfin_tyonv_pxt_12uc.px/). Tilastokeskuksen suhtautuminen tutkimus- ja selvityskäyttöön annettavaan tilastoaineistoon on siten erityisesti ajantasaisen tiedon luovutuksessa ankarampaa kuin useiden muiden viranomaisten, koska tilastolainsäädännössä tietojen luovuttamisesta säädetään monilta osin muuta lainsäädäntöä tiukemmin. Esityksellä mahdollistetaan yksikkötason tutkimusaineistojen nykyistä selvästi ajantasaisempi luovuttaminen tutkimus- ja selvityskäyttöön. Tieto luovutetaan tutkijakäyttöön jo ennen tilastokeskuksen omien tilastojen julkistamista, esimerkiksi heti sen jälkeen, kun aineisto-omistaja on julkaissut tietoja aineistosta.

Esimerkki. ETK toimittaa tilastokeskuksen työssäkäyntitilaston pohja-aineistoon tiedot eläkkeistä niin, että niistä ilmenee vanhuuseläkkeen alkamispäivä ja jos sitä edeltää työkyvyttömyys, myös koko ketjun alkamispäivä. Tilastokeskuksen tarpeisiin ei kuitenkaan käytännössä kuulu tieto varsinaisen vanhuuseläkkeen alkamispäivästä ja siksi vain koko ketjun alkamispäivä jää tilastokeskuksen sisäisessä tiedonkäsittelyprosessissa jäljelle. Tilanteessa, jossa kuntoutustuki on muuttunut työkyvyttömyyseläkkeeksi ja työkyvyttömyyseläke vanhuuseläkkeeksi, ainoa eläkkeen alkamispäivä on kuntoutustuen alkamispäivä (pois lukien eräät poikkeukset, kuten takuueläke). Alkuperäinen raaka-aineisto, joka koostuu hallinnollisista rekisteriaineistoista, on kuitenkin osoittautunut tarpeelliseksi muun muassa tutkimuksessa, jota voidaan hyödyntää työttömyysturvaan liittyvässä sosiaalipoliittisessa lainvalmistelussa. Hallinnollinen rekisteriaineisto sisältää usein tietoa, jota muokatussa ja pseudonymisoidussa aineistossa ei ole ja on siten laajakäyttöisempi. Esitys pyrkii välttämään tilanteet, joissa tutkimus- ja selvityskäyttöön tarpeellinen tieto muuttuu informaatioarvoltaan vähäisemmäksi.

Tilastokeskuksen kautta tilastointitarkoituksiin kerättyyn aineistoon voi saada käyttöluvan tilastolain perusteella tutkimustarkoitukseen ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten. Vastaavasti ETK voi poimia rekistereistään tutkimusaineistoja tieteelliseen tutkimukseen. Tietoja luovutetaan noudattaen julkisuuslain ja tietosuojalain periaatteita. Tilastokeskus on tulkinnut, että pelkkä ETK:n aineisto on saatavissa ETK:n kautta, jolloin tilastokeskus on jalostanut ETK:n dataa yhdistämällä siihen muita tietoja ja näin muodostanut tilastoinnissa käytettävän tilastoaineiston. Tutkijat ovat voineet hakea käyttölupaa ETK:n aineistoon suoraan ETK:lta ja saada sen näin heti rekisterin valmistuttua käyttöönsä. Koska ETK ei ole tilastoviranomainen, eikä sen lupakäytäntö mahdollista yhteiskuntaoloja koskevia tilastollisia selvityksiä, nämä käyttäjät ovat joutuneet odottamaan tilastokeskuksen lopullista aineistoa (https://www.etk.fi/tutkimus-tilastot-ja-ennusteet/tutkimus/tutkimusyhteistyo/).

ETK kokoaa tilastoja eläkkeistä. ETK ei ole tilastoviranomainen, joten sillä ei ole oikeutta ottaa vastaan tilastokeskuksen tai muiden viranomaisten keräämiä henkilötietoja esimerkiksi sosioekonomisesta taustasta. Tämän vuoksi ETK ei myöskään luovuttaa salassa pidettäviä tietoja tilastolain 13 §:n nojalla. Näistä syistä ETK:n tietoaineistoja rikastetaan tilastokeskuksessa yhdistämällä aineistoon taustamuuttujia. Joissakin tapauksissa taustamuuttujien tuottaminen vie pitkiä aikoja, mutta alkuperäinen tieto, ilman hitaasti valmistuvia taustamuuttujia, on käytettävissä ETK:n aikataulun mukaisesti. ETK:n rekisteriaineisto on voitu siirtää muokkaamattomana tietovarastoon ja tutkijoiden käyttöön mutta näin ei ole toimittu ainakaan usein. Tilastokeskus säilyttää yksinomaisen oikeuden julkaista tuottamiaan tilastoja mutta muilla viranomaisilla on edelleen oikeus julkaista omaa tilastotuotantoaan itsenäisesti. Asetelma voi johtaa viivästyksiin tilastojen julkaisemisessa mutta varmistaa toisaalta tilastoviranomaisten ja tilastoja julkaisevien muiden viranomaisten tilastoaineistojen nopeammat käyttömahdollisuudet tutkimuksessa.

Etäkäyttöjärjestelmien palvelukyvyn varmistaminen ja kapasiteettiongelmien välttäminen on tärkeää, jotta tutkija- ja viranomaisyhteisön käyttölupahakemusten tutkijapalvelun voimavaroja koettelevaa painetta voidaan karsia, ja samalla vähentää tarvetta julkiseen keskusteluun tutkijapalvelun rahoituksesta. Tilastokeskuksen tutkijapalvelun uudemmassa verrokissa Findatassa jonossa olevien hakemusten määrä on nelinkertainen tilastokeskuksen nykyiseen tutkijapalveluun verrattuna. Ongelmat liittyvät osittain kustannusten jakautumiseen, sillä Findata ei vastaa datan ja infrastruktuurin kustannuksista, jotka jäävät tutkijayhteisön kannettaviksi. Findatan toiminta perustuu toisiolakiin. Findata myöntää tutkimuskäyttöä varten tietoluvat silloin, kun tietoja yhdistellään useasta toisiolain alaisista eri sosiaali- ja terveysrekisteristä.

Valtioneuvoston ja sen ministeriöiden käyttölupahakemusten etusijassa valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden on pyritty seuramaan muiden pohjoismaiden tilastovirastojen esimerkkiä.

Julkisuuslaki ja tiedonhallintalaki

Viranomaisten asiakirjojen julkisuutta koskeva sääntely kuuluu lähtökohtaisesti jäsenvaltioiden toimivaltaan. Koska EU:lla ei ole yleistä toimivaltaa harmonisoida viranomaisten asiakirjojen julkisuutta koskevaa sääntelyä, kansallista liikkumavaraa rajoittavat ja ohjaavat tältä osin erityisesti perus- ja ihmisoikeuksista seuraavat vaatimukset. Poikkeuksena ovat kuitenkin erityiset EU:n perussopimusten toimivaltaperusteista johtuvat alaltaan rajatut EU-oikeudelliset säädökset, jotka koskevat muun muassa ympäristötiedon julkisuutta ja liikesalaisuuksien suojaa. Myös viime vuosina kehittyneellä EU:n avoimen datan sääntelyllä on liittymäkohtia julkisuuskysymyksiin. Lisäksi eri alojen EU-sääntelyyn sisältyy yksittäisiä säännöksiä, joilla voi olla vaikutusta asiakirjojen julkisuuteen jäsenvaltioissa. Kattava EU:n julkisuussääntely kohdistuu kuitenkin vain sen omiin toimielimiin.

Julkisuuslain uudistaminen on parhaillaan vireillä OM:n työryhmässä, jonka tehtävänä on selvittää ja arvioida (i) julkisuusperiaatteen asianmukaisen toteutumisen ja toteuttamisen ongelmakohtia ja niihin vaikuttavia toimia sekä (ii) julkisuuslain soveltamisalan riittävyyttä ja ajantasaisuutta erityisesti ottaen huomioon hallinnon uusiutuvat rakenteet. Tarkoitus on ajantasaistaa voimassa oleva julkisuussääntely. Tavoitteena on nykyistä selkeämpi ja toimivampi lainsäädäntö, joka edistää yhteiskunnan avoimuutta ja vastaa nyky-yhteiskunnan vaatimuksia. Koska hanke on asetettu päättymään kesäkuussa 2023, esityksessä on rajoituttu tarkastelemaan lain uudistamistarpeita ja sen käytännön toteutumisen keskeisimpiä esteitä tilastoviranomaisten näkökulmasta.

Viranomaisten hallussa olevien tietojen hallinnasta, saatavuudesta ja luovuttamisesta teknisen rajapinnan avulla säädetään tilastolain 13 b §:n ohella yleisesti tiedonhallintalaissa, joka koskee julkisuuslain 4 §:n 1 momentissa tarkoitettuja viranomaisia sekä eduskunnan virastoja, eduskunnan ohjauksessa olevia julkisoikeudellisia laitoksia (Kela, SP ja Valtiontalouden tarkastusvirasto, jäljempänä VTV) sekä yliopistoja. Tilastolain 13 b §:ää täydentävä, TK-lakiin ehdotettu uusi 2 a § on tilastolain 13 b §:n tavoin tiedonhallintalain 24 §:n yleissäännöstä täsmentävä erityissäännös, joka syrjäyttää yleislain (lex specialis derogat legi generali) ja mahdollistaa tiedon luovuttamisen ”muulle kuin toiselle viranomaiselle”, kuten tutkija- ja aineistopalvelun asiakkaille. Tiedonhallintalain pääasiallinen tavoite on edistää hyvää tiedonhallintatapaa, tietojärjestelmien ja tietovarantojen yhteentoimivuutta sekä viranomaisten tietojen uudelleenkäyttöä edellyttämällä asiakirjojen muuttamista sähköiseen ja koneluettavaan muotoon sekä mahdollistamalla tietojen luovuttaminen teknisen rajapinnan välityksellä muillekin kuin viranomaisille. Yksittäisistä tietojärjestelmistä, tietojenkäsittelyoikeuksista ja muista tiedonhallintaan liittyvistä seikoista sekä oikeudesta käsitellä henkilötietoja säädetään organisaatio- tai toimintokohtaisilla erityislaeilla.

Lisäksi sähköisessä muodossa olevien tietojen saatavuudesta teknisen rajapinnan ja katseluyhteyden avulla säädetään tiedonhallintalaissa. Tietojen luovuttamisesta päättämisestä ja tietojen luovuttamisen määräajoista säädetään sen sijaan julkisuuslain 14 §:ssä. Soveltamisrajauksen tarkoituksena on välttää päällekkäistä sääntelyä kansallisissa hallinnon yleislaeissa, julkisuuslaissa ja tiedonhallintalaissa. Kansallisten yleislakien sekä avoimen datan direktiivin soveltamisalojen vertailu on niiden systematiikan erilaisuuden vuoksi kuitenkin haastavaa. Avoimen datan direktiivin täytäntöönpanon johdosta julkisuuslain ja tiedonhallintalain uudistettu sääntely koskee arvokkaita tietoaineistoja sekä tiheästi ja reaaliaikaisesti päivittyvää tietoa. Tiheästi tai reaaliaikaisesti päivittyviä tietoja koskevia velvollisuuksia sovelletaan vain julkisiin asiakirjoihin, kun tieto ei sisälly viranomaisen henkilörekisteriin tai muuhun sellaiseen asiakirjaan, josta tieto voidaan luovuttaa vain tietyin edellytyksin. Avoimen datan direktiivin täytäntöönpanosta johtunut sääntely ei näin ollen ole merkityksellistä henkilötietojen suojan näkökulmasta.

Euroopan unionin sääntely henkilötietojen käsittelystä

Henkilötietojen suojaa määrittelee yleisesti SEUT 16 artikla, jonka 1 kohdan mukaan jokaisella on oikeus henkilötietojensa suojaan. Henkilötietojen suojaa koskeva sääntely on lähtökohtaisesti harmonisoitu EU-lainsäädännöllä EU:n perusoikeuskirjan (Charter of fundamental rights of the European Union, 2000/C 364/01) 8 artiklalla (PeVL 31/2017 vp, s. 3) ja tietosuoja-asetuksella, joiden lisäksi voi olla erityistä tietosuojasääntelyä. Tietosuoja-asetus määrittelee kansallista liikkumavaraa, joka koskee myös tietosuojan ja kansallisen julkisuuslainsäädännön välistä suhdetta. SEUT 16 artiklan 2 kohdan nojalla annettu tietosuoja-asetus tuli voimaan 24.5.2016 ja sitä on sovellettu 25.5.2018 alkaen. Tietosuoja-asetus on kaikilta osin velvoittava ja sitä sovelletaan sellaisenaan kaikissa jäsenvaltioissa. Tietosuoja-asetuksen tavoitteena on yhtenäistää jäsenvaltioiden tietosuojakäytäntöjä ja vahvistaa rekisteröityjen itsemääräämisoikeutta. Tietosuoja-asetus antaa kuitenkin direktiivinomaista kansallista liikkumavaraa, joten jäsenvaltioilla on mahdollisuus antaa asetusta täsmentävää kansallista lainsäädäntöä. Asetusta täydentävä tietosuojalaki tuli Suomessa voimaan 1.1.2019.

Tietosuoja-asetusta sovelletaan henkilötietojen käsittelyyn, joka on osittain tai kokonaan automaattista, sekä sellaiseen henkilötietojen käsittelyyn muussa kuin automaattisessa muodossa, joka muodostaa rekisterin osan tai jonka on tarkoitus muodostaa rekisterin osa (2 artikla). Rekisteröidyn tunnistetietona voi olla esimerkiksi henkilön nimi, henkilötunnus tai osoite, jotka ovat henkilötietoa sekä suoraan että välillisesti tunnistettuina. Henkilötiedoilla tarkoitetaan tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön eli rekisteröityyn liittyvää tietoa (4 artikla). Tietosuoja-asetuksessa ’käsittelyllä’ tarkoitetaan toimintoa tai toimintoja, joita kohdistetaan henkilötietoihin tai henkilötietoja sisältäviin tietojoukkoihin joko automaattista tietojenkäsittelyä käyttäen tai manuaalisesti, kuten tietojen keräämistä, tallentamista, järjestämistä, jäsentämistä, säilyttämistä, muokkaamista tai muuttamista, hakua, kyselyä, käyttöä, tietojen luovuttamista siirtämällä, levittämällä tai asettamalla ne muutoin saataville, tietojen yhteensovittamista tai yhdistämistä, rajoittamista, poistamista tai tuhoamista (4 artiklan 2 kohta). Tietosuoja-asetusta ei sovelleta kuolleisiin henkilöihin (johdanto-osan 158. kappale). Suomessa tilastokeskus on kuolinsyyasiakirjojen arkistoviranomainen ja Kansallisarkisto arkistoviranomainen, josta säädetään laissa Kansallisarkistosta (1145/2016). Arkistolaitos muuttui Kansallisarkistoksi vuoden 2017 alussa.

Tietosuoja-asetuksessa määritellään rekisterinpitäjä ja henkilötietojen käsittelijä (4 artikla). Rekisterinpitäjä on taho, joka yksin tai yhdessä muiden kanssa määrittää henkilötietojen käsittelyn tarkoituksen ja keinot. Henkilötietojen käsittelijä on taho, joka käsittelee henkilötietoja rekisterinpitäjän lukuun. Rekisterinpitäjän ja henkilötietojen käsittelijän velvollisuuksista säädetään muun muassa tietosuoja-asetuksen IV luvussa, jossa säädetään myös muun muassa yhteisrekisterinpitäjistä (26 artikla). Jos vähintään kaksi rekisterinpitäjää määrittää yhdessä käsittelyn tarkoitukset ja keinot, ne ovat yhteisrekisterinpitäjiä, jolloin niiden on keskinäisin järjestelyin määriteltävä kunkin vastuualueet tietosuoja-asetuksessa säädettyjen velvollisuuksien noudattamiseksi.

Tietosuoja-asetuksen 25 artikla koskee sisäänrakennettua ja oletusarvoista tietosuojaa. Tietosuoja on otettava huomioon jo suunnitteluvaiheessa ja henkilötietojen käsittelyyn liittyvät tekniset ja organisatoriset toimenpiteet on toteutettava siten, että rekisteröityjen oikeudet ja tietosuoja-asetuksen noudattaminen toteutuvat. Tietojen käsittely on suunniteltava riskiperusteisesti ottamalla huomioon riskit, joita henkilötietojen käsittely aiheuttaa rekisteröidyn oikeuksille ja vapauksille. Oletusarvoisesti vain käyttötarkoituksen kannalta tarpeellisia tietoja saa käsitellä. Käsittelyn turvallisuudesta säädetään tietosuoja-asetuksen 32 artiklassa. Jos toiminta todennäköisesti aiheuttaa rekisteröidyn oikeuksille ja vapauksille korkean riskin, rekisterinpitäjän on laadittava tietosuojaa koskeva vaikutusten arviointi (35 artikla). Vaatimus liittyy tilastokeskuksen tietoturvalliseen etäkäyttöjärjestelmään, joka tukee käsittelyn turvallisuuden vaatimuksia.

Rekisteröidyn oikeuksista säädetään tietosuoja-asetuksen 12-22 artiklassa. Rekisteröidyllä on oikeus saada tietää, mitä tietoja rekisterinpitäjä on hänestä kerännyt. Rekisteröidyllä on oikeus vaatia, että häntä koskevat virheelliset tiedot oikaistaan ja että hänen tietonsa poistetaan rekisteristä, sekä oikeus tietyin edellytyksin siirtää tiedot rekisterinpitäjältä toiselle ja oikeus vastustaa tietojensa käyttöä esimerkiksi profilointiin. Tietosuoja-asetus sallii rekisteröidyn oikeuksien rajoittamisen tietyissä tilanteissa ja vain tietyin edellytyksin. Rekisteröidyn oikeuksiin voidaan säätää lainsäädännöllä poikkeuksia silloin, kun tietoja käsitellään tieteelliseen tutkimustarkoitukseen tai tilastointitarkoitukseen (esimerkiksi 89 artikla). Lisäksi tietosuoja-asetuksesta seuraa suoraan tiettyjä rajoituksia rekisteröidyn oikeuksiin.

Henkilötiedot on kerättävä tiettyä, nimenomaista ja laillista tarkoitusta varten (5 artiklan 1 kohdan b-alakohta). Säännöksen taustalla on EU:n perusoikeuskirjan 8 artiklan 2 kohta, jonka mukaan henkilötietojen käsittelyn pääsääntö on, että tietoa saa käyttää asianomaisen henkilön suostumuksella tai muun laissa säädetyn oikeuttavan perusteen nojalla ja vain siihen tarkoitukseen, johon se on alun perin kerätty (käyttötarkoitussidonnaisuuden periaate). Tietoja saa käyttää muuhun tarkoitukseen vain, jos uusi käyttötarkoitus on yhteensopiva alkuperäisen käyttötarkoituksen kanssa. Yleisen edun mukaista arkistointia, tieteellistä tutkimusta ja tilastointia ei katsota yhteensopimattomaksi alkuperäisen käyttötarkoituksen kanssa. Henkilötietojen käsittely vaatii käsittelyperusteen (6 artikla). Käsittely on lainmukaista vain, jos se täyttää jonkin 6 artiklassa luetelluista edellytyksistä. Käsittely voi perustua muun muassa henkilön suostumukseen, luonnollisen henkilön elintärkeiden etujen suojaamiseen, rekisterinpitäjän lakisääteisen velvollisuuden noudattamiseen, yleistä etua koskevan tehtävän suorittamiseen tai rekisterinpitäjälle kuuluvan julkisen vallan käyttämiseen. Henkilötietoja voidaan käsitellä muuhun kuin alkuperäiseen tarkoitukseen myös rekisteröidyn suostumukseen perustuen tai jos käsittely on sallittu EU:n tai jäsenvaltion lainsäädännössä (6 artiklan 4 kohta).

Tietosuoja-asetuksen 9 artiklan 1 kohdan mukaan erityisiä henkilötietoryhmiä koskevien tietojen käsittely on lähtökohtaisesti kielletty. Erityisiä henkilötietoryhmiä ovat muun muassa rotu tai etninen alkuperä, poliittiset mielipiteet, uskonnollinen tai filosofinen vakaumus tai ammattiliiton jäsenyys, geneettinen tai biometrinen tieto henkilön yksiselitteiseksi tunnistamiseksi sekä terveystieto ja luonnollisen henkilön seksuaalista käyttäytymistä ja suuntautumista koskevat tiedot. Erityisiä henkilötietoryhmiä koskevat tiedot saavat tietosuoja-asetuksessa erityistä suojaa ja niiden käsittely on sallittua vain asetuksen 9 artiklan 2 kohdassa tarkoitetuissa tilanteissa. Tietyissä tilanteissa tietojen käsittely voidaan sallia säätämällä käsittelystä EU:n tai jäsenvaltion lainsäädännössä, jos se on tarpeen ja oikeasuhteista sillä tavoiteltuun tavoitteeseen nähden. Lisäksi tulee säätää asianmukaisista ja erityisistä toimenpiteistä rekisteröidyn perusoikeuksien ja etujen suojaamiseksi. Julkisuuden ja tietosuojan yhteensovittamiseen liittyviä erityiskysymyksiä, kuten henkilötunnusta, saattaa olla tarvetta arvioida julkisuuslain 24 §:n salassapitoperusteiden uudistamisen näkökulmasta. Julkisuuslaissa ei ole nimenomaisesti säädetty salassa pidettäviksi kaikkia tietosuoja-asetuksen 9 artiklassa lueteltuja erityisiä henkilötietoja. Toisaalta tietoja koskevat julkisuuslaissa säädetyt henkilötietojen luovutusrajoitukset ja yleensä myös erityislaeista seuraava tiukempi käyttötarkoitussidonnaisuus ja suojatoimisääntely.

Tietosuoja-asetuksen 9 artiklan 2 kohdan j-alakohdan mukaan käsittely on sallittu, jos se on tarpeen yleisen edun mukaisia arkistointitarkoituksia taikka tieteellisiä ja historiallisia tutkimustarkoituksia tai tilastointitarkoitukseen tietosuoja-asetuksen 89 artiklan 1 kohdan mukaisesti EU-oikeuden tai jäsenvaltion lainsäädännön nojalla edellyttäen, että se on oikeasuhteinen tavoitteeseen nähden, että siinä noudatetaan keskeisiltä osin oikeutta henkilötietojen suojaan ja että siinä säädetään asianmukaisista ja erityisistä toimenpiteistä rekisteröidyn perusoikeuksien ja etujen suojaamiseksi.

Tietosuoja-asetuksen 10 artiklassa säädetään rikostuomioihin ja rikkomuksiin liittyvien tietojen käsittelystä. Käsittely on sallittua vain viranomaisen valvonnassa tai silloin, kun se sallitaan EU:n oikeudessa tai jäsenvaltion lainsäädännössä, jossa säädetään asianmukaisista suojatoimista rekisteröidyn oikeuksien ja vapauksien suojelemiseksi. Tietosuojalain 7 §:ssä on säädetty tietojen käsittelystä. Käsittely on sallittua tieteellistä tai historiallista tutkimusta taikka tilastointia varten edellyttäen, että tietoja käsillään tietosuojalain 6 §:n 1 momentissa määritellyssä käyttötarkoituksessa ja että tietosuojalain 6 §:n 2 momentin suojatoimenpiteistä huolehditaan.

Tietosuoja-asetuksen 89 artiklassa säädetään yleisen edun mukaisia arkistointitarkoituksia, tieteellisiä tai historiallisia tutkimustarkoituksia tai tilastointitarkoitukseen tapahtuvaa käsittelyä koskevista suojatoimista ja poikkeuksista. Suojatoimilla on varmistettava, että on toteutettu tarvittavat tekniset ja organisatoriset toimenpiteet, joilla varmistetaan etenkin tietojen minimointiperiaatteen noudattaminen. Tietojen minimointiperiaate tarkoittaa, että käsiteltävien henkilötietojen on oltava asianmukaisia ja olennaisia ja rajoituttava siihen, mikä on tarpeellista suhteessa niihin tarkoituksiin, joita varten niitä käsitellään (5 artikla). Suojatoimena voi olla esimerkiksi salaaminen tai pseudonymisointi (6 artiklan 4 kohdan e-alakohta).

Tieteellinen tutkimus on ymmärrettävä laajasti sekä tiede- ja tutkimusmyönteisesti siten, että se tarkoittaa myös teknologian kehittämistä ja esittelyä, perustutkimusta, soveltavaa tutkimusta ja yksityisin varoin rahoitettua tutkimusta (johdanto-osan 159. kappale). Tilastointitarkoitus tarkoittaa mitä tahansa henkilötietojen käsittely- tai keräämistoimenpidettä, jota tarvitaan tilastotutkimuksia varten tai tilastollisten tulosten luomiseksi (johdanto-osan 162. kappale). Tilastointitarkoitukseen tehtävän käsittelyn tuloksena ei ole henkilötieto, vaan yhdistelmätieto, eikä tulosta tai tietoja saa käyttää ketään yksilöä koskeviin toimenpiteisiin tai päätöksentekoon. Tulkinta poikkeaa hieman tiede- ja tutkimusmyönteisyydessään toisiolaista, jonka 37 §:ssä kehittämis- ja innovaatiotoimintaa ei ole pidetty tieteellisenä tutkimuksena (PeVL 1/2018 vp, s. 5-6). Toisiolakia hieman laajempi tulkinta tietosuoja-asetuksen antamista mahdollisuuksista tieteen ja tutkimuksen edistämiseen, jossa ei suljeta kehittämis- ja innovaatiotoimintaa ulkopuolelle lukuun ottamatta erityisiin henkilötietoryhmiin kuuluvien henkilötietojen käsittelyä, on kuitenkin perusteltu, koska tilastokeskuksen tarjoama tutkimusaineisto on paljolti erilaista kuin toisiolain sääntelemä aineisto eikä olennaisesti perustu vahvasti suojattuihin yksityisiin henkilötietoihin (PeVL 1/2018 vp, s. 5-6). Lisäksi tieteen ja tutkimuksen edistämiseen kehittämis- ja innovaatiotoiminnassa tukeudutaan tietosuoja-asetuksen 159. johdantokappaleeseen eikä esityksessä ehdoteta asiasta säätämistä kansallisessa laissa, toisin kuin toisiolakia koskevassa esityksessä (HE 159/2017 vp).

Henkilötietojen siirrosta kolmansiin maihin ja kansainvälisille järjestöille on säännökset tietosuoja-asetuksen V luvussa. Henkilötietojen käsittely on lainmukaista vain siltä osin kuin vähintään yksi tietosuoja-asetuksen 6 artiklan 1 kohdassa luetelluista kuudesta edellytyksistä täyttyy: (i) rekisteröidyn suostumus, (ii) sopimuksen täytäntöönpano, (iii) rekisterinpitäjän lakisääteinen velvollisuus, (iv) rekisteröidyn elintärkeiden etujen suojaaminen, (v) yleinen etu tai julkisen vallan käyttäminen sekä (vi) rekisteröidyn tai kolmannen osapuolen etujen toteuttaminen).

Tilastokeskuksen tilastoinnissa henkilötietojen käsittelyperuste on rekisterinpitäjän lakisääteinen velvoite: tilastokeskuksen tehtävä tuottaa tilastoja (6 artiklan 1 kohdan c-alakohta) tai suora henkilötiedonkeruu (6 artiklan 1 kohdan e-alakohta). Esityksessä tilastokeskuksen tehtäväksi säädettäisiin tutkijayhteisön ajankohtaisiin tietoaineistotarpeisiin vastaaminen tutkija- ja aineistopalvelussa, jossa henkilötietojen käsittelyperuste on joko mainittu lakisääteinen velvoite tai yleistä etua koskevan tehtävän suorittaminen ja tilastokeskukselle rekisterinpitäjänä kuuluvan julkisen vallan käyttäminen (6 artiklan 1 kohdan e-alakohta). Tietosuoja-asetuksen 6 artiklan c ja e-alakohdat eivät tuota vastaavia oikeuksia rekisteröidylle (samoin 21 artiklan 6 kohta). Vaikka selkeintä on, että on yksi käsittelyperuste, käsittelyn oikeusperuste voi joissain tilanteissa olla samanaikaisesti sekä 6 artiklan 1 kohdan c että e-alakohta. Tutkijayhteisön ajankohtaisiin tietoaineistotarpeisiin vastaamisen ilman aiheetonta viivytystä on arvioitu olevan parhaiten mahdollista tilastokeskuksessa, joka tilastolain mukaan (2 §:n 2 momentin 1 kohta) on valtion tilastotoimen yleisviranomainen. Tämä on tilastokeskukselle osoitettuna lakisääteisenä tehtävänä julkisen vallan käyttämistä, minkä lisäksi tieteellinen tutkimus, yhteiskuntaoloja koskevat tilastolliset selvitykset ja tutkijayhteisölle tarjottavan palvelun kehittäminen on kansallisen yleisen edun mukaista. Tietosuoja-asetuksen 6 artiklan 1 kohdassa lueteltuja kuutta edellytystä voidaan käyttää tieteellisen tutkimuksen ja tilastollisten selvitysten käsittelyperusteena tapauskohtaisen harkinnan perusteella. Henkilötietojen käsittely on mahdollista tieteelliseen tutkimustarkoitukseen ja tilastointitarkoitukseen edellyttäen, että asetuksen 89 artiklan vaatimuksia käyttötarkoitussidonnaisuudesta noudatetaan (5 artiklan 1 kohdan b-alakohta). Lisäksi tutkija- ja aineistopalvelussa henkilötietojen käyttötarkoitus on rajattu siten, että tietoja käytetään tieteelliseen tutkimukseen tai yhteiskuntaoloja kuvaavien tilastollisten selvitysten tekemiseen.

Tietosuoja-asetuksen suhteesta tieteelliseen tutkimukseen on EU:ssa käyty vilkasta keskustelua, jossa mielipiteet ovat jakautuneet: “The rules contain a special regime affording a degree of flexibility for genuine research projects that operate within an ethical framework and aim to grow society’s collective knowledge and wellbeing. How this special regime should operate in practice is under discussion. Some argue that the GDPR offers too much flexibility, others that the rules threaten vital research activity.”

Tilastollisen selvityksen käsitettä ei ole määritelty eikä varsinaisesti perusteltukaan tilastolainsäädännössä. Sen sijaan rajausta yhteiskuntaoloihin on käsitelty (13 §:n 2 momentin 1 kohdan perustelut). Jo 30 vuotta sitten TK-laissa (2 §:n 1 momentti) säädettiin tilastokeskuksen tehtäväksi ”laatia yhteiskuntaoloja koskevia tilastoja ja selvityksiä” ja jo sitä ennen ensimmäisessä laissa tilastokeskuksesta (796/1970), jonka 1 §:n perustelujen mukaan: ”Tärkeimmän tehtäväryhmän muodostaisi yhteiskuntaoloja koskevien tilastojen laatiminen ja julkaiseminen.” (HE 79/1970 vp, s. 1). Näin ollen myös tilastollisten selvitysten tietosuoja-asetuksen mukaisena käsittelyperusteena on rekisterinpitäjän lakisääteinen velvollisuus (6 artiklan 1 kohdan c-alakohta) sekä tieteellisen tutkimuksen tavoin 6 artiklan 1 kohdan e-alakohta tietosuojalain 4 §:n kautta säänneltynä. Tilastollisten selvitysten tekemistä sen sijaan ei ole säädetty minkään viranomaisen tehtäväksi. Mahdollisuutta määritellä laintasoisesti tilastollinen selvitys ja tietoturvallinen käyttöympäristö on tarkoitus käsitellä esitystä myöhemmin täydentävässä jatkovalmistelussa. Tilastollisen selvityksen käsitteeseen liittyy kysymys siitä, tulisiko tilastolain 13 §:ssä säädetty tilastoviranomaisten oikeus luovuttaa salassa pidettäviä tietoja ulottaa myös tilastoja laativiin viranomaisiin. Jatkovalmistelussa on otettava huomioon myös komission aloitteesta EU:n tilastoasetukseen myöhemmin kuluvana vuonna ehdotettavat muutokset, jotka voivat edelleen rajoittaa mahdollisuutta kansallisessa tilastolainsäädännössä säädettäville määritelmille, kuten tilastoyksikölle ja tekniselle käyttöympäristölle sekä kaikkiin tilastoviranomaisiin sovellettavassa tilastolaissa käytetylle ilmaisulle arkaluonteisista henkilötiedoista.

Kansallinen liikkumavara

Vaikka tietosuoja-asetus on kansallisesti suoraan sovellettava säädös, jättää se eräissä asioissa jäsenvaltiolle direktiivinomaista kansallista liikkumavaraa eli harkintamarginaalia. Kansallinen liikkumavara ei toisaalta kaikilta osin myöskään velvoita jäsenvaltiota säätämään tietosuoja-asetusta täydentävää tai täsmentävää kansallista lainsäädäntöä, vaan asiasta päättäminen on jätetty kansallisen lainsäätäjän harkintaan. Kansallista liikkumavaraa tietosuoja-asetuksen täydentämiseksi on tietosuojalaissa käytetty tilanteissa, joissa henkilötietolain kumoamisesta on seurannut tarve kansalliseen sääntelyyn, kuten esimerkiksi henkilötietojen käsittelyn oikeusperusteen säilyttämiseksi eräissä tilanteissa tai tieteellisen tutkimuksen edellytysten säilyttämiseksi mahdollisimman pitkälle nykyisen kaltaisina. Kansallista liikkumavaraa on mahdollista käyttää myös myöhemmin esimerkiksi annettaessa erityislainsäädäntöä, kuten esityksessä ehdotettua tilastolainsäädäntöä, jossa tietosuojalain tavoin pyritään vahvistamaan tieteellisen tutkimuksen toteuttamisedellytyksiä.

Kansallinen harkintamarginaali koskee erityisesti julkisen sektorin henkilötietojen käsittelyä, mikä ilmenee esimerkiksi henkilötietojen käsittelyperusteen mahdollistamasta kansallisesta liikkumavarasta. Kansallinen harkintamarginaali koskee jossakin määrin myös yksityisen sektorin henkilötietojen käsittelyä. Tietosuoja-asetusta on mahdollista täydentää ja sen soveltamista täsmentää kansallisella lainsäädännöllä siten kuin tietosuoja-asetuksessa säädetään. Tietosuoja-asetuksen 23 artiklassa esimerkiksi annetaan jäsenvaltiolle mahdollisuus rajoittaa rekisteröidyn oikeuksia tietyissä tilanteissa. Rekisteröidyn oikeuden rajoittaminen on mahdollista muun muassa eräissä tietosuoja-asetuksen IX luvussa säädetyissä erityistilanteissa, kuten käsiteltäessä henkilötietoja tieteellistä tutkimustarkoitusta varten.

Kansallinen liikkumavara perustuu esityksessä tietosuoja-asetuksen 6 artiklan 3 kohdan edellytysten toteuttamiseen. Keskeinen ehdotus tältä osin on, tietosuoja-asetuksen 6 artiklan 1 kohdan e-alakohdan mukaisesti, Tilannehuoneelle annetun etusijan saada julkaisematonta tilastoaineistoa, erityisesti tutkimus-ja selvityskäytössä tarpeellista hallinnollista rekisteriaineistoa, ulottaminen muuhunkin tutkijayhteisöön. Tällöin on tarkasteltu (i) yleisiä edellytyksiä, jotka koskevat rekisterinpitäjän suorittaman tietojenkäsittelyn lainmukaisuutta, (ii) käsiteltävien tietojen tyyppiä, (iii) asianomaisia rekisteröityjä yhteisöjä, joille ja tarkoituksia, joihin henkilötietoja voidaan luovuttaa, (iv) käyttötarkoitussidonnaisuutta, (v) säilytysaikoja sekä käsittelytoimia ja -menettelyjä, mukaan lukien laillisen ja asianmukaisen tietojenkäsittelyn varmistamiseen tarkoitetut toimenpiteet, kuten toimenpiteet muita tietosuoja-asetuksen IX luvussa esitettyjä erityisiä tietojenkäsittelytilanteita varten.

Esityksessä ei tietosuoja-asetuksen näkökulmasta varsinaisesti käsitellä muiden rekisterinpitäjien kuin tilastokeskuksen asemaa ja tehtäviä. Tilastokeskus on siten rekisterinpitäjä, kun (i) tietoja käsitellään tilastointitarkoitukseen, kun (ii) tilastointitarkoitukseen kerättyjä tietoja käsitellään tutkimustarkoitukseen tutkija- ja aineistopalvelua varten, ja kun (iii) tietoja yhdistellään ja pseudonymisoidaan kyseisiin tarkoituksiin. Se, miksi tietosuoja-asetuksen sallimaa kansallista liikkumavaraa käytetään ja miksi tämä on oikeasuhtaista ja yleisen edun tavoitteen mukaista ja välttämätöntä, perustellaan molemmissa lakiehdotuksissa myös säännöskohtaisesti.

Esityksen keskeinen linjaus on suhtautuminen henkilötietojen käsittelyn lainmukaisuutta koskevaan tietosuoja-asetuksen 6 artiklaan. Esityksen jaottelussa henkilötietojen käsittely tilastokeskuksen tilastotoimessa perustuu 6 artiklan 1 kohdan c-alakohtaan (”käsittely on tarpeen rekisterinpitäjän lakisääteisen velvoitteen noudattamiseksi”) tai eräissä suoraan rekisteröityihin kohdistuvissa tiedonkeruissa 6 artiklan 1 kohdan e-alakohtaan. Ehdotetussa tutkija- ja aineistopalvelussa henkilötietojen käsittely perustuu 6 artiklan 1 kohdan e-alakohtaan (”käsittely on tarpeen yleistä etua koskevan tehtävän suorittamiseksi tai rekisterinpitäjälle kuuluvan julkisen vallan käyttämiseksi”). Jaottelun mukaisesti tilastokeskuksen tiedonsaantioikeuksien laajentamiseksi ehdotetut muutokset tilastolakiin perustuvat 6 artiklan 1 kohdan c-alakohtaan (lakisääteinen velvoite). TK-lakiin ehdotetut muutokset perustuvat puolestaan 6 artiklan 1 kohdan e-alakohtaan (yleinen etu). Esityksessä tarkoitettu yleinen etu liittyy Suomen kansalliseen strategiaan kehittyä tietoyhteiskuntana ja vahvistaa luovuuteen, osaamiseen ja uuden tiedon tuottamiseen perustuvan talouskasvun mukaisia edellytyksiä hyvinvointivaltion ylläpitämiseen.

Esitys noudattelee tältä osin eduskunnan hallintovaliokunnan asettamia linjauksia: ”Asetuksen 6 artiklassa tarkoitettua kansallista liikkumavaraa voidaan käyttää myös annettaessa kansallista erityissääntelyä. Artiklan 1 kohdan mukaan "käsittely on lainmukaista, jos ja vain siltä osin kuin vähintään yksi seuraavista edellytyksistä täyttyy:". Saadun selvityksen mukaan edellytyksiä artiklan tulkitsemiselle muulla tavoin kuin sen sanamuodon mukaan ei tällä hetkellä ole. Artiklan sanamuodon perusteella henkilötietojen käsittely voi siten perustua useampaankin 6 artiklassa tarkoitettuun käsittelyn oikeusperusteeseen. Valiokunta huomauttaa, että 1 kohdan c-alakohta ja e-alakohta voivat olla osin päällekkäisiäkin. Valiokunta korostaa, että useamman kuin yhden henkilötietojen käsittelyn oikeusperusteen käyttäminen ei kuitenkaan voi johtaa siihen, että jää epäselväksi, mitä oikeuksia rekisteröidyllä sanotun lain mukaan on. Tämän tulee käydä aina selkeästi ilmi ehdotetusta lainsäädännöstä.”

3 Tavoitteet

Esitystä valmisteltaessa on lähtökohdiksi omaksuttu, että TK-lain uudistamisen ensimmäisessä vaiheessa on, ottaen huomioon tilastokeskuksen merkittävä ohjaava rooli tilastotoimintaa koordinoivana viranomaisena, kiireellisesti arvioitava (i) edellytyksiä selkeyttää tilastokeskuksen tutkijapalvelun tietosuojaoikeudellista asemaa, (ii) koronaepidemian seurannan ja torjunnan vahvistamiseksi käyttöön otetuista määräaikaisista toimenpiteistä erityisesti Tilannehuoneesta saatuja kokemuksia, (iii) edellytyksiä ja tarvetta näiden väliaikaisiksi tarkoitettujen kriisiaikaisten toimenpiteiden saattamiseen pysyviksi ja soveltamisalaltaan laaja-alaisemmiksi, sekä (iv) edellytyksiä poistaa tai vähentää ajantasaisen tutkimustiedon saatavuuden esteitä ja niiden aiheuttamia haasteita, kuten keventämällä raskaita hallinnollisia käytäntöjä ja prosesseja, karsimalla tutkimuslupien ja -aineistojen muodostamisen byrokratiaa sekä estämällä aineiston toimittamisen venymistä. Kun lisäksi otetaan huomioon tutkimusten julkaisemiseen sopivan foorumin löytäminen, siihen liittyvä vertaisarviointiprosessi (peer review), tarvittavat lisäanalyysit ja tarve säilyttää tutkimusaineisto, jotta tulokset voidaan jälkikäteen tarkistaa mahdollisen virheen tai vilpin löytämiseksi, tutkimukseen liittyvän viranomaisprosessin hallinnollista keventämistä on kansallisin toimenpitein ja yleisen edun nimissä syytä edistää.

Mahdollisuuksia tutkijapalvelun toimintaedellytysten vahvistamiseen on lisäksi pyritty selvittämään niiltä osin kuin se edellyttää tilastokeskuksen tiedonsaantioikeuksien laajentamista tietojen keräämiseksi tilastointitarkoitukseen eräiltä muilta viranomaisilta. Tiedonkeruuvaltuuksien laajentamistarve liittyy tilastointiin ja sitä varten saadut tiedot ovat käytettävissä tieteelliseen tutkimukseen. Lisäksi on selvitetty tilastokeskuksen velvollisuutta nopeammin luovuttaa tilastointitarkoitukseen vastaanottamiaan salassa pidettäviä tietoja tieteellistä tutkimusta sekä yhteiskuntaoloja koskevia tilastollisia selvityksiä varten. Samaten on pidetty mahdollisena noudattaa ja kehittää tilastokeskuksen nykymuotoisessa laajassa muiden rekisterinpitäjien kanssa toteutetussa laajahkossa sopimuskäytännössä (esimerkiksi aineistonluovutus-, toimeksianto- ja tutkijapalvelusopimukset sekä tiedonantovelvollisten tai heidän edustajiensa kanssa tehdyt sopimukset) joustavaa ja yhteistyöhakuista lähestymistapaa, jossa tutkija- ja viranomaisyhteisön tietoaineistoon liittyvät tarpeet aidosti priorisoitaisiin suhteessa tutkija- ja aineistopalvelun muihin tehtäviin.

Tilastokeskuksen tilastotarkoituksiin vastaanottamien hallinnollisten rekisteriaineistojen laaja saatavuus ja hyödynnettävyys tutkimuksessa ja päätöksenteossa on tärkeä yhteiskunnallinen päämäärä, jossa tietosuojan, digitaalisuuden ja avoimuuden keskenään osittain ristiriitaiset vaatimukset on otettava huomioon. Tällöin haasteena on muun muassa pyrkimys rajata tietosuoja yksityisyyden ja liikesalaisuuden suojaan eikä kuitenkaan estää luovuttamasta suoria tunnistetietoja julkisista palveluista, kuten kouluista tai terveydenhuollon yksiköistä, ellei niihin ole liitetty muualta saatuja esimerkiksi henkilöstöä, oppilaita tai heidän vanhempiaan koskevia tietoja.

Esityksellä pyritään lisäksi parantamaan erityisesti elinkeino-, talous- ja laajemmin yhteiskuntapolitiikan valmisteluun liittyvää eduskunnan tiedonsaantia suoraan valtioneuvostosta, mitä eduskunnan perustuslakivaliokunta on yleisesti edellyttänyt (PeVL 30/2020 vp), sekä osaltaan vahvistamaan eduskunnan edellytyksiä välillisesti seurata komission harjoittamaa EU:n tilastoasetusta täydentävien käytännesääntöjen täytäntöönpanon noudattamisen ja täytäntöönpanon valvontaa kansallisten tilastoviranomaisten vastuunalaisuuden varmistamiseksi.

Tilannehuoneesta opittujen hyvien käytäntöjen, kuten aineistojen laajan ja nopean saatavuuden vakiinnuttamisen kannalta ensisijaista on kehittää tilastokeskuksen tutkijapalvelun nykyistä toimintaa. Keskeistä on pyrkiä etsimään keinot, joilla Tilannehuonetta varten järjestettyyn sujuvaan prosessiin perustuva korkea palvelutaso voidaan tilastokeskuksen henkilöstövoimavarat huomioon ottaen ulottaa myös laajemmalle tutkija- ja viranomaisyhteisölle. Esityksellä vahvistetaan tilastolain 3 §:ssä säädettyä lain tarkoitusta edistää tilastointitarkoitukseen kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä. Aineistojen ajantasainen ja yhdenvertainen saatavuus sekä käytännesääntöjen kohdassa 8.6 tarkoitettujen hallinnollisten rekisteriaineistojen merkityksen korostaminen mahdollistavat tutkija- ja viranomaisyhteisölle sekä muille tiedontarvitsijoille nykyistä huomattavasti ajantasaisemman ja laajemman rekisteriaineistoperusteisen tavan toteuttaa tutkimus- ja analyysityötä. Tutkimusaineistojen saatavuuden parantaminen tukee tutkija- ja viranomaisyhteisön mahdollisimman yhdenvertaisia edellytyksiä tehdä sekä pitkäjänteistä akateemista tutkimusta että nopeampia, empiiriseen tietoon pohjautuvia soveltavia selvityksiä. Lisäksi on – ottaen huomioon perustuslain 16 §:n 3 momentissa turvattu tieteen vapaus – tärkeää, että pysyvässä datarakenteessa kaikilla akateemista tutkimusta harjoittavilla on oikeus tasapuoliseen kohteluun ja yhtäläinen pääsy tutkimusaineistoihin. Yksittäisen akateemisen toimijan, kuten Tilannehuoneen, varaan rakennettua ratkaisua perustellumpaa onkin tukea tilastokeskuksen kehittämistyötä sekä laajemman tutkija- ja viranomaisyhteisön että valtioneuvoston ja sen ministeriöiden pääsyä ajantasaiseen ja yhteiskunnallista päätöksentekoa tukevaan tietoaineistoon mahdollisimman samanlaisin ehdoin kuin se on Tilannehuoneelle järjestetty. Esityksen toinen keskeinen tavoite on laajemman tutkija- ja viranomaisyhteisön sekä valtioneuvoston ja sen ministeriöiden paremman saatavuuden varmistaminen tilastoaineistoihin. Sen sijaan tarkoitus ei ole luoda – ehdotetulla kiireelliseksi ilmoitettujen käyttölupahakemusten etusijalla valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden – valtioneuvostolle ja sen ministeriöille esimerkiksi etuoikeuksia antaa toimeksiantoja (kuten taulukointeja ja selvityksiä) tilastotuotantoon, vaan pysyttää tilastokeskuksen itsenäinen ja riippumaton oikeus päättää aineistojensa käytöstä. EU:n tilastoasetus (johdanto-osan 13. kappale) kannustaa myös akateemiseen yhteistyöhön: ”Tilastokäsitteiden ja -menetelmien yhdenmukaistamiseksi olisi kehitettävä asiaankuuluvaa monialaista yhteistyötä akateemisten laitosten kanssa.” Sama koskee EU:n tilastoasetuksen johdanto-osan 26. kappaletta: ”Tiedeyhteisön olisi saatava laajemmat käyttöoikeudet Euroopan tilastojen kehittämisessä, tuottamisessa ja jakelussa käytettäviin salassapidettäviin tietoihin analyysejä varten tieteellisen kehityksen edistämiseksi Euroopassa. Sen vuoksi olisi parannettava tutkijoiden käyttöoikeutta salassapidettäviin tietoihin tieteellisiä tarkoituksia varten vaarantamatta kuitenkaan salassapidettävien tilastotietojen edellyttämää korkeaa tietosuojan tasoa.”

Tutkija- ja aineistopalvelun tehtävien ja toiminnan täsmentäminen TK-laissa vahvistaa toiminnon asemaa ja vakiinnuttaa sen tilastokeskuksen yhdeksi keskeiseksi tehtäväksi, jonka tärkeys on useasti tunnistettu tilastokeskuksen aikaisemmissa strategioissa. Lisäksi on tunnistettu tarve kehittää tilastokeskuksen tehtäviä palvelu- ja tieto-organisaation suuntaan. Lainmuutos tukee tilastolain 13 §:n soveltamiskäytännössä vakiintuneiden toimintatapojen luomista muun muassa sellaisten aineistojen käsittelyssä, joita kerätään tilastointitarkoitukseen mutta joita voidaan vastaanottaa ja välittää myös tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten ja joita jokin muu viranomainen haluaa luovuttaa tilastokeskukselle edelleen luovutettavaksi tutkimus- ja selvityskäyttöön. Tällaiset aineistot voidaan luovuttaa tutkimus- ja selvityskäyttöön myös ennen kuin niistä on julkaistu tilasto, jollei tiedon luovuttaminen muulla kuin tilastolain 13 §:ssä säädetyllä tavalla riko tilastosalaisuutta tai olennaisella tavalla ja perusteettomasti vaaranna muiden tiedontarvitsijoiden tasapuolista kohtelua. Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittaman käyttölupahakemuksen asettaminen valtioneuvoston alaisen hallinnon viranomaisen käyttölupahakemuksen edelle ja toteuttaminen ilman aiheetonta viivytystä on esimerkiksi tällainen hyväksyttävä peruste samoin kuin se, että toinen viranomainen on jo itse omasta rekisteristään taulukoinut anonymisoitua tietoa avoimeen tietokantaansa.

Esitys edistää yksikkötason tutkimusaineistojen nykyistä ajantasaisempaa luovuttamista tieteellistä tutkimusta ja yhteiskuntaoloja kuvaavia tilastollisia selvityksiä varten. On tärkeää, että muilta viranomaisilta tilastointitarkoitukseen kerätty tieto voidaan antaa tutkijoiden käyttöön heti, kun siitä tai sen osasta on tehty julkistus. Tällaiseksi julkistukseksi voidaan lukea myös muut kuin tilastokeskuksen omat julkistukset, muun muassa tiedon omistajien omien tilastotietokantojen päivitykset, jollei ole perusteltua muuta syytä (esimerkiksi, jos painava markkinoihin vaikuttava näkökulma sen estää, julkisuuslain 24 §:n 1 momentin 13 kohta). Tämä tarkoittaa, että kyseinen tieto voidaan luovuttaa jo ennen tilastokeskuksen omien tilastojen julkistamista, esimerkiksi heti sen jälkeen, kun aineisto-omistaja on julkaissut tietoja aineistosta. Lopullinen arvio ja päätösvalta tiedon luovuttamisen edellytyksistä on tiedot keränneellä tilastoviranomaisella. Toisaalta on tärkeää, että muilta viranomaisilta tutkija- ja aineistopalvelua varten toimitettu tieto luovutetaan tutkimus- ja selvityskäyttöön mahdollisimman nopeasti tilastokeskuksen vastaanotettua tiedon, näistä tiedoista tilastokeskus ei julkaise tilastoja.

4 Ehdotukset ja niiden vaikutukset

4.1 Keskeiset ehdotukset

Esityksessä ehdotetaan muutettavaksi TK-lakia ja tilastolakia. Tilastokeskuksen tehtäviä ehdotetaan täsmennettäväksi lisäämällä TK-lakiin viraston uudeksi tehtäväksi oikeus tutkija- ja aineistopalvelun ylläpitämiseen. Palvelun tarkoituksena on kehittää ja parantaa tilastokeskuksen tilastointitarkoitukseen keräämien aineistojen jakelua ja luovuttamista tutkija- ja aineistopalvelulle. Tutkija- ja aineistopalvelu on tarkoitettu tieteellisen tutkimuksen ja yhteiskuntaoloja koskevien tilastollisten selvitysten edistämiseen, kuten tutkimusta tekevien organisaatioiden, erityisesti yliopistojen, korkeakoulujen ja ammattikorkeakoulujen sekä tutkimuslaitosten ja ajatuspajojen ajankohtaisiin tietoaineistotarpeisiin vastaamiseen ilman aiheetonta viivytystä, tietoturvallisessa käsittely-ympäristössä, ajantasaisella aineistolla ja mahdollisimman tasapuolisella tavalla. Esityksessä usein käytetty ilmaisu ”ilman aiheetonta viivytystä” tarkoittaa sitä, että muilta viranomaisilta kerätty tieto voidaan antaa tutkijoiden käyttöön mahdollisimman nopeasti sen jälkeen, kun aineistosta tai sen osasta on tehty julkistus. Tällaiseksi julkistukseksi voidaan lukea myös muut kuin tilastokeskuksen omat julkistukset, kuten aineisto-omistajan antama lupa aineiston jakamiseen, omistajan omien tilastotietokantojen päivitykset tai omistajan muutoin aineistosta julkaisemat tiedot.

Ehdotus on laajennettu versio mutta muutoin pitkälti samankaltainen kuin tilastokeskuksessa koronaepidemian poikkeusoloihin Tilannehuoneelle kehitetty toimintamalli työskentelystä etäkäyttöjärjestelmässä. Tilastokeskukselle ehdotetaan oikeutta ottaa vastaan, koostaa, säilyttää ja luovuttaa tutkija- ja aineistopalvelulle tutkimus- ja selvityskäyttöön myös sellaisia aineistoja, joita ei käytetä tilastotuotannossa (esimerkiksi hallinnolliset rekisteriaineistot) ja joita luovutetaan julkisuuslain 28 §:n perusteella valmisaineistojen muodostamiseen, tieteelliseen tutkimukseen tai yhteiskuntaoloja kuvaavien tilastollisten selvitysten tekemiseen. Lisäksi tilastokeskukselle ehdotetaan oikeutta luovuttaa, myös ennen kuin niistä on julkaistu tilasto eli aikaisemmin kuin nykyisin, tilastointitarkoitukseen keräämiään salassa pidettäviä tietoja tilastointitarkoituksen ohella tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten. Samalla selvennetään, EU:n uudistuneen tietosuojalainsäädännön edellyttämällä tavalla, tilastokeskuksen ja muiden osapuolten asemaa ja tietosuojaoikeudellista roolia rekisterinpitäjinä ja henkilötiedon käsittelijöinä. Tilastokeskus on tilastointitarkoituksiin kerätyn aineiston rekisterinpitäjä ja tutkija- ja aineistopalvelua varten vastaanotettujen tietojen rekisterinpitäjä, jos alkuperäisen rekisterinpitäjän kanssa on sovittu, että tiedoista muodostetaan tutkija- ja aineistopalvelussa säilytettävä valmisaineisto. Tilastokeskus on lisäksi tutkija- ja aineistopalvelua varten vastaanotettujen tietojen henkilötietojen käsittelijä, jos tiedot tulevat yksittäisen tutkimushankkeen käyttöön tutkija- ja aineistopalvelussa eikä niistä muodosteta valmisaineistoa. Sen sijaan Fiona-etäkäyttöjärjestelmästä ei ehdoteta laintasoista sääntelyä.

Vähäisenä poikkeuksena tasapuolisesta kohtelusta ehdotetaan TK-lakiin muutosta, jonka mukaan valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittama (esimerkiksi TEAS-hanketta koskeva) käyttölupahakemus on asetettava etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden ja toteutettava ilman aiheetonta viivytystä. Tilaston julkaisemattomuus ei siten ole este tai aiheellinen viivytys tilastoinnissa käytettävän hallinnollisen rekisteriaineiston luovuttamiseen tutkija- ja aineistopalveluun, ellei tiedon luovuttaminen muulla kuin tilastolain 13 §:ssä säädetyllä tavalla riko tilastosalaisuutta tai olennaisella tavalla ja perusteettomasti vaaranna muiden tiedontarvitsijoiden tasapuolista kohtelua. Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittaman käyttölupahakemuksen asettaminen valtioneuvoston alaisen hallinnon viranomaisen käyttölupahakemuksen edelle ja toteuttaminen ilman aiheetonta viivytystä on esimerkiksi tällainen hyväksyttävä peruste samoin kuin se, että toinen viranomainen on jo itse omasta rekisteristään taulukoinut anonymisoitua tietoa avoimeen tietokantaansa. Näillä rajauksilla ja sillä, että kysymys on erityisesti tutkimus- ja selvityskäytössä tarpeellisista hallinnollisista rekisteriaineistoista, varmistetaan myös, ettei rekisteriaineiston antaminen tutkimus- ja selvityskäyttöön ole vastoin muita hyvän hallinnon periaatteita. Rekisteriaineiston antaminen tutkimus- ja selvityskäyttöön mahdollisimman nopeasti on suotavaa sikäli, että tiedon käytön nopeus on tärkeämpää kuin yksittäisten pienehköjen virheiden korjaaminen, vaikka raaka-aineistossa toisinaan saattaa olla laaja-alaisiakin virheitä. Käyttölupahakemuksen kiireellisyyttä on ehdotetun etusijan selvärajaisuuden vuoksi arvioitava objektiivisin kriteerein, kuten Tilannehuoneen tapauksessa tehtiin (tutkimuksen merkitys kriisinratkaisussa). Koska ehdotus olennaisilta osin liittyy eduskunnan tietoaineistotarpeiden tyydyttämiseen, sen ei katsota olevan vastoin SEUT 338 artiklan 2 kohdassa eikä EU:n tilastoasetuksen 2 artiklan 1 b kohdassa säädettyä puolueettomuusperiaatetta eikä siten myöskään vaarantavan luottamusta tilastojen puolueettomuuteen ja objektiivisuuteen.

Tilastokeskuksen toimintaedellytysten välilliseksi vahvistamiseksi ja tiedonkeruun edellytysten parantamiseksi ehdotetaan muutettavaksi myös tilastolakia, jotta tilastokeskuksen tiedonsaantioikeudet tietojen keräämiseksi tilastointitarkoitukseen eräiltä muilta viranomaisilta laajenevat maksu- ja velkatietoihin ja varhaiskasvatuksen henkilötietoihin sekä hyvinvointialueiden ja hyvinvointiyhtymien viranomaisilta saataviin tietoihin ja yhteystietoihin. Samalla ehdotukset lisäävät edellytyksiä tilastokeskuksen keräämien tietojen välittämiseen tutkija- ja viranomaisyhteisölle. Lisäksi ehdotetaan asiakirjajulkisuuden lisäämistä tilastolaissa laajentamalla valtion ja kunnan viranomaisiin kohdistuva salassapitovelvollisuuden poikkeus koskemaan myös kuntayhtymien, hyvinvointialueiden ja hyvinvointiyhtymien viranomaisia.

4.2 Pääasialliset vaikutukset

Esityksellä ei ole välittömiä vaikutuksia kotitalouksiin, yrityksiin, ympäristöön eikä sukupuolten väliseen tasa-arvoon. Sen sijaan välillisiä vaikutuksia voi syntyä etenkin tutkimustiedon kautta siksi, että tilastokeskus voi tarjota nykyistä aikaisemmin ja enemmän sekä nykyistä kattavampia ja parempia aineistoja tutkija- ja viranomaisyhteisön käyttöön.

TK-lain luonne suppeana hallinnollisena säädöksenä ehdotetaan pääosin säilytettäväksi. TK-laki koskee tilastoviranomaisista vain tilastokeskusta ja yleispiirteisyydessään sallii tilastokeskukselle laajat oikeudet käsitellä tilastointitarkoitukseen sekä muilta rekisterinpitäjiltä että yksityisen sektorin tiedonantajilta kerättyjä tietoja. Lisäksi tilastolaki antaa mahdollisuuden kerätä tilastointitarkoitukseen sopimusperusteisesti tietoaineistoja yksityiseltä sektorilta sekä muilta rekisterinpitäjiltä että yksityisen sektorin tiedonantajilta. Koska tilastokeskus on valtion tilastotoimen yleisviranomainen, sen toimintaan kuuluu useita rooleja esimerkiksi rekisterinpitäjänä, henkilötietojen käsittelijänä, käyttölupaviranomaisena ja aineistojen säilyttäjänä. Tilastokeskuksen näihin muihin rooleihin, joiden perusteella saaduista aineistoista voidaan muodostaa valmisaineistoja, ei ehdoteta muutoksia, vaan vain tutkija- ja aineistopalvelun asemaa ehdotetaan selkeytettäväksi. Toisaalta tilastolain muitakin tilastoviranomaisia säänteleviin toimintaperiaatteisiin ei ehdoteta merkittäviä poikkeuksia. Esityksen ei näistä syistä oleteta heikentävän tiedonantajien luottamusta tilastokeskusta kohtaan, koska tietosuojaa koskevia vaatimuksia noudatetaan. Päinvastoin, ehdotusten arvioidaan lisäävän tiedonantajien luottamusta, kun tietoja käytetään järkevämmän politiikan tekemiseen.

Ehdotus valtioneuvostolle ja sen ministeriöille osoitettavasta etusijasta merkitsee vähäistä poikkeusta viranomaisten välisen tasapuolisen kohtelun vaatimuksesta. Valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien tutkimustarkoitukseen olennaisesti liittyvien käyttölupahakemusten etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden saattaa kuitenkin toisinaan hidastaa muun viranomaisyhteisön käyttölupahakemusten käsittelyä. Etusija ei sen sijaan vaikuta eduskunnan, eduskunnan valiokuntien eikä eduskunnan alaisten virastojen (Kela, SP ja VTV) mahdollisuuksiin saada tietoja tilastokeskuksesta. Etusija ei myöskään vaikuta eduskunnan valiokuntien, kuten tarkastusvaliokunnan ja tulevaisuusvaliokunnan tutkimuksiin, jotka toteutetaan yleensä yliopistojen, tutkimuslaitosten ja ministeriöiden alaisten viranomaisten kiireellisinä yhteishankkeina. Sen sijaan valtioneuvoston ja sen ministeriöiden tietoaineistotarpeiden etusija vahvistaa välillisesti myös eduskunnan asemaa.

Kiireellisyydellä voi olla välillisiä vaikutuksia muihin viranomaisiin, jotka välittävät tilastoaineistoja tilastokeskukselle ja joiden lakisääteisten tehtävien toteuttaminen voi viivästyä. Toisaalta viivästyksen käsittely on osaksi tutkijoiden vastuulla. Kiireellinen tietopyyntö voi myös kohdistua aineistoon, jota ei ole vielä luovutettu tilastokeskukselle tilastointitarkoitukseen tai aineistoon, jonka luovuttamisesta tutkija- ja aineistopalvelun kautta vastaa toinen viranomainen rekisterinpitäjänä tai aineisto-omistajana. Tietojen saaminen niitä pyytävän tahon käytettäväksi edellyttää käytännössä tietopyynnön käsittelyn kiirehtimistä myös näissä viranomaisissa.

Taloudelliset vaikutukset, joita käsitellään tarkemmin jäljempänä jaksossa 11.2, liittyvät tilastokeskuksen toiminnan rahoitukseen osaksi valtion talousarvion kautta (budjettirahoitus) ja toissijaisesti osaksi tilastokeskuksen tarjoamien maksullisten palvelujen tuottamilla tuloilla (yhteisrahoitus). Tilastokeskuksen saamista tuotoista osuus valtion virastoilta ja laitoksilta oli 44 % vuonna 2019, 37 % vuonna 2020 ja 30 % vuonna 2021 kaikista tuotoista. Maksullisesta toiminnasta vastaavat osuudet olivat vuonna 2019 51 %, vuonna 2020 45 % ja vuonna 2021 37 %. Laskelma sisältää myös tässä esityksessä tutkimuslaitoksiksi luokiteltujen SP:n, VATT:n ja THL:n käyttölupahakemukset, joihin nähden valtioneuvoston ja sen ministeriöiden käyttölupahakemuksille ei esityksessä kuitenkaan ehdoteta etusijaa.

5 Muut toteuttamisvaihtoehdot

5.1 Vaihtoehdot ja niiden vaikutukset

Tilannehuone ja Datahuone

Tilannehuoneen toiminnan aikana on laajemminkin noussut esiin pohdintaa toiminnan vakiinnuttamisesta osaksi normaaliajan päätöksentekojärjestelmän tukea. Yhteiskunnallista päätöksentekoa tukemaan VM tilasi 3.2.2021 allekirjoitetulla hankintapäätöksellä Helsinki GSE:ltä selvityksen vaihtoehdoista, joilla väliaikaiseksi ratkaisuksi tarkoitetun Tilannehuoneen hyödyllisiksi osoittautuneita toimintamahdollisuuksia voidaan koronaepidemian jälkeen vakiinnuttaa osaksi normaaliajan toimintaa. Selvityksessä Helsinki GSE:n tuli tuottaa esitys vaihtoehtoisiksi malleiksi, joilla Tilannehuoneen toiminta voidaan siirtää palvelutoiminnaksi julkisen hallinnon organisaatioon. Mallin tuli sisältää (i) esitys toimista, joilla aineistojen hyödyntäminen politiikan valmistelun ja tutkimuksen näkökulmasta varmistetaan, sekä (ii) esitys siitä, miten varmistetaan Tilannehuoneessa syntyneen datan jatkokäyttö, tarvittava täydentyminen ja käyttömahdollisuuksien laajentaminen koko tutkija- ja viranomaisyhteisölle.

Huhtikuussa 2021 valmistuneessa selvityksessään Helsinki GSE esitti Datahuoneen perustamista, joka olisi rakentunut Helsinki GSE:n, tilastokeskuksen ja VATT:n yhteistyönä. Datahuoneen palveluja olisivat muun muassa yhteiskunnallista päätöksentekoa tukevat pikaselvitykset ja joustava tilastotuotanto. Datahuoneen palvelut olisi suunnattu muun muassa ministeriöille, eduskunnan valiokunnille ja muille julkisen sektorin toimijoille. Datahuoneen toimijoiden vastuut olisivat jakautuneet siten, että tilastokeskus vastaisi Datahuoneen teknisestä infrastruktuurista sekä datan hankinnasta ja peruskäsittelystä ja VATT puolestaan datapohjaisesta selvitystuotannosta, kun taas Helsinki GSE olisi Datahuoneen dataa hyödyntämällä tehnyt akateemista tutkimusta ja tukenut Datahuoneen toiminnan laatua. Datahuoneen toimintaa olisi koordinoinut johtoryhmä, joka olisi muodostunut Helsinki GSE:n ja ministeriöiden edustajista.

Datahuoneen lisäksi Helsinki GSE:n selvityksessä esitettiin tilastokeskuksen tutkijapalvelun ajantasaistamista palvelemaan laajempaa tieto-, analyysi- ja tutkimustarvetta. Tutkijapalvelun ajantasaistaminen olisi sisältänyt tutkimuskäytössä olevien aineistojen laajamittaisen muuttamisen nopeasti käyttöön otettaviksi valmisaineistoiksi, näiden valmisaineistojen muuttamisen jatkuvasti ajantasaisiksi ja lupaprosessien sujuvoittamisen sellaisiksi, että aineistojen käyttöön oikeutetut tutkijat olisivat saaneet aineistot käyttöönsä muutamassa viikossa. Esitys olisi mahdollistanut näiden tavoitteiden toteuttamisen tilastokeskuksessa.

Helsinki GSE:n selvityksen tärkein rooli ja keskeisin hyöty valtioneuvoston päätöksenteon tukemisen näkökulmasta on korkealaatuisen akateemisen tutkimuksen tuottaminen politiikkarelevanteista aiheista. Tutkimusten tuloksia voidaan hyödyntää paitsi arvioitaessa jälkikäteen aikaisempia politiikkapäätöksiä myös uusien päätösten ennakkoarvioinnissa. Helsinki GSE:n selvityksessä VATT:lle suunniteltu keskeinen rooli nopeiden selvitysten tuottajana ei kuitenkaan olisi soveltunut erityisen hyvin VATT:n nykyisiin tehtäviin ja vahvuuksiin, ainakaan laajassa mittakaavassa toteutettuna. VATT:n rooli korkealaatuisen ja yhteiskunnallisen päätöksenteon näkökulmasta relevantin akateemisen tutkimustiedon tuottajana on siten pikemminkin syytä säilyttää ja vahvistaa sitä etenkin politiikkatoimien ennakkoarvioissa. Tässä yhteydessä tilastokeskuksen tutkijapalvelun kehittäminen ja aineistojen saatavuuden parantaminen voi tukea myös VATT:n mahdollisuuksia tehdä yhteiskunnallista päätöksentekoa hyödyttävää tutkimusta.

Valtioneuvoston näkökulmasta on muun muassa yhdenvertaisuuden ja yhteiskunnallisen kokonaisedun näkökulmasta tarkoituksenmukaista pyrkiä esityksellä laajentamaan datan käyttö- ja hyödyntämismahdollisuuksia kaikille tutkijoille, myös taloustieteen ulkopuolella.

Kokemukset Tilannehuoneen toiminnasta ovat olleet pääosin myönteisiä, joskaan erillispalvelun tarjoaminen yhdelle tiedontarvitsijalle ei vastaa vaatimusta tiedontarvitsijoiden mahdollisimman yhdenvertaisesta kohtelusta tutkija- ja viranomaisyhteisössä. Valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamille (esimerkiksi TEAS-hanketta koskeville) käyttölupahakemuksille esityksessä ehdotettu etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden saattaa vastaavasti toisinaan hidastaa muun viranomaisyhteisön käyttölupahakemusten käsittelyä. Tasapuolisen kohtelun kaksi ulottuvuutta ovat käsittelyn aikataulu (Tilannehuone – muut tiedontarvitsijat) ja käyttölupahakemuksen laajuus ja sisältö. Käyttölupaprosessissa tärkeä ratkaisu on esimerkiksi se, kuka saa mihinkin aineistoon mitäkin liitettäväksi ja kuka ei. Vain osalle käyttäjistä aineisto myönnetään etäkäytön ulkopuolelle, kun osalle käyttäjistä puolestaan on voitu kertoa, ettei näin toimita. Toiset saavat yhdistää työvoimatutkimukseen rekisteritietoja, toiset eivät. Esityksen 1. lakiehdotuksessa ja pyrkimyksessä tutkija- ja viranomaisyhteisön tiedontarvitsijoiden mahdollisimman yhdenvertaiseen kohteluun on otettu huomioon perustuslain 16 §:n 3 momentissa turvattu tieteen vapaus. Avoimen datan sääntely ei vaikuta salassapitoon, vaan avoimen datan direktiivi perustuu kansallisiin järjestelmiin tietojen saatavuudesta (access regimes), mikä Suomessa tarkoittaa julkisuuslakiin ja eräisiin erityislakeihin sisältyviä salassapitoperusteita, luovutusrajoituksia tai erilaisia luovutusedellytyksiä. Tieto on avoimen datan direktiivin soveltamisalassa vain, jos siihen ei lähtökohtaisesti kohdistu luovutusrajoituksia. Viranomaisen ei siis tarvitse pohtia, täyttääkö pyyntö jotkut edellytykset, vaan kansallisesti on tarpeen tarkastella lähinnä luovutettavissa olevaa yleisöjulkista tietoa.

Kokemukset Tilannehuoneesta ovat osoittaneet, että muutosten vieminen käytäntöön voi hyötyä merkittävällä tavalla rakenteesta, jossa jokin selkeästi nimetty taho edistää hyvien käytäntöjen toteutumista. Laajemmat yhteiskunnalliset tarpeet huomioon ottaen VM:ssä on arvioitu Helsinki GSE:n selvitystä lainvalmistelun edellyttämien analyysitoimintojen riippumattomuuden, substanssiosaamisen ja virkavastuun, valtioneuvoston päätöksentekoa tukevan valmistelutyön aikataulupaineen, tiedon hyödyntämisen ja valmistelun muun tosiasiallisen luonteen, VATT:n roolin, tutkija- ja viranomaisyhteisön mahdollisimman yhdenvertaisen kohtelun sekä yhteiskunnallisen kokonaisedun näkökulmasta. Lainvalmistelussa on tärkeää, että ministeriöissä on riittävä osaaminen lainsäädännön muutosten vaikutusarviointiin ja sitä tukevaan analyysityöhön. Tältä osin on tärkeää huolehtia valtioneuvoston oman analyysiosaamisen ylläpidosta ja yhteistyöstä. Yhteiskunnallista päätöksentekoa tukevan selvitystyön laaja ulkoistaminen pysyvästi (esimerkiksi Datahuoneelle) Helsinki GSE:n selvityksessä kuvatulla tavalla ei kuitenkaan ole mahdollista valtioneuvoston valmistelutyön nopeatempoisuuden, lainsäädännön valmistelussa tarvittavan substanssiosaamisen eikä virkavastuun näkökulmasta. Sen sijaan ministeriöiden oman analyysiosaamisen ja sen edellyttämien voimavarojen vahvistaminen tuo pitkäjänteisempää tukea lainvalmistelulle ja tiedon hyödyntämiselle yhteiskunnallisen päätöksenteon tukena. Helsinki GSE:n selvityksessä VATT:lle olisi annettu päävastuu nopeiden selvitysten tuottamisesta. Toteutuessaan tämä tehtävä muuttaisi VATT:n toiminnan suuntausta mahdollisesti merkittävästikin siitä, mikä se on viime vuosina ollut. VATT:n rooli, merkitys ja arvostus korkealaatuisen akateemisen tutkimuksen tuottajana on kasvanut, mikä ilmeni muun muassa edellisessä VATT:n toiminnan tieteellisessä arvioinnissa (https://vm.fi/-/vatt-n-tutkimus-on-korkeatasoista-mutta-paatoksenteon-tukemista-tulee-kehittaa).

Tilastokeskuksessa on sen strategista johtamista tukeva neuvottelukunta, josta säädetään valtioneuvoston asetuksessa tilastokeskuksesta (1063/2002, jäljempänä VN:n TK-asetus). Neuvottelukunnan jäsenillä odotetaan olevan näkemystä tilastokeskuksen strategian kannalta hyödyllisistä aihepiireistä. Jäsenten tausta vaihtelee strategian sisällön mukaan. Lisäksi tilastokeskuksessa toimivat muun muassa sisäinen tilastoeettinen lautakunta ja tietoprosessin ohjausryhmä.

Tutkijapalvelun palvelutason parantamiseksi saattaa olla tarpeen harkita voimavarojen käyttöä erikseen sekä perustaa vahva seuranta ja ohjaus tukemaan tilastokeskusta toimintatapojen uudistamisessa. Tämä on aktiivisen tulosohjauksen näkökulmasta perusteltua, koska oletettavasti kysymys on miljoonien eurojen investointiprojektista. Jo huomattavasti pienemmillä erityistoimenpiteillä (esimerkiksi mikrosimuloinnin perustaminen) on ollut erillisiä ohjausryhmiä. Myös VATT:n toiminnan luonne huomioon ottaen olisi luontevaa, että tällainen tutkija- ja aineistopalvelun käytännön toteutumista tukeva taho olisi valtioneuvoston ja sen ministeriöiden sekä tilastokeskuksen yhteinen, esimerkiksi VM:n johdolla toimiva kansallisen tilastolainsäädännön uudistuksen yhteydessä perustettava operatiivinen yhteistyöryhmä. Yhteistyöryhmä voisi tarvittaessa toimia tulosohjausta pohjustavana keskustelukanavana ja selvittää muun muassa mahdollisuuksia tilastoeettisen lautakunnan toiminnan, päätöksenteon ja perusteluasiakirjojen nykyistä suurempaan läpinäkyvyyteen tutkija- ja aineistopalvelun käyttäjien mahdollisimman yhdenvertaisen kohtelun varmistamiseksi. Perustettava yhteistyöryhmä ei olisi päällekkäinen neuvottelukunnan eikä tilastokeskuksen sisäisten toimielinten kanssa, vaan se olisi enemmän operatiivisen tason ryhmä. Ryhmän pääasiallinen tehtävä olisi varmistaa ehdotetun tutkija- ja aineistopalvelun käytännön toteutuksen onnistuminen eikä se välttämättä olisi pysyväisluonteinen. Ryhmä jatkaisi tammikuussa 2020 aloittaneen VM:n, OKM:n, Helsinki GSE:n, VATT:n ja tilastokeskuksen välisen, VM:n johtaman ja kesäkuussa 2020 raporttinsa julkistaneen Spolanderin työryhmän työtä, jonka raportissa etsittiin ratkaisuja siihen, miten tilastokeskuksen tutkijapalvelu pystyy vastaamaan tutkijoiden ajankohtaisiin tietoaineistotarpeisiin hyväksyttävässä ajassa.

Elokuussa 2021 on VNK:n, VM:n, VATT:n ja tilastokeskuksen välisissä neuvotteluissa sovittu, että toiminta on tarkoituksenmukaista järjestää tasapuolisesti tutkijapalvelun kautta siten, että kaikilla halukkailla on mahdollista perustaa analytiikkahuoneita. Keskusteluissa on sittemmin määritelty hankkeen lyhyen aikavälin tavoitteet: (i) ministeriöitä tukevan jatkuvan raportoinnin tuottaminen ja ministeriöiden kanssa dialogissa tapahtuva raportoinnin kehittäminen, (ii) tuki yksittäisten datalla tuettavien päätöksentekotilanteiden seulomiselle valituissa tilanteissa, sekä (iii) tuki ministeriöiden oman kapasiteetin kehittämiselle ja työnjaon suunnittelun mahdollistamiselle keskitetyn ja hajautetun analyysitoiminnan välillä. Kun Tilannehuoneessa Helsinki GSE:n kapasiteetilla on tuettu yksittäisiä tilanteita, Datahuoneelle on suunniteltu laajempaa ja pysyvää kapasiteettia, jolloin kattavampi yhteiskunnallisen päätöksenteon tuki on mahdollista. Keskustelut suunnitellun toiminnan rahoituksesta jatkuvat ministeriöiden kesken.

Datahuoneelle suunniteltu rakenne on pyritty ottamaan esitystä laadittaessa huomioon, jolloin tutkija- ja viranomaisyhteisölle on kummallekin oma analytiikkahuoneensa. Vaikka osaa tutkimuslaitoksista voidaan pitää myös viranomaisina, esimerkiksi nykyisen tutkijapalvelun kolmen suurimman käyttäjän joukkoon yhdessä Helsinki GSE:n ja Aalto-yliopiston kanssa kuuluvat VATT ja THL luokitellaan esityksessä tutkimuslaitoksiksi eikä viranomaisiksi, jolloin valtioneuvostolle ja sen ministeriöille ehdotettu etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden ei vaikuta niiden tiedonsaantioikeuksiin tilastokeskuksesta.

VM:ssä 24.1.-31.5.2022 toiminut työryhmä on kiireellisenä toimeksiantona selvittänyt, miten nykyistä joustavamman ja laajemman hallinnollisten rekisteriaineistojen hyödyntämisen ja data-analyysin avulla voitaisiin tukea tietoon perustuvaa päätöksentekoa. Lisäksi työryhmä on kartoittanut, millaisia data-analyysista hyötyviä tietoaineistotarpeita ministeriöillä on ja miten nopeasti niihin voitaisiin vastata. Taustalla on keväällä 2020 koronaepidemian vuoksi perustettu koronatalouden tutkimusryhmä (Tilannehuone), jossa analysoitiin dataa yhteiskunnallisen päätöksenteon tueksi. Tilannehuoneen toiminta on pohjautunut osin koronaepidemiasta johtuviin poikkeuslupiin, ja sen toiminnan aikana nousi tarve selvittää vastaavan data-analyysitoiminnan mahdollisuuksia osana normaaliajan päätöksenteon tukea. Työryhmä kartoitti toteuttamisvaihtoehtoja Tilannehuoneen oppeja hyödyntävälle datahuone-pilotille sekä tutki, mikä toimija valtionhallinnon sisällä voisi olla vastuussa pilotoitavan datahuoneen käytännön toiminnasta. Alustavasti ongelmiksi on tunnistettu epäyhtenäiset viranomaiskäytännöt käyttölupahakemusten käsittelyssä ja myöntämisessä, etenkin tietosuojasääntelyn soveltamisessa ja viranomaisten välisissä sopimusjärjestelyissä. Tilastolainsäädäntö asettaa toisaalta tietosuojalainsäädäntöä tiukempia velvollisuuksia tilastointitarkoituksiin kerättyjen tietojen käsittelyyn ja luovuttamiseen.

Tilannehuoneen asemasta on äskettäin keskusteltu myös eduskunnassa yritysten määräaikaisesta kustannustuesta annetun lain (508/2020, HE 9/2022 vp) muuttamista koskeneen lain talousvaliokuntakäsittelyssä. 1 Vastauksena eduskunnan lausumaan Datahuonetyöryhmä on alustavasti ehdottanut, että data-analyysitoimintaa pilotoitaisiin vuosina 2023-2025 VATT:n yhteyteen perustettavassa erillisyksikössä. Ketterän ja erilaisiin tietotarpeisiin nopeasti vastaamaan kykenevän toiminnan takaamiseksi lakiin Valtion taloudellisesta tutkimuskeskuksesta (27/1990, VATT-laki) kirjattaisiin työryhmän alustavan ehdotuksen mukaan riittävä viranomaisen tiedonsaantioikeus tehtävän suorittamiseksi. Lainmuutokset olisivat keskeinen edellytys jatkuvan toiminnan mahdollistamisen näkökulmasta. Data-analyysitoiminnan edellyttämän tietoinfrastruktuurin toteuttamisessa hyödynnettäisiin tilastokeskuksen Fiona-etäkäyttöjärjestelmää. Pilotin toiminnan koordinoimiseksi perustettaisiin valtioneuvoston eri ministeriöiden edustajista sekä pilotin ja tilastokeskuksen edustajista koostuva ohjausryhmä. Pilotin toiminnasta ja mahdollisista muutostarpeista tuotettaisiin väliraportti ensimmäisen vuoden jälkeen ja loppuraportti pilotin päättymisen yhteydessä.”

Valtioneuvoston etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden

Valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien (esimerkiksi TEAS-hanketta koskevien) käyttölupahakemusten asettaminen etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden nojautuu tilastolain 3 §:n viimeiseen virkkeeseen. Etusijalle asettamisen yhtenä, joskin tilastokeskukselle asetetun ammatillista riippumattomuutta koskevan vaatimuksen vuoksi vain etäisenä esikuvana on verotustietojen julkisuudesta ja salassapidosta annetun lain (1346/1999) 16 §, joka koskee Verohallinnon velvollisuutta antaa VM:lle salassa pidettäviä verotietoja verolainsäädännön ja valtion talousarvion laadintaa varten. Salassa pidettävien verotietojen käyttö kuuluu kiinteästi verolainsäädännön valmisteluun. Säännös Verohallinnon tiedonantovelvollisuudesta on joustavoittanut menettelyjä ja mahdollistanut tietojen saannin ilman erillistä julkisuuslain 28 §:n mukaista lupamenettelyä. Toisaalta se ei näytä vastaavan tilastokeskukselta edellytettyä ammatillista riippumattomuutta siinä laajuudessa, johon SEUT 338 artiklassa viitataan, minkä vuoksi verotietoja ei sellaisenaan voida rinnastaa tilastoaineistoon. Toinen VM:n hallinnonalan esimerkki viranomaisen oikeudesta laajasti luovuttaa salassapitosäännösten estämättä tietoja on Finanssivalvonnasta annetun lain (878/2008) 71 §. Esityksessä ehdotettu etusija ei kuitenkaan poikkea tutkija- ja viranomaisyhteisön tiedontarvitsijoiden tasapuolisesta kohtelusta palvelun hinnoittelussa, sillä valtioneuvosto ja sen ministeriöt maksavat palvelusta saman, valtion maksuperustesääntelyyn perustuvan hinnan kuin muutkin tiedontarvitsijat.

Tehtävien tärkeysjärjestyksestä, johon ehdotus valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien käyttölupahakemusten asettamisesta etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden osaltaan liittyy, on puolestaan rinnakkaisena esimerkkinä laki Kilpailu- ja kuluttajavirastosta (661/2012), jonka 7 §:n mukaan ”viraston kuluttaja-asioissa ja kuluttaja-asiamiehen on erityisesti toimittava aloilla, joilla on kuluttajien kannalta huomattavaa merkitystä tai joilla voidaan olettaa yleisimmin esiintyvän ongelmia kuluttajan asemassa”. Vastaavalla tavalla valtioneuvoston ja sen ministeriöiden mainittu etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden on perusteltu kiireellisten finanssi-, elinkeino- ja talouspoliittisten hankkeiden ajankohtaisiin tietoaineistotarpeisiin vastaamiseksi erityisesti VM:ssä ja TEM:ssä.

Tilastokeskus rekisterinpitäjänä ja henkilötietojen käsittelijänä

Esityksen yhtenä lähtökohtana on, että tilastokeskus on rekisterinpitäjä tilastointitarkoitukseen keräämiinsä tietoihin sekä henkilötiedon käsittelijä tutkija- ja aineistopalveluun vastaanottamiinsa tietoihin, jolloin tilastokeskus toimii sopimuspohjaisesti muiden rekisterinpitäjien lukuun henkilötietojen käsittelijänä ja käyttölupaprosessi säilyy muilla rekisterinpitäjillä. Sopimuspohjaiset järjestelyt edellyttävät, että rekisterinpitäjät pääsääntöisesti suostuvat juokseviin käyttölupiin, jolloin aineistokokonaisuutta voidaan sujuvasti päivittää eikä jokaiselle uudelle aineistokuukaudelle tarvita uutta käyttölupaa. Jälkimmäinen menettelytapa aiheuttaisi kömpelyyttä ja neuvottelukierroksia käyttöluvista jokaiselta relevantilta viranomaiselta, mikä hidastaisi uusien aineistojen käyttöönottoa valmisaineistokatalogeissa.

Valmistelun yhteydessä on noussut esiin tarve selvittää tilastokeskuksen erilaisia rooleja. Mahdollisuutta määritellä laintasoisesti näitä rooleja on tarkoitus käsitellä tarkemmin kansallisen tilastolainsäädännön tätä esitystä seuraavassa jatkovalmistelussa. Alustavasti on tunnistettu kaksi vaihtoehtoa: (i) tilastokeskus olisi itse rekisterinpitäjä, jolloin ilmeisesti täytyisi toisiolain 6 §:n mukaisesti määritellä laissa tietosisällöt, joita sillä on oikeus käsitellä; (ii) tilastokeskus tuottaisi rekisteriseurantaa (tilannekatsauksia), jolloin se olisi oikeutettu keräämään tietoja tilastolain 14 §:n nojalla.

Vaihtoehdossa (i) on olennaista, miten tarkkaan tietosisällöt olisi määriteltävä. Toisiolain 6 §:ssä on hyvin laveitakin määritelmiä (esimerkiksi 5 kohta, joka koskee kaikkia sote-asioita). Vaihtoehdossa (ii) toimittaisiin Tilannehuoneen tavoin, jolloin tilastokeskus voisi perustaa uusia rekisteriseurantoja sekä tilastolain nojalla kerätä aineistot ja luovuttaa niitä eteenpäin. Käytännössä ongelmana olisi osata aina määritellä rekisteriseuranta niin, että pyydettävä aineisto olisi tutkimus- ja selvityskäytön näkökulmasta hyvin kattava. Esimerkiksi tilastointitarkoitukseen kerättävistä etuusrekisteritiedoista ei synny varsinaisia maksujaksoja, koska tilastointi tyytyy usein vuositason eurotietoihin.

5.2 Ulkomaiden lainsäädäntö ja muut ulkomailla käytetyt keinot

Esitystä valmisteltaessa on vertailtu erityisesti tilannetta muissa pohjoismaissa. Suomen tilastolainsäädäntöön ehdotettua tutkija- ja aineistopalvelua vastaava sääntely on Ruotsissa säädetty laissa virallisista tilastoista (Lag (2001:99) om den officiella statistiken, 16 ja 17 §), Norjassa tilastointia ja tilastovirastoa koskevassa laissa (Lov om offisiell statistikk og Statistisk sentralbyrå (statistikkloven), 14 §) sekä Tanskassa tilastovirastoa koskevassa laissa (Lov om Danmarks Statistik BK nr 610 af 30/05/2018 (Gældende), 1 §, stk 3-4), joka sisältää myös yleisen tilastotointa koskevan sääntelyn. Tilastolainsäädännön rakenne on pohjoismaissa keskenään erilaista. Muiden pohjoismaiden kansallisessa tilastolainsäädännössä tutkijapalvelut koskevat käytännössä vain tilastointitarkoitukseen kerättyjen tietojen tutkimuskäyttöä, mikä mahdollistaa sen, että tilastoviranomaiset voivat keskenään vaihtaa tilastointia varten keräämiään tietoja tarjotakseen tutkijapalvelua. Käytännössä tämä on järjestetty niin, että tilastovirastot tarjoavat muidenkin tilastontuottajien tutkimusaineistoja tutkijapalvelunsa kautta.

Pohjoismaisissa tilastolaeissa on mahdollistettu se, että tilastovirasto voi yhdistellä, asiakkaan toimeksiannosta, hallitsemiinsa aineistoihin muitakin rekisteritietoja, joihin asiakas on muutoin kuin tilastolainsäädännön kautta saanut käyttöoikeuden. Yhdistely kuitenkin tapahtuu aina asiakkaan pyynnöstä eikä tilastovirastoille ole säädetty tehtäväksi ylläpitää yleiskäyttöisiä tietovarantoja, jotka sisältävät muutakin tietoa kuin tilastointitarkoitukseen saadut aineistot ja joista käyttäjiä voidaan palvella joustavammin.

Suomen, Tanskan ja Norjan tilastovirastot eivät fyysisesti luovuta pseudonymisoitua aineistoa tutkijoille eivätkä muille viranomaisille, vaan aineistojen käyttö tapahtuu suojatussa käsittely-ympäristössä, josta käyttäjä ei voi siirtää aineistoja pois. Ruotsin tilastovirasto voi eräissä tilanteissa luovuttaa pseudonymisoitua aineistoa edelleen julkisen sektorin organisaatioille, joiden tehtäväksi on säädetty tilastointi tai tutkimus.

Kaikkien pohjoismaiden tilastovirastoissa on keskitetty yksikkö, joka tarjoaa aineistopalveluja tutkijoille. Tilastoviraston lisäksi Tanskassa ja Suomessa on sosiaali- ja terveysalaa koskevalla lainsäädännöllä perustettu erillinen tutkijapalvelu sosiaali- ja terveysalan tutkimusta varten (Suomessa Findata).

Tutkimusaineistoihin pääsy perustuu tutkimussuunnitelman perusteella myönnettävään käyttölupaan. Lisäksi kaikki pohjoismaiset tilastovirastot rajoittavat tutkimusaineistoihin pääsyä tilastojen julkistamiseen perustuvien säännösten nojalla niin, ettei tilastoalan perusperiaatteissa eikä SEUT 338 artiklan 2 kohdan tai EU:n tilastoasetuksen 2 artiklan 1 b kohdan puolueettomuusperiaatteessa säädettyä käyttäjien tasapuolista kohtelua vaaranneta. Norjan tilastolaissa tämä harkintavelvollisuus on kirjattu kansalliseen tilastolakiin. Suomessa harkintavelvollisuus perustuu, EU:n tilastoasetuksen lisäksi, julkisuuslain 24 §:n 1 momentin 13 kohtaan, jossa velvoitetaan salassa pidettäväksi kansantalouden kehitystä kuvaava tilasto, jolla voi olla vaikutusta pääoma- ja rahoitusmarkkinoilla, ennen kuin tiedot on saatettu lain 8 §:ssä tarkoitetulla tavalla yleisesti julkisiksi.

Muissa pohjoismaissa on pyritty selvittämään rekisteritietojen tutkimuskäytön järjestämisessä tunnistettuja ongelmia ja ratkaisuja. Ruotsin opetusministeriö (utbildningsdepartementet) asetti vuonna 2013 selvityshenkilön arvioimaan rekisteriaineistojen tutkimuskäytön parantamista. Selvityksen tulos, ”Unik kunskap genom registerforskning” (SOU 2014:45), julkaistiin vuonna 2014. Selvityksen mukaan keskeinen ongelma tutkimusaineistojen saatavuuden parantamiseksi ei ole tietosuojaan tai tietojen käyttöön liittyvä lainsäädäntö vaan pikemminkin se, että tutkimusaineistojen tarjoamista ei ole riittävästi priorisoitu rekisteriviranomaisia koskevassa lainsäädännössä vaan se on rekisteriviranomaisille, mukaan lukien tilastoviranomaiset, toissijainen tehtävä. Raportissa on joukko ehdotuksia rekisteriviranomaisia koskevien lakien muuttamiseksi. Tilastotointa koskevat ehdotukset on toteutettu vuonna 2018. Selvitys on tehty ennen kuin tietosuoja-asetus tuli voimaan. Tietosuoja-asetus ei kuitenkaan merkittävästi vaikuta selvityksen johtopäätöksiin ja toimenpide-ehdotuksiin viranomaisten työnjaosta ja prioriteeteista.

Tanskan tilastoviraston tutkimuspalvelulla on neljä eri erikoisohjelmaa yksikkötasoisten aineistojen luovuttamiselle: (i) tutkijaohjelma, (ii) ministeriöohjelma, (iii) lakimalliohjelma ja (iv) tietovaranto-ohjelma. Tilastoviraston on tilastotuotannon lisäksi koottava tilastopalveluja ministeriöiden, paikallis- ja alueneuvostojen sekä muiden viranomaisten ja laitosten pyynnöstä lainsäädännön analysointia ja budjettirahoituksen kohdentamista varten. Lisäksi tilastoviraston on asetettava aineistoja saataville tilastollisia analyyseja ja tieteellisiä tutkimuksia varten. Tilastoviraston keräämiä tietoja käytetään vain tilastointiin tai tieteellisiin tutkimuksiin. Yksikkötasoisten tietojen luovuttaminen muille julkisille organisaatioille on myös mahdollista. Tilastoviraston erikoisohjelmien kautta saatuja aineistoja ei saa käyttää hallinnollisiin päätöksiin eikä jatkuvaan tilastotuotantoon, ellei asiasta ole erikseen sovittu. Lakimalliohjelma vastaa Suomessa tilastokeskuksen mikrosimulointimallia. Ministeriöohjelma on perustettu, jotta ministeriöt ja virastot voivat etäkäyttöjärjestelmän kautta nopeasti ja tehokkaasti vastata poliittisen järjestelmän kysymyksiin vastuualueellaan ja saada käyttöön pseudonymisoituja aineistoja tutkimusta ja analyyseja tekeviä muita tahoja joustavammin. Ministeriön tiedonsaantioikeus koskee tietoja, joiden arvioidaan olevan relevantteja ministeriön tekemiä ad hoc -selvitys- ja tutkimushankkeita varten seuraavan vuoden aikana. Ministeriöiden ei tarvitse laatia erillisiä projektikuvauksia ja käyttölupahakemuksia, vaan käyttäjille myönnetään sopimuksessa yleinen käyttöoikeus koko tietopakettiin, josta neuvotellaan vuosittain. Ministeriöt raportoivat vuosittain siitä, mitä aineistoja on käytetty, minkä jälkeen sopimuksesta poistetaan aineistot, joille ei ole ollut käyttöä. Lisäksi on mahdollista yhdistellä ministeriöiden ja muiden viranomaisten aineistoja tilastoviraston aineistoihin tietosuojavaltuutetun ja toisen viranomaisen luvalla. Ministeriöohjelmasta ei ole erikseen säädetty, vaan se perustuu tilastoviraston kehittämään toimintamalliin.

Norjan tilastolaissa on kaksi valtiovarainministeriölle (finansdepartementet) osoitettua asetuksenantovaltuutusta, joista toisen perusteella on säädetty, että myös kunnat ja valtion viranomaiset voivat saada tilastoaineistoja tutkimustarkoituksiin. Toista asetuksenantovaltuutusta ei ole käytetty, vaan on odoteltu uudistuneen tilastolainsäädännön soveltamiskokemuksia ja valtion viranomaisten tietoaineistotarpeiden tarkempaa jäsentymistä. Pilottina on ollut työ- ja hyvinvointihallinnon palveleminen tiedolla sosioekonomisista taustamuuttujista, kuten koulutukseen ja työttömyyteen liittyvällä tilastoaineistolla. Asetuksella on yksityiskohtaisesti säädetty tilastoviraston palvelujen hinnoittelusta, kuten Suomessakin. Yksi keskeisistä vaatimuksista on tasapuolisuus ja kielto tuottaa kenellekään suhteetonta etua muihin osapuoliin nähden. Norjan tilastovirasto on julkistanut asiaa koskevan ohjeistuksensa (guidelines).

Valtioneuvoston ja sen ministeriöiden kiireellisiksi ilmoittamien käyttölupahakemusten etusijasta valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden on pyritty seuramaan muiden pohjoismaiden esimerkkiä.

Esityksessä laajasti huomioon otetun EU-sääntelyn lisäksi Suomella on myös tilastotointa koskevia kansainvälisiä sitoumuksia, kuten (i) YK:n tilastotoimen periaatteet, (ii) YK:n periaatteissa viitattu Kansainvälisen tilastoinstituutin (ISI, International Statistical Institute) ammattietiikkajulistus, (iii) tilastokeskuksen julkistamisperiaatteet, joissa on myös perusteltu sitä, milloin aineistoja voidaan toimittaa ennen julkistusta, (iv) tilastokeskuksen tietosuojaperiaatteet, ja (v) YK:n tietosuojaperiaatteet ja suuntaviivat.

Komissiosta saadun alustavan tiedon mukaan EU:n tilastoasetusta on tarkoitus ehdottaa uudistettavaksi vuonna 2022. Jäsenvaltioiden kansallisten tilastoviranomaisten keskinäiset keskustelut asiasta alkoivat tammikuussa 2022 ja komission julkinen konsultaatio vaikutusarvioiden laatimiseksi helmikuussa 2022 (Euroopan tilastojärjestelmän mukauttaminen tulevaisuuden vaatimuksiin). Uudistuksessa otetaan huomioon tilastotoimen kannalta EU:n datahallintosäädöksen ja 23.2.2022 annetun EU:n Data Act -asetusehdotuksen (Proposal for a Regulation of the European Parliament and of the Council on harmonised rules on fair access to and use of data (Data Act)) sisältö. Tavoitteena on parantaa yksityisen sektorin hallussa olevan datan käyttömahdollisuuksia tilastoinnissa ja selkeyttää valtion tilastotoimen roolia hallinnollisten rekisteriaineistojen käsittelyssä ja hallinnassa.

6 Lausuntopalaute

Luonnos hallituksen esitykseksi lähetettiin lausunnoille 3.12.2021 ja lausuntoaika päättyi 14.1.2022. Lausunnot saatiin 37 taholta niiltä kaikkiaan 70 taholta, joille lausuntopyyntö lähetettiin. Lausunnon antoivat oikeusministeriö OM, opetus- ja kulttuuriministeriö OKM, sisäministeriö, sosiaali- ja terveysministeriö STM, työ- ja elinkeinoministeriö TEM, ulkoministeriö, ympäristöministeriö, Kela, Suomen Pankki SP, Valtiontalouden tarkastusvirasto VTV, CSC – Tieteen tietotekniikan keskus Oy, Eläketurvakeskus ETK, Kansallinen koulutuksen arviointikeskus Karvi, Kansallisarkisto, Luonnonvarakeskus Luke, Maahanmuuttovirasto Migri, Maanmittauslaitos, Opetushallitus OPH, Rahoitusvakausvirasto RVV, Suomen ympäristökeskus Syke, Tapaturmavakuutuskeskus, Terveyden ja hyvinvoinnin laitos THL, Tietosuojavaltuutetun toimisto, Tilastokeskus, Tulli, Tutkimuseettinen neuvottelukunta TENK, Tutkimuslaitosten yhteenliittymä Tulanet, Valtiokonttori, Verohallinto, professori Roope Uusitalo (Helsingin yliopisto), professori Otto Toivanen (Aalto-yliopisto ja Helsinki GSE), palvelupäällikkö Turkka Näppilä (Tampereen yliopisto), apulaisprofessori Leo Lahti (Turun yliopisto), Työn ja talouden tutkimus LABORE, Suomen Akatemia, Teknologian tutkimuskeskus VTT Oy ja Valtion taloudellinen tutkimuskeskus VATT.

Lausunnoissa kannatettiin laajasti luonnosta hallituksen esitykseksi. Lausuntopalautteen keskeisiä aiheita olivat tietosuojan käsittelyn syventämistarve, valtioneuvoston ja sen ministeriöiden etusijan mahdolliset ongelmat, tutkija- ja aineistopalvelun resursointitarve, tilastokeskuksen ankarat ja tutkimuksen edellytyksiä rajoittavat tulkinnat EU-sääntelystä ja tilastolaista, vaikutusarvioiden ja toiminnan tavoitteiden toteutumista koskevien mittarien täydentämistarve, varhaiskasvatuksen yksityisten palveluntuottajien, jotka voivat olla yrityksiä, yhteisöjä, säätiöitä tai yksityisiä elinkeinonharjoittajia, ja tietoliikenneoperaattorien tiedonantovelvollisuus, laintasoisten uusien määritelmien tarve ja useat lakitekniset huomiot tarkkarajaisten muotoilujen tarpeesta säännösehdotuksissa. Lisäksi kiinnitettiin huomiota kokonaisarvioinnin tarpeeseen valtiokonsernissa tarpeettomien tietojärjestelmäinvestointien aiheuttamien kustannusten välttämiseksi ja tavoitetilaltaan yhtenäisen tutkimuspalvelun infrastruktuurin ja tutkimusekosysteemin aikaansaamiseksi sekä tilastokeskuksen kasvavia tiedonsaantioikeuksia tasapainottavaan tiedonvaihdon vastavuoroisuuteen eli siihen, että tilastokeskuksella olisi myös oikeus ja velvollisuus tehdä yhteistyötä muiden valtion laitosten, kuten eräiden tutkimuslaitosten, kanssa ja luovuttaa näille tietoja, joita ne tarvitsevat omien lakisääteisten tehtäviensä hoitamiseen. Lausuntopalaute on pääosin pyritty ottamaan huomioon, joskin osa palautteesta koskee aiheita, joita on tarkoitus käsitellä tämän esityksen jatkovalmistelussa. Erityistä huomiota on 1. lakiehdotuksessa kiinnitetty tietosuoja-asetuksen edellytyksiin riskiperusteisesta lähestymistavasta ja sen mukaisesti tietojen käsittelyn aiheuttamiin uhkiin ja riskeihin. Tietosuojan sääntelyn syventämistä koskeneissa neuvotteluissa OM:n, STM:n, Tietosuojavaltuutetun toimiston ja tilastokeskuksen kanssa on erityisesti käsitelty tilastokeskuksen roolia tilastointitarkoituksiin kerätyn aineiston sekä tutkija- ja aineistopalvelua varten vastaanotettujen tietojen henkilötietojen käsittelijänä ja rekisterinpitäjänä, valmisaineistojen muodostajana ja säilyttäjänä. Luonnosta hallituksen esitykseksi on myös täydennetty lukuisin esimerkein, tarkemmalla selvityksellä lakiehdotusten suhteesta tietosuoja-asetukseen sekä esityksen säätämisjärjestysperusteluja selvityksellä riittävistä reunaehdoista henkilötietojen luovuttamista koskevan edellytyksen välttämättömyydestä sekä arkaluonteisten tietojen luovuttamisesta ja tietojen käyttötarkoitussidonnaisuudesta poikkeamiselle asetettujen edellytysten suhteesta eduskunnan perustuslakivaliokunnan linjauksiin.

7 Säännöskohtaiset perustelut

7.1 Laki tilastokeskuksesta

TK-lakiin ehdotetaan lisättäväksi säännökset tilastokeskuksen tutkija- ja aineistopalvelusta. Esityksen keskeinen linjaus on suhtautuminen henkilötietojen käsittelyn lainmukaisuutta koskevaan tietosuoja-asetuksen 6 artiklaan. Tilastokeskus on tilastointitarkoituksiin kerätyn aineiston rekisterinpitäjä ja tutkija- ja aineistopalvelua varten vastaanotettujen tietojen rekisterinpitäjä silloin kun tiedoista muodostetaan tutkija- ja aineistopalvelussa säilytettävä valmisaineisto. Tilastokeskus on lisäksi tutkija- ja aineistopalvelua varten vastaanotettujen tietojen henkilötietojen käsittelijä, jos tilastokeskuksessa käsitellään tutkijan muuta aineistoa kuin valmisaineistoa tai jos tiedot tulevat yksittäisen tutkimushankkeen käyttöön tutkija- ja aineistopalvelussa eikä niistä muodosteta valmisaineistoa. Tutkija- ja aineistopalvelussa henkilötietojen käsittely perustuu asetuksen 6 artiklan 1 kohdan e-alakohtaan (”käsittely on tarpeen yleistä etua koskevan tehtävän suorittamiseksi tai rekisterinpitäjälle kuuluvan julkisen vallan käyttämiseksi”). Oikeus käsitellä erityisiin henkilötietoryhmiin kuuluvia tietoja perustuu puolestaan asetuksen 9 artiklan 2 kohdan j-alakohtaan, jonka perusteella käsittely on tarpeen yleisen edun mukaisia arkistointitarkoituksia taikka tieteellisiä ja historiallisia tutkimustarkoituksia tai tilastointitarkoituksia varten.

2 a §. Pykälä olisi uusi. Pykälän 1 momentin ensimmäisen virkkeen mukaan tilastokeskuksen tehtäviin ehdotetaan lain 2 §:ssä säädetyn lisäksi lisättäväksi oikeus tutkija- ja aineistopalvelun ylläpitämiseen. Tutkija- ja aineistopalvelun tarkoituksena on (i) kehittää ja parantaa tilastokeskuksen tilastointitarkoitukseen keräämien aineistojen jakelua tutkimus- ja selvityskäyttöön, (ii) kehittää ja parantaa tietoaineistojen vastaanottamista muilta rekisterinpitäjiltä yhdisteltäviksi tilastokeskuksen aineistoihin, ja (iii) vahvistaa näiden tavoitteiden toteuttamiseen liittyviä palveluja, jotka on suunnattu tieteellisen tutkimuksen ja yhteiskuntaoloja koskevien tilastollisten selvitysten edistämiseen. Tieteellistä tutkimusta ei ehdoteta rajattavaksi, vaan päinvastoin esitys kannustaa monitieteisen ja tieteenalarajat ylittävän tutkimuksen tekemiseen. Tieteellinen tutkimus on tietosuoja-asetuksen mukaan ymmärrettävä laajasti siten, että se tarkoittaa myös teknologian kehittämistä ja esittelyä, perustutkimusta, soveltavaa tutkimusta ja yksityisin varoin rahoitettua tutkimusta (johdanto-osan 159. kappale). Tulkinta on tiede- ja tutkimusmyönteinen ja poikkeaa hieman toisiolaista, jonka 37 §:ssä kehittämis- ja innovaatiotoimintaa ei pidetä tieteellisenä tutkimuksena, edellyttäen kuitenkin, ettei toiminnassa käsitellä erityisiin henkilötietoryhmiin kuuluvien henkilötietoja. Sen sijaan alkuperäisen tarkoituksensa mukaisesti tutkija- ja aineistopalvelu ei edelleenkään kohdistu kaupallisiin käyttötarkoituksiin, mihin nimenomaisesti liittyy viittaus yhteiskuntaoloja koskeviin tilastollisiin selvityksiin (HE 154/2012 vp, s. 33). Palveluja tutkijoille ja viranomaisille tarjotaan tilastokeskuksen organisaatiossa muuallakin kuin nykyisessä tutkijapalvelussa, muun muassa erityisselvityksinä sekä laajana valikoimana maksullisia ja veloituksettomia verkkopalveluja (esimerkiksi maksuton StatFin-verkkopalvelu ja maksullinen aikasarjatietokanta Astika, joka sisältää suhdanne- ja taloustilastoja kuukausi-, neljännesvuosi- ja vuosisarjoina).

Sen lisäksi, että tutkija- ja aineistopalvelu tarjoaa tutkija- ja viranomaisyhteisölle tilastokeskuksen tilastoaineistoja, se voi myös vastaanottaa ja luovuttaa muiden tahojen, mukaan lukien viranomaisten, sille tätä tarkoitusta varten luovuttamia aineistoja tutkimus- ja selvityskäyttöön. Tästä säädetään tarkemmin pykälän 5 momentissa. Tutkimus- ja selvityskäytöllä tarkoitetaan laajasti ymmärrettynä etusijalle asetetun tieteellisen tutkimuksen ohella myös esimerkiksi empiiristä ja soveltavaa tieteellistä tutkimusta, kuten TEAS-selvitys- ja tutkimushankkeita, jotka usein koskevat tilastolain 3 §:n viimeisessä virkkeessä tarkoitettuja yhteiskuntaoloja koskevia tilastollisia selvityksiä. TEAS-hankkeita voidaan pitää tietosuoja-asetuksessa tarkoitettuna soveltavana tutkimuksena (johdanto-osan 159. kappale). Valtioneuvostossa ja sen ministeriöissä tiedontarvitsijoiden joukko on lähtökohtaisesti sangen rajattu, eikä sitä ole syytä laajentaa kaikkiin ministeriöiden toivomiin hankkeisiin (kuten ulkoiseen tutkimukseen, jossa on omat haasteensa), vaan rajoittua TEAS-hankkeisiin ja muihin selvityksiin, joissa on usein ilmennyt ennakoimattomia, odottamattomia tai muutoin valtioneuvoston piirissä kriittisiksi arvioituja tietoaineistotarpeita.

Ehdotuksella tutkija- ja aineistopalvelun lisäämisestä tilastokeskuksen lakisääteisiin tehtäviin ei ole tarkoitus puuttua tilastokeskuksen sisäiseen organisaatioon eikä siten edellyttää esimerkiksi sitä, että tutkija- ja aineistopalvelu olisi hallinnollisesti erillinen toimintayksikkö. Tutkija- ja aineistopalvelu on pikemminkin toiminnallinen funktio, jota Fiona-etäkäyttöjärjestelmä täydentää.

Pykälän 1 momentin toisen virkkeen mukaan tutkija- ja aineistopalvelu on tarkoitettu tieteellistä tutkimusta ja yhteiskuntaoloja kuvaavien tilastollisten selvitysten tuottamiseen ja erityisesti, mutta ei ainoastaan, tutkimusta tekevissä organisaatioissa, kuten yliopistoissa, korkeakouluissa, ammattikorkeakouluissa, tutkimuslaitoksissa ja ajatuspajoissa toimivien tutkijoiden tietoaineistotarpeisiin vastaamiseen ajantasaisella aineistolla, ilman aiheetonta viivytystä, tietoturvallisessa käsittely-ympäristössä ja mahdollisimman tasapuolisella tavalla. Yliopistolaissa (558/2009) on lueteltu OKM:n toimialaan kuuluvat yliopistot, minkä lisäksi Maanpuolustuskorkeakoulu rinnastetaan yliopistoksi korkeakoulututkintojen järjestelmästä annetussa asetuksessa (464/1998), jossa myös luetellaan ammattikorkeakoulut. Lisäksi sisäministeriön alainen Poliisiammattikorkeakoulu luetaan ammattikorkeakouluihin. Hyvän tieteellisen käytännön ja sen loukkausten määrittely sekä tapausten tutkinta perustuvat TENK:n ohjeeseen ”Hyvä tieteellinen käytäntö ja sen loukkausepäilyjen käsitteleminen Suomessa”, jäljempänä HTK-ohje. Kaikki Suomen yliopistot, korkeakoulut, ammattikorkeakoulut ja muut julkisen rahoituksen piirissä olevat tutkimusorganisaatiot sekä merkittävimmät tieteen rahoittajat ovat vapaaehtoisesti sitoutuneet noudattamaan HTK-ohjetta.

Säännös ottaa huomioon paitsi vaatimuksen tasapuolisesta kohtelusta myös avoimen datan direktiivin ja sen, että nopeasti saatavilla oleville tilastoaineistoille on myös suuri kysyntä yhteiskunnassa. Näistä syistä on tärkeää varmistaa tiedontarvitsijoiden mahdollisimman nopea ja tasapuolinen kohtelu ilman aiheetonta viivytystä, ajantasaisin aineistoin ja tietoturvallisessa käsittely-ympäristössä. Tietoturvallisella käsittely-ympäristöllä tarkoitetaan teknistä, organisatorista ja fyysistä tietojenkäsittelyn toimintaympäristöä, jossa tietoturvallisuus varmistetaan asianmukaisin hallinnollisin ja teknisin toimin. Määritelmä ehdotetaan, kuten myös turvallisuusluokituksen taso, laaja-alaisuutensa ja horisontaalisen luonteensa vuoksi kuitenkin jätettäväksi perustelujen tasolle, joskin se vastaa esimerkiksi toisiolain 3 §:n 11 kohdassa säädettyä.

Tavoiteltavassa palvelutasossa kaikilla tutkija- ja aineistopalvelun käyttäjillä on nopeasti pääsy ajantasaisiin valmisaineistoihin samoin kuin palvelu on ollut koronaepidemian aikana järjestetty Tilannehuoneelle. Yliopistoissa, korkeakouluissa ja ammattikorkeakouluissa tietoaineistotarve ulottuu laajasti yksittäisiin tutkijoihin ja opiskelijoihin valmisteilla olevan opinnäytteen luonteesta ja akateemisten opintojen vaativuustasosta riippumatta. Yliopistojen, korkeakoulujen ja ammattikorkeakoulujen ulkopuolisia tutkimuslaitoksia ovat esimerkiksi taloustieteen saralla ainakin SP, VATT, Elinkeinoelämän tutkimuslaitos ETLA, Työn ja talouden tutkimus LABORE ja Pellervon taloustutkimus PTT. VATT luokitellaan esityksessä SP:n ja THL:n tavoin tutkimuslaitokseksi eikä viranomaiseksi.

Ajatuspaja tai ajatushautomo (think tank) puolestaan on tutkimuslaitos tai muu organisaatio, joka kehittää ideoita ja ehdotuksia poliittisten, taloudellisten tai sotilaallisten kysymysten ratkaisemiseksi. Suomessa on monia erilaisia ajatuspajoja, joista osa toimii kokonaan itsenäisesti ja osa on lähellä jotain puoluetta taikka muuta vakavasti otettavaa yhteisöä tai vakiintunutta organisaatiota. Ajatuspajoja ovat Suomessa esimerkiksi Alkio, Demos, e2, Elinkeinoelämän valtuuskunta EVA, Kalevi Sorsa Säätiö, Libera, Magma, Nordic West Office, Suomen itsenäisyyden juhlarahasto Sitra, Suomen Perusta, Toivo ja Vasemmistofoorumi. EU:n tietosuojavaltuutettu on tulkinnut tieteellistä tutkimusta sikäli laajasti, että se sisältää myös voittoa tavoittelemattomat organisaatiot, joihin ajatuspajojen katsotaan esityksessä kuuluvan. Myös ajatuspajojen tietopyyntöjen pohjana on oltava tieteellisen tutkimuksen perusteet täyttävä tutkimussuunnitelma. Lisäksi ajatuspajojen on lainsäädännön ja käyttöluvan ehtojen sitouduttava noudattamaan muun muassa HTK-ohjetta. Ottaen huomioon perustuslain 16 §:n 3 momentissa turvattu tieteen vapaus, maininta HTK-ohjeen noudattamisvelvollisuudesta ehdotetaan jätettäväksi perustelujen tasolle.

Ajatuspajojen toimintatapoina ovat yleensä tutkimukset, selvitykset, seminaarit ja erilaiset keskustelunavaukset, joiden tausta-aineistoina monesti ovat tilastolain 3 §:n viimeisessä virkkeessä tarkoitetut yhteiskuntaoloja koskevat tilastolliset selvitykset. Ajatuspajojen merkitys yhteiskunnallisen keskustelun moniarvoisuuden ylläpitämisessä on suuri, vaikka niillä ei olekaan yliopistojen, korkeakoulujen ja ammattikorkeakoulujen kaltaista institutionaalista tieteellistä asemaa. Ajatuspajoista ei ole voimassa laintasoista sääntelyä eikä niitä perustuslain 13 §:n 2 momentin takaaman yhdistymisvapauden ja 16 §:n 3 momentin takaaman tieteen vapauden vuoksi ehdoteta määriteltäväksi lain tasolla. Lisäksi myös muut kuin edellä luetellut tutkimusta ja selvitystä harjoittavat toimijat (esimerkiksi voittoa tavoittelemattomat kansalaisjärjestöt) ja niiden palveluksessa olevat tutkijat voivat saada pääsyn ja käyttöluvan palveluun. Mahdollisimman yhdenvertainen ja tasapuolinen kohtelu eri tutkijoille edellyttää, että myös niin sanotut freelance-tutkijat, jotka eivät välttämättä ole palvelussuhteessa mihinkään tutkimusta ja selvitystä harjoittaviin toimijoihin, vaan usein jonkinlaisessa affiliaatio-suhteessa, voivat saada käyttöluvan.

Pykälän 1 momentin kolmannen virkkeen mukaan sosiaali- ja terveystietojen luovuttamisesta tutkimus- ja tilastokäyttöön säädetään toisiolaissa. Kysymys on informatiivisesta viittauksesta, jonka tarkoituksena on selkeyttää rinnakkaisten etäkäyttöjärjestelmien välistä työnjakoa ja estää tutkija- ja aineistopalvelun kuormittuminen. Työnjakoon vaikuttavat viranomaisten erilaiset laintulkinnat, tavoitteet ja vastuut, asiakkaiden erilaiset tarpeet ja etäkäyttöjärjestelmiltä edellytetty teknologianeutraalisuus. Toisiolaissa tietopyynnöllä tarkoitetaan pyyntöä saada toisiolain mukaiseen käyttötarkoitukseen toisiolaissa tarkoitetuista henkilötiedoista muodostettua aggregoitua tilastoaineistoa. Tietolupahakemuksella haetaan henkilötiedolle käyttöoikeutta. Findatan ylläpitämä Kapseli-etäkäyttöympäristö on toiminnaltaan pitkälti samankaltainen kuin tilastokeskuksen Fiona-etäkäyttöjärjestelmä. Toisiolaki määrittelee Findatassa käsiteltävät tiedot ja tiedonantovelvolliset. Fiona-etäkäyttöjärjestelmä tarjoaa tutkimus- ja selvityskäyttöön suunnitellun etäkäyttöalustan muille kuin Findatassa käsiteltäville henkilötiedoille ja muille tiedoille.

Pykälän 2 momentin ensimmäisessä virkkeessä säädetään viranomaisille suunnatusta tutkija- ja aineistopalvelusta. Momentin mukaan valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittama käyttölupahakemus on asetettava valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemusten edelle ja toteutettava ilman aiheetonta viivytystä. Valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien käyttölupahakemusten etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden merkitsee vähäistä poikkeusta viranomaisten välisen tasapuolisen kohtelun vaatimuksesta, mutta kytkeytyy tiiviisti tilastolain 3 §:n viimeiseen virkkeeseen, jonka mukaan tilastolain ”tarkoituksena on myös edistää tilastointitarkoituksia varten kerättyjen tietojen käyttöä tieteellisissä tutkimuksissa ja yhteiskuntaoloja koskevissa tilastollisissa selvityksissä”. Käytännesääntöjen kohdan 15.4 mukaan ”Yksikköaineistoihin pääsy sallitaan tutkimustarkoituksiin, ja siinä noudatetaan erityisiä sääntöjä tai protokollaa”. Embargo käsittelee tilastojulkistuksia, ei yksikköaineistoja. Embargosta puhutaan silloin, kun tilastotieto on valmis ja se jostakin perustellusta syystä annetaan jollekin taholle etukäteen (esimerkiksi Eurostatille) ennen kuin tilastokeskus julkaisee sen itse.

Muilla viranomaisilla tarkoitetaan esimerkiksi muita tilastoviranomaisia (Luke, THL ja Tulli) ja ESS-viranomaisia (Migri ja Syke) sekä julkisoikeudellisia yhteisöjä (Työterveyslaitos), jotka tuottavat ja tarvitsevat tilastoaineistoja lakisääteisten tehtäviensä ja ylläpitämiensä asiantuntijapalvelujen hoitamisen ohella tieteelliseen käyttöön. Asettamalla käyttölupahakemuksen esittämiseen korkeahko kynnys siitä, että kiireelliseksi ilmoitettavan käyttölupahakemuksen esittää joko valtioneuvosto tai sen ministeriö, pyritään (i) varmistamaan tutkija- ja aineistopalvelun palvelukyky sekä aineistopyyntöjen kohtuulliset toimitusajat, jotta myöskään viranomaisten lakisääteisten analysointi- ja raportointipalvelujen tai arviointi-, selvitys- ja tutkimushankkeiden toteutus suunnitellussa aikataulussa ei vaarannu, sekä (ii) välttämään palvelun kapasiteettiongelmat ja se, ettei palvelu tarpeettomasti kuormitu. Syyt korkeahkon kynnyksen asettamiselle ovat (i) Suomen eurooppalainen maine korkeatasoiseen ja riippumattomaan tilastotuotantoon kannustavana ja kykenevänä jäsenvaltiona, minkä vuoksi tutkija- ja aineistopalvelun selkeä erottaminen tilastotuotannosta on tärkeää, (ii) Tilannehuoneen tutkimussuunnitelman perustuminen tietosuoja-asetuksen edellyttämään, tietosisältöä ja sen tarpeellisuutta koskevaan minimointiperiaatteeseen, jota vastaan tilastoaineisto voidaan luovuttaa ja johon valtioneuvoston ja sen ministeriöiden on vaikeampi vedota koronaepidemian laannuttua, sekä (iii) mahdollisimman vähäinen tinkiminen tutkijayhteisöön kuuluvien tiedontarvitsijoiden yhdenvertaisesta kohtelusta, mikä on varmistettu rajoittamalla valtioneuvoston etusija valtioneuvoston alaisen hallinnon viranomaisiin eikä tutkimuslaitoksiin sekä ottamalla huomioon viranomaisten hallinnolliset rekisteriaineistot ja viranomaisten itse jo paljon ennen tilastokeskuksen tilastojulkaisuja julkisesti saataville asettamat tiedot. Toisaalta esimerkiksi SP, VATT ja THL luokitellaan esityksessä tutkimuslaitoksiksi, joihin nähden valtioneuvoston ja sen ministeriöiden käyttölupahakemuksille ei ehdoteta etusijaa. Etusija ei vaikuta eduskunnan, eduskunnan valiokuntien eikä eduskunnan alaisten virastojen (Kela, SP ja VTV) mahdollisuuksiin saada tietoja tilastokeskuksesta. Etusija ei myöskään vaikuta eduskunnan valiokuntien (kuten tarkastusvaliokunta ja tulevaisuusvaliokunta) tutkimuksiin, jotka toteutetaan yleensä yliopistojen, tutkimuslaitosten ja ministeriöiden alaisten viranomaisten kiireellisinä yhteishankkeina. Sen sijaan valtioneuvoston ja sen ministeriöiden tietoaineistotarpeiden etusija vahvistaa välillisesti myös eduskunnan asemaa.

Valtioneuvostolla tarkoitetaan valtioneuvoston yleisistuntoa, joka on julkisuuslain mukainen viranomainen. Valtioneuvoston tai sen ministeriön muukin selvitys kuin TEAS-hankkeen tutkijoiden käyttölupahakemus voi aiheuttaa tarpeen käyttölupahakemuksen tekemiseen. Tällöin kuitenkin edellytetään, ettei käyttölupahakemus liity tavanomaiseen virkatyöhön tai esimerkiksi vuosikellon piirissä tapahtuvaan, pääsääntöisesti suunniteltuun ja tavanomaiseen toimintaan, vaan kysymys on ennakoimattomista, odottamattomista tai muutoin valtioneuvoston piirissä kriittisiksi arvioiduista tietoaineistotarpeista. Ministeriöille tulee toisaalta yllättäviä ja kiireellisiä tietopyyntöjä, jotka voivat liittyä myös vuosikellon piirissä tapahtuvaan suunniteltuun toimintaan, kuten budjettineuvotteluihin. Toisaalta, koska käyttölupahakemusten jonotusaika tilastokeskuksessa on viime vuosina ollut jopa 10-12 kuukautta, talouspolitiikan valmistelun ja suunnittelun aikajänne on muodostunut tätäkin lyhyemmäksi, mikä aiheuttaa erityisiä haasteita. Ehdotuksella pyritään osaltaan kuitenkin turvaamaan tilastokeskuksen toiminnan puolueettomuus ja riippumattomuus, jota edellytetään SEUT 338 artiklan 2 kohdassa ja EU:n tilastoasetuksen 2 artiklassa. Ehdotuksella ei ole vaikutusta tilastojen laatimisen tai jakelun puolueettomuuteen ja riippumattomuuteen, koska ehdotus koskee vain tilastokeskuksen vastaanottamia tietoja eikä niistä laadittavia tilastoja. Valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien (esimerkiksi TEAS-hanketta koskevien) käyttölupahakemusten etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden ei myöskään aiheuta poikkeusta tutkija- ja viranomaisyhteisön tiedontarvitsijoiden tasapuoliseen kohteluun palvelun hinnoittelussa, sillä valtioneuvosto ja sen ministeriöt maksavat palvelusta saman, valtion maksuperustesääntelyyn perustuvan hinnan kuin muutkin tiedontarvitsijat.

Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittaman käyttölupahakemuksen etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden ei rajoitu valmisaineistoihin. Talouspolitiikan ja valtion talousarvion laadintaa varten tarvittavat tiedot ovat usein kiireellisiä ja sidoksissa hallituksen noudattamaan vuosikelloon. Tutkija- ja aineistopalvelun kuormittumisen ehkäisemiseksi ja tilastokeskuksen puolueettomuuden varmistamiseksi edellytetään kuitenkin, että käyttölupahakemus liittyy ennakoimattomaan, odottamattomaan tai muutoin valtioneuvoston piirissä kriittiseksi arvioituun tietoaineistotarpeeseen. Tilastokeskuksen tilastointitarkoitukseen saamat tiedot ovat tilastosalaisuuden piirissä ja sen saamat henkilö- ja muut tiedot ovat salassa pidettäviä. Tilastointitarkoitukseen kerätyt tiedot voidaan luovuttaa tutkija- ja aineistopalvelulle, jos tiedot on pseudonymisoitu eivätkä tilastoyksiköt ole suoraan tunnistettavissa. Tutkija- ja aineistopalvelua varten saadut tiedot voidaan luovuttaa tutkimus- ja selvityskäyttöön tavalla, jossa tilastoyksiköt eivät ole suoraan tunnistettavissa.

Pykälän 3 momentin ensimmäisen virkkee n mukaan hallinnolliseen rekisteriin perustuvan tilaston julkaisemattomuus ei ole este tai aiheellinen viivytys tilastoinnissa käytettävän hallinnollisen rekisteriaineiston luovuttamiseen tutkija- ja aineistopalveluun, ellei tiedon luovuttaminen muulla kuin tilastolain 13 §:ssä säädetyllä tavalla riko tilastosalaisuutta tai olennaisella tavalla ja perusteettomasti vaaranna muiden tiedontarvitsijoiden tasapuolista kohtelua. Aineiston luovuttamista tutkija- ja aineistopalveluun edeltää yleensä tilastokeskuksen sisäinen harkinta luovutuksen lainmukaisten edellytysten täyttymisestä. Tilaston julkaisemattomuus on aiheellinen syy viivytykselle, jos luovuttaminen rikkoo tilastosalaisuutta muulla kuin tilastolain 13 §:ssä tarkoitetulla tavalla tai jos luovuttaminen rikkoo muiden tiedontarvitsijoiden tasapuolista kohtelua. Edellytykset rajoittaa tietojen luovuttamista tutkija- ja aineistopalveluun ovat siten suppeat ja tilastokeskuksen sisäinen harkinta mahdollisimman tarkkarajaista. Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittaman käyttölupahakemuksen asettaminen valtioneuvoston alaisen hallinnon viranomaisen käyttölupahakemuksen edelle ja toteuttaminen ilman aiheetonta viivytystä edellä 2 momentissa tarkoitetulla tavalla on esimerkiksi tällainen hyväksyttävä peruste samoin kuin se, että toinen viranomainen on jo itse omasta rekisteristään taulukoinut anonymisoitua tietoa avoimeen tietokantaansa. Ennakollisten tietojen julkistaminen, esimerkiksi heti sen jälkeen, kun aineisto-omistaja on julkaissut tietoja aineistosta, on suotavaa sikäli, että tiedon käytön nopeus on tärkeämpää kuin yksittäisten pienehköjen virheiden korjaaminen, vaikka raaka-aineistossa toisinaan saattaa olla laaja-alaisiakin virheitä. Näillä rajauksilla ja sillä, että kysymys on erityisesti tutkimus- ja selvityskäytössä tarpeellisista hallinnollisista rekisteriaineistoista, varmistetaan myös, ettei rekisteriaineiston antaminen tutkimus- ja selvityskäyttöön ole vastoin muita hyvän hallinnon periaatteita. Ehdotus mahdollistaa yksikkötason tutkimusaineistojen nykyistä selvästi ajantasaisemman luovuttamisen tutkimus- ja selvityskäyttöön. Ehdotus merkitsee, että tilastokeskuksen on aineistoja luovuttaessaan vältettävä aineistoon tehtäviä karkeistuksia sekä muokkauksia, jotka heikentävät aineiston käytettävyyttä, jollei tämä esimerkiksi henkilöiden tunnistamisriskin vähentämiseksi tai muista tietosuojasyistä ole täysin välttämätöntä. Ehdotus mahdollistaa sen, että tilastointitarkoitukseen kerättyä tietoa (erityisesti tutkimus- ja selvityskäytössä tarpeellista hallinnollista rekisteriaineistoa) voidaan käyttää toissijaiseen tarkoitukseen eli luovuttaa tutkija- ja aineistopalvelulle tutkimus- ja selvityskäyttöön ennen kuin sitä on käytetty ensisijaiseen käyttötarkoitukseen eli tilastointiin.

Esimerkki. Tilastokeskuksen tutkija- ja aineistopalvelun yhtenä tavoitteena on parantaa palvelutasoa valmisaineistoilla. Valmisaineisto on erillinen tuote, jonka tilastokeskus on koostanut jalostamalla muilta rekisteriviranomaisilta saamastaan aineistosta (rekisterit, tilastot ja tietoaineistot). Tilastokeskus sopii valmisaineiston tuottamisessa hyödynnettävistä aineistoista julkishallinnon rekisterinpitäjien kanssa. Tiedoista voidaan muodostaa valmisaineisto vain, jos tietoa ylipäänsä voi käyttää tutkimuksessa. Perusajatus on koota tutkimuksessa paljon käytetyistä rekistereistä aineistokokonaisuuksia teemoittain rajatuiksi, pseudonymisoiduiksi, jatkuvasti päivittyviksi ja tietosisällöltään ajantasaisiksi valmisaineistoiksi. Valmisaineistojen tarjontaa suunniteltaessa kuullaan tutkimusaineistojen käyttäjien tarpeita. Valmisaineisto nopeuttaa ja tehostaa tutkimusprosessia sekä parantaa palvelun laatua ja tuottavuutta, koska valmisaineisto on ajantasaista eikä sen muodostamiseen kulu aikaa. Valmisaineistot myös parantavat yleistä tietosuojaa, sillä tilastokeskus pseudonymisoi aineiston poistamalla suorat tunnisteet ja korvaamalla ne pseudotunnisteilla, jolloin aineistoa ei tarvitse erikseen kierrättää tutkijalla. Tutkija saa käyttöönsä vain niiden valmisaineistomoduulien tiedot, jotka hän tarvitsee tutkimusasetelmaansa varten. Tällöin luodaan aineistokirjasto valmisaineistoista, jotta tutkija saa tyypillisimmät tietoaineistot nopeasti valmisaineistokirjastosta. Valmisaineistot rajataan muuttujajoukoltaan ja aihealueeltaan kohtuullisen pieniksi kokonaisuuksiksi. Tällöin yksittäinen valmisaineisto ei vastaa kaikkea tutkijan tietotarvetta, mutta yhdistämällä useita valmisaineistoja tutkija saa juuri omaa tarvettaan vastaavan aineistokokonaisuuden. Tämä tarkoittaa myös sitä, että tutkijan tulee ostaa yleensä useampi kuin yksi valmisaineisto. Valmisaineistoa ei ehdoteta määriteltäväksi laintasoisesti. Toisiolain 3 §:n 19 kohdassa valmisaineisto on määritelty aineistokokonaisuudeksi, jonka Findata on ”koostanut yhden tai useamman kuin yhden organisaation tiedoista ja yhdistänyt yhdeksi aineistoksi taikka tallentanut siten, että aineistojen tunnistetiedot on koodattu yhdenmukaisella koodilla”.

Esimerkki. Hintadiskriminointia muistuttavia tilanteita, joissa vastaava tieto on saatavilla tilastokeskukselta toisessa aineistossa täsmällisemmässä muodossa erikseen hinnoiteltuna, pitää välttää, jollei niille ole erityisen painavia perusteluja. Ottaen huomioon, että aineistojen karkeistaminen ja muokkaaminen on voimavaroja edellyttävä toimenpide, on perusteltua muutoin kuin mainituista tietosuojasyistä pidättäytyä ylimääräisistä aineistonmuokkauksista paitsi käytettävyyden myös tehokkuuden näkökulmasta. Hintadiskriminointia muistuttava tilanne syntyy, kun etäkäyttöön saa halvemmalla karkeistetut tiedot kuin karkeistamattomat tiedot, vaikka karkeistamattomien tietojen tuottaminen aiheuttaa vähemmän työtä ja niistä on tutkimuksessa enemmän hyötyä. Tapauskohtaisesti tulee arvioitavaksi, mikä merkitys on annettava sille, että anonymisoitu tieto on tietoturvallisempaa. Karkeistukset on tehty tietosuojasyistä. Tilastokeskus on tehnyt yhden valmisaineiston, jossa tiedot eivät ole niin tarkalla tasolla. Tarkoitus on, että tämä aineisto voitaisiin henkilötietojen käsittelyn minimointiperiaate huomioon ottaen luovuttaa useimpiin tutkimushankkeisiin. Jos tutkimus sitä edellyttää, tiedot ovat saatavissa tarkemmalla tasolla toisissa valmisaineistoissa.

Tilastokeskuksen tutkijapalvelussa on tutkijoiden käytössä mikrosimulointimalli, jota käytetään esimerkiksi verotuksen tulonjakovaikutusten laskemisessa. Samaten tällaisia mahdollisimman alkuperäisiä aineistoja sisältäviä tietoja tulee käsitellä raaka-aineistoina, joista saatavia tietoja käyttäen tilastokeskus voi kuitenkin yhdessä käyttäjien kanssa muokata nykyisiä simulointikoodeja ja rakentaa uusia simulointiohjelmia. Tilastokeskuksen aineistojen tai simulointikoodien ei siten tarvitse aina olla täydellisiä, vaan käyttäjien toiveiden mukaan kehitettävät aineistokokonaisuudet voivat olla käyttäjien kanssa yhdessä kehitettyjä pilottiaineistoja. Vastavuoroisesti tilastokeskus voi mallin kehittämistyössä halutessaan hyödyntää simulointikoodeja, joita käyttäjät ovat rakentaneet näiden aineistojen pohjalle. Salassapitosääntely ei kuitenkaan estä käyttäjien kanssa tehtävän yhteistyön räätälöimistä ja syventämistä, kunhan salassa pidettävää aineistoa ei luovuteta tavalla, josta salassa pidettävät tilastoyksiköt ovat suoraan tunnistettavissa.

Pykälän 3 momentin informatiivisen toisen virkkeen mukaan tilastolaissa tarkoitettu tilastoviranomainen päättää rekisterinpitäjänä aina tilastointitarkoitukseen kerätyn aineiston luovutuksesta.

Pykälän 4 momentti koskee tutkija- ja aineistopalvelun aseman ja toimintaedellytysten vahvistamista. Samalla luodaan paremmat edellytykset tilastolakiin ehdotetulle tilastokeskuksen laajennetulle tiedonkeruulle tilastointitarkoitukseen ja sitä varten kerätyn aineiston luovuttamiselle tutkija- ja aineistopalvelulle. Nykyistä sääntelyä on saatettu toisinaan tulkita siten, ettei se mahdollista tietojen luovuttamista tutkimus- ja selvityskäyttöön eikä niiden käyttämistä muiden yhteiskuntaoloja koskevien tilastollisten selvitysten tekemisessä ennen kuin tietoja on käytetty tilastoinnissa. Tulkinta ei heijasta käytännesääntöjen kohtien 6.7, 7.7 ja 15.4 tavoitteita, minkä vuoksi sääntelyn täsmentäminen on tarpeen. Kohdan 6.7 sanamuoto ei esimerkiksi edellytä koronaepidemian kaltaisia kriisiolosuhteita, minkä lisäksi se koskee tilastoja eikä tilastointitarkoitukseen kerättyjä tietoja. Toisaalta, kun tutkimus- ja selvityskäytön edellytykseksi on tähän asti asetettu tilastokeskuksella olevien tietojen käyttö ensin tilastoissa, tutkimus- ja selvityskäytön tietosisältö lähtökohtaisesti on myös tilastokäytön mukainen. Tietosisällöstä voi kuitenkin rajautua pois joitakin rekisterin tietoja, jos näille ei ole tilastokäyttöä. Sellaisessa tilanteessa, jossa myös positiivisesta luottotietorekisteristä annettavassa laissa tarkoitettu tulorekisteriyksikkö voi luovuttaa tietoja välitettäväksi tutkimus- ja selvityskäyttöön, myöskään tilastokäyttö ei aiheuta tietosisällön tutkimus- ja selvityskäytön rajautumista. Toisaalta viranomaiset, joilla on oikeus saada tietoja rekisteristä oman tehtävänsä hoitamiseen, eivät saa tietoja näihin tarkoituksiin tilastokeskuksen kautta.

Momentin ensimmäisen virkkeen mukaan tilastokeskuksen tilastointitarkoitukseen kerättyjen tietojen luovuttamisesta säädetään tilastolain 13 §:ssä. Ehdotus ei muuta nykytilaa, mutta korostaa sitä, että tilastolain 13 §:n perusteella tehtävä luovuttaminen toteutetaan tutkija- ja aineistopalvelussa. Informatiivisella viittauksella tilastolakiin, vaikka se koskee aineistojen luovuttamista muuhunkin käyttöön, kuten tutkimus- ja selvityskäyttöön, ei rajoiteta nykyistä toimintaa eikä heikennetä asiakaspalvelua. Esimerkiksi ylioppilastutkintolautakunnan, jäljempänä YTL, tietoja ylioppilastutkinnoista säilytetään tutkijapalvelussa valmisaineistona. Aineisto on käsitelty niin, että oppilaitostunnus on pseudonymisoitu, vaikka YTL on antanut luvan jakaa tiedot tunnisteellisina tutkijoille. Koska tilastokeskus ei ole kerännyt tietoja tilastolain nojalla, niihin ei sovelleta tilastolain 13 §:ää, jonka mukaan tilastoyksikköjen suora tunnistaminen on estettävä. Esitys mahdollistaa voimassa olevan lain tavoin valmisaineiston tekemisen yhdistämällä tilastokeskuksen tilastointitarkoitukseen keräämiä tietoja YTL:n tutkija- ja aineistopalvelulle antamiin tietoihin. Kun aineistossa oppilaitostiedon lähde on YTL:n tiedot, oppilaitoksen tunnusta ei ole pseudonymisoitava, ellei niihin ole yhdistetty tilastokeskuksen tilastoaineistoja.

Momentin toisen virkkeen mukaan tilastokeskus voi lisäksi salassapitosäännösten estämättä ottaa vastaan, koostaa ja säilyttää tutkija- ja aineistopalvelua varten myös sellaisia välttämättömiä tietoja, joita ei käytetä tilastotuotannossa (esimerkiksi käytännesääntöjen kohdassa 8.6 tarkoitetut hallinnolliset rekisteriaineistot ja räätälöidyt tutkimusaineistot). Lisäksi tutkija- ja aineistopalvelussa henkilötietojen käyttötarkoitus on rajattu siten, että tietoja luovutetaan julkisuuslain 28 §:n perusteella valmisaineistojen muodostamiseen, tieteelliseen tutkimukseen tai yhteiskuntaoloja kuvaavien tilastollisten selvitysten tekemiseen. Säännös ei siten muuta sitä, mikä taho vastaa rekisterinpitäjänä tutkija- ja aineistopalveluun annettujen tietojen luovutuksesta ja sen lainmukaisuudesta. Tilastokeskus voi luovuttaa tutkija- ja aineistopalveluun vastaanotettuja tietoja tutkimus- ja selvityskäyttöön ja määritellä siihen kuuluvia suojaus- ja muita toimenpiteitä vain niiltä osin kuin se vastaa tietojen luovuttamisesta rekisterinpitäjänä. Tietojen luovutuksessa tulee myös ottaa huomioon yleiset tietosuojaperiaatteet (kuten tietojen minimointiperiaate), joilla voi olla vaikutusta muun muassa valmisaineistojen muodostamisen ja luovutuksen kannalta.

Momentin kolmannen virkkeen mukaan tutkimustarkoitukseen vastaanotetut tiedot, kuten valmisaineistot, luovutetaan tutkija- ja aineistopalvelua varten aineisto-omistajan tai rekisterinpitäjän päätöksellä.

Momentin neljännen virkkee n mukaan 1 momentissa tarkoitettu käyttölupahakemus voidaan evätä painavasta syystä. Tällainen syy voi liittyä esimerkiksi valtakunnan turvallisuuteen, epäilyyn tiedustelusta tai vakoilusta taikka epäilyyn hakijan omistajien tai johdon luotettavuudesta tai hakijasta bulvaanina. Näistä syistä organisaatiot, jotka sijaitsevat Euroopan talousalueella, OECD-valtioissa tai valtioissa, joiden tietosuojan sääntelyn komissio on tunnustanut vastaavan tietosuoja-asetusta, ovat pääsääntöisesti luotettavia hakijoita. Sen sijaan organisaatiot, jotka sijaitsevat muualla kuin mainituissa valtioissa, ovat lähtökohtaisesti vähemmän luotettavia, koska niissä ei yleensä noudateta samantapaisia arvoja ja yhteiskunnallisia päämääriä kuin Suomessa.

Pykälän 5 momentin ensimmäisen virkkeen mukaan tilastokeskus voi luovuttaa tilastointitarkoitukseen kerättyjä tietoja sekä tutkija- ja aineistopalvelua varten vastaanotettuja tietoja tutkimus- ja selvityskäyttöön tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten. Ehdotus nojautuu tilastolain 13 §:n 1 momenttiin, jonka mukaan ”tilastoviranomaisen tilastointitarkoituksiin saamia tietoja voidaan luovuttaa ulkopuolisille vain tässä laissa tai muussa erityisesti valtion tilastotointa koskevassa laissa säädetyin perustein”. Tilastokeskuksen tilastoaineistoihin kohdistuvan erityisen merkityksen johdosta TK-laissa erikseen säädettäisiin tilastokeskuksen oikeudesta luovuttaa salassa pidettäviä tietoja tutkimus- ja selvityskäyttöön. Ehdotettu säännös koskee vain tilastokeskusta eikä muita tilastoviranomaisia.

Tilastollisen selvityksen tekeminen ei edellytetä akateemisen tutkimuksen kriteerejä eikä tutkimuslaitoksen asemaa. Tilastokeskuksella on vakiintunut käytäntö, että silloin kun kerättäviä tietoja välitetään muille tiedontarvitsijoille, siitä on mainittava tiedonantovelvollisten tai heidän edustajiensa kanssa tehdyssä sopimuksessa. Tilastokeskuksella säilyy edelleen mahdollisuus jakaa ja tarjota tilastointitarkoitukseen kerättyä tietoa tutkimus- ja selvityskäyttöön. Tarkoitus on saada tutkijoiden käyttöön tietosuojalainsäädäntö huomioon ottaen aineistot mahdollisimman laajoina ja samalla – koska kysymys ei ole tilastotuotannosta – varmistua siitä, ettei tietojen luovuttaminen tutkija- ja aineistopalvelulle vaaranna tilastotuotannon riippumattomuutta.

Tilastokeskukselle ehdotetaan oikeutta luovuttaa tutkimus- ja selvityskäyttöön, tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten, tilastointitarkoitukseen kerättyjä tietoja sekä tutkija- ja aineistopalvelua varten vastaanotettuja tietoja, joita ei tarvita tilastoinnissa eikä käytetä tilastotuotannossa. Tutkija- ja aineistopalvelun aseman vahvistuminen korostuu pyrkimyksessä tilastoaineistojen täydellisyyteen ja yhdisteltävyyteen. Käytännössä tilastokeskus on jo nykyisin vastaanottanut aineistoja, joita se ei sinänsä kerää tilastotarkoitukseen ja jotka eivät ole tilastojen laatimisen kannalta täysin välttämättömiä, sillä esimerkiksi kaikkia Verohallinnolta saatavia ja valmiiksi taulukoituja tietoja ei käytännössä tarvita tilastointitarkoitukseen tai käytetä tilastotuotannossa. Toisaalta, jos Verohallinto poistaa luovutettavasta aineistosta ne muuttujat, joita ei tarvita tilastointitarkoitukseen tai käytetä tilastotuotannossa, aineiston arvo tutkimus- ja selvityskäytössä heikkenee. Lisäksi on huomionarvoista, että merkittävä arvo tutkimuksessa syntyy eri aineistojen ja laajojenkin datakokonaisuuksien yhdisteltävyydestä. Näistä syistä sen mahdollistaminen, että tilastointitarkoitukseen kerättyjä aineistoja voidaan luovuttaa tutkija- ja aineistopalvelulle nopeammin ja ehjinä kokonaisuuksina, edistää tieteellistä tutkimusta, tutkimustiedon käyttöä sekä yhteiskuntaoloja koskevien tilastollisten selvitysten valmistumista yhteiskunnallista päätöksentekoa varten. Samansuuntainen kehotus on käytännesääntöjen tilastotuotantoa koskevassa kohdassa 7.7: ”Tilastoviranomaiset jatkavat ja kehittävät yhteistyötä tiedeyhteisön kanssa menetelmien parantamiseksi, käytössä olevien menetelmien tehostamiseksi sekä mahdollisuuksien mukaan aiempaa parempien välineiden kehittämiseksi.”

Rekisteritutkimus on tutkimusta, jossa käytetään hyväksi – yleensä muuhun tarkoitukseen kuin kyseistä tutkimusta varten vastaanotettuja – rekisteritietoja. Tutkimus voi perustua kokonaan rekisteritietoihin tai rekisteritietoja voidaan käyttää muita aineistoja (esimerkiksi haastattelu- tai kyselyaineistoa tai kliinisiä ja näyteaineistoja) täydentävinä tietoina. Hallinnollisten rekisteriaineistojen erityispiirre on, ettei rekistereihin kertynyttä tietoa ole alun perin vastaanotettu tutkimus- ja selvityskäyttöä varten. Myös rekisteritutkimuksen tekemisessä on tästä syystä omia erityispiirteitä, jotka erottavat sen muusta kvantitatiivisesta tutkimuksesta. Ehdotus mahdollistaa tilastokeskuksen aktiivisen toiminnan myös muiden kuin niiden tietoaineistojen käsittelyssä, jotka on hankittu tilastokeskukseen tai jotka muut tilastoviranomaiset (esimerkiksi Tulli) ovat hankkineet kansallisen tilastolainsäädännön perusteella. Aineistojen kerääminen tilastokeskukseen edellyttää nykyisin tilastointitarkoitusta mutta se ei estä tilastokeskusta nykyisinkään luovuttamasta aineistoja tutkija- ja aineistopalvelulle tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten. Aineistoja tulee luovuttaa tutkija- ja aineistopalvelulle myös ennen kuin niistä on julkaistu tilasto, jolloin aineistot on luovutettava käyttöön viipymättä niiden vastaanottamisen jälkeen. Tieto luovutetaan tutkimus- ja selvityskäyttöön jo ennen tilastokeskuksen omien tilastojen julkistamista, esimerkiksi heti sen jälkeen, kun aineisto-omistaja on julkaissut tietoja aineistosta. Toisaalta nykyisin aineistoja ei voida kerätä ilman tilastointitarkoitusta, minkä vuoksi ehdotetaan, että tilastokeskus voi ottaa vastaan, koostaa ja säilyttää aineistoja myös tutkija- ja aineistopalvelua varten. Ehdotus perustuu Spolanderin työryhmän raporttiin ja tukee VNK:n pilottiselvitystä, jossa kokeiltiin viranomaisten toiminnassa syntyvien hallinnollisten rekisteriaineistojen käyttöä yhteiskunnallisen päätöksenteon tukena, sekä vastaa toisiolain sisältöä ja nojautuu myös tilastolain 3 §:n viimeiseen virkkeeseen.

Momentin toisen virkkeen mukaan tilastointitarkoitukseen kerätyt tiedot, kuten hallinnolliset rekisteriaineistot, tulee luovuttaa ilman aiheetonta viivytystä jo ennen kuin esimerkiksi alkuperäinen rekisterinpitäjä tai aineisto-omistaja on julkaissut tilaston. Ehdotus edistää yksikkötason tutkimusaineistojen nykyistä selvästi ajantasaisempaa luovuttamista tieteelliseen tutkimukseen ja yhteiskuntaoloja koskeviin tilastollisiin selvityksiin. On tärkeää, että muilta viranomaisilta tilastointitarkoitukseen kerätty tieto voidaan antaa tutkijoiden käyttöön viimeistään heti, kun siitä tai sen osasta on tehty julkistus. Tällaiseksi julkistukseksi voidaan lukea myös muut kuin tilastokeskuksen omat julkistukset, kuten tiedon omistajien omien tilastotietokantojen päivitykset, jollei perusteltu muu syy, esimerkiksi painava markkinoihin vaikuttava näkökulma, sitä estä. Tieto luovutetaan tutkija- ja aineistopalvelulle jo ennen tilastokeskuksen omien tilastojen julkistamista, esimerkiksi heti sen jälkeen, kun aineisto-omistaja on julkaissut tietoja aineistosta. Lopullinen arvio ja viranomaispäätös tiedon luovuttamisen edellytyksistä on tilastolaissa tarkoitetulla tilastoviranomaisella. Toisaalta on tärkeää, että muilta viranomaisilta tutkija- ja aineistopalvelua varten vastanotettu tieto luovutetaan tutkimus- ja selvityskäyttöön mahdollisimman nopeasti tilastokeskuksen vastaanotettua tiedon, vaikka tilastokeskus ei julkaise näistä tiedoista tilastoja.

Pykälän 6 momentissa säädetään tilastokeskuksen tutkija- ja aineistopalvelua varten vastaanottamien tietojen säilytysajasta. Eduskunnan perustuslakivaliokunnan mukaan (PeVL 14/2002 vp) henkilötietojen suojan kannalta tärkeä sääntelykohde on tietojen säilytysaika henkilörekistereissä. Valiokunta on lisäksi korostanut, että tällaisen seikan sääntelyn lain tasolla tulee olla kattavaa ja yksityiskohtaista. Koska tutkija- ja aineistopalvelua varten vastaanotettujen tietojen käsittelyssä voi olla kysymys henkilötietojen käsittelystä, on sääntelyä perusteltua täsmentää tältä osin.

Momentin ensimmäisen virkkeen mukaan tilastokeskus päättää henkilötietojen käsittelijänä muiden rekisterinpitäjien lukuun tutkija- ja aineistopalvelua varten yksittäisiin toimeksiantoihin vastaanottamiensa muiden rekisterinpitäjien tietojen säilyttämisestä. Momentin toisen virkkeen mukaan tilastokeskus päättää ehdotetun 2 b §:n 4 momentin mukaisesti rekisterinpitäjänä valmisaineistojen säilyttämisestä. Momentin kolmannen virkkeen mukaan Kansallisarkisto päättää tietojen säilyttämisestä pysyvästi. Tilastokeskus ei kuitenkaan ole näiden aineistojen rekisterinpitäjä. Ennen kuin tilastokeskus hävittää tilastojen laatimisessa kerättyjä tietoja, siitä on syytä ilmoittaa Kansallisarkistolle ja tarvittaessa pyytää sen lausunto, jotta Kansallisarkisto voi määritellä kantansa tietojen säilytysarvoon ja määrätä tiedot tarvittaessa pysyvästi säilytettäväksi. Tilastokeskuksen on lisäksi tilastolain 6 §:ssä tarkoitetuissa neuvotteluissa huolehdittava siitä, ettei neuvottelujen lopputuloksella rajoiteta Kansallisarkiston mahdollisuutta määrätä tietoaineistojen pysyvästä säilytyksestä. Tietojen säilytystarvetta arvioitaessa on tarvittaessa varattava myös tiedeyhteisön edustajille mahdollisuus ilmoittaa näkemyksensä asiasta.

Tietosuoja-asetuksen mukaan henkilötietoja on säilytettävä muodossa, josta rekisteröity on tunnistettavissa vain niin kauan kuin se on tarpeen tietojenkäsittelyn tarkoitusten toteuttamista varten (5 artiklan 1 kohdan e-alakohta). Henkilötietoja voidaan kuitenkin säilyttää pidempiä aikoja, jos henkilötietoja käsitellään vain yleisen edun mukaisia arkistointitarkoituksia taikka tieteellisiä tai historiallisia tutkimustarkoituksia varten tai tilastointitarkoitukseen tietosuoja-asetuksen 89 artiklan 1 kohdan mukaisesti edellyttäen, että asetuksessa vaaditut asianmukaiset tekniset ja organisatoriset toimenpiteet on pantu täytäntöön rekisteröidyn oikeuksien ja vapauksien turvaamiseksi (”säilytyksen rajoittaminen”). Henkilötietojen käsittelyn turvallisuudesta on säädetty tietosuoja-asetuksen 32 artiklassa.

2 b §. Pykälä olisi uusi ja siinä säädetään tilastokeskusta velvoittavalla tavalla käyttölupahakemuksessa sekä myönnetyssä käyttöluvassa tarkoitettujen tietojen kokoamista, yhdistämistä ja esikäsittelyä koskevasta palvelusta. Pykälä myötäilee eräiltä osin toisiolain 14 §:ää. Pykälän 1 momentin ensimmäisen virkkeen mukaan tilastokeskuksen palvelutehtävänä on hakijalle myöntämänsä käyttöluvan mukaisesti poimia tai ottaa vastaan eri rekisterinpitäjien tiedot ja koota, yhdistellä ja esikäsitellä sekä pseudonymisoida tai anonymisoida käyttöluvassa määritelty aineisto luvansaajan käsiteltäväksi taikka tuottaa käyttölupahakemuksessa tarkoitettu aggregoitu tilastotieto päätöksen mukaisesti.

Pykälän 1 momentin toinen virke sisältää säännöksen muun rekisterinpitäjän kuin tilastokeskuksen velvollisuudesta toimittaa käyttölupa tilastokeskukselle sen jälkeen, kun rekisterinpitäjä on myöntänyt käyttöluvan omissa rekistereissään oleviin tietoihin ja tiedot luovutetaan käytettäväksi tutkija- ja aineistopalvelussa. Rekisterinpitäjän on toimitettava lupa ja siihen liittyvä tietoaineisto tilastokeskukselle yhdisteltäväksi, esikäsiteltäväksi ja pseudonymisoitavaksi. Tilastokeskuksella on tällöin oikeus saada tarvittavat tiedot käyttölupahakemuksessa tarkoitetuilta rekisterinpitäjiltä, yhdistellä ne tunnisteellisina ja tuottaa niistä pyydetyn tuloksen edellyttämä anonymisoitu tai pseudonymisoitu tieto viranomaisvastuulla. Tämä tarkoittaa, ettei yksittäinen rekisterinpitäjä kokoa eikä tuota itse anonymisoituja tietoaineistoja, vaan osaamisen varmistamiseksi ja tietosuojan turvaamiseksi tämä on aina tilastokeskuksen palvelutehtävä. Silloin kun henkilötietoja luovutetaan käyttölupahakemuksen perusteella, tilastokeskuksen on pseudonymisoitava luovutettava aineisto ja säilytettävä kuvaus aineiston muodostamisesta, pseudonymisointimenetelmistä ja lopputuloksesta, jotta tarvittaessa voidaan jäljittää esimerkiksi jokin virhe pseudonymisointimenetelmissä.

Pykälän 2 momentin mukaan tilastokeskuksen on säilytettävä kuvaus luovuttamiensa tietoaineistojen tai koostamiensa eli aggregoitujen tilastotietojen muodostamisesta, käyttämistään pseudonymisointi- ja anonymisointimenetelmistä sekä luovutetuista lopputuloksista. Tilastokeskuksen toiminnan tehokkuuden ja tietoturvan kannalta on tarkoituksenmukaisinta, että sillä on laissa säädetty oikeus käsitellä ja yhdistää viranomaisten aineistoista valmisaineistoja jo ennen käyttölupien myöntämistä. Käyttölupia myöntävänä viranomaisena tilastokeskus ylläpitää tietovarastoa yleisimmin hyödynnetyistä yhdistelmäaineistoista, jotka kokemuksen mukaan huomattavasti nopeuttavat ja helpottavat valmisaineistojen muodostamista. Tilastokeskuksen oikeuden saada ja käsitellä tietoja valmisaineistoja varten tulee perustua nyt säädettävään lakiin eikä erillislupiin. Uusien valmisaineistojen kokoamisesta tulee neuvotella niiden rekisterinpitäjien kanssa, joiden aineistoja valmisaineisto koskee.

Momentissa esitetty toimintatapa on laissa tarkoitettujen palvelutehtävien sujuvoittamiseksi tärkeää. Muutoin laissa tarkoitettu, keskitetty toimintatapa ei kaikin osin lisää aineistopoimintojen tehokkuutta tai tietoturvaa nykyisestä. Riskinä on, että ilman merkittäviä panostuksia tietojärjestelmäinfrastruktuuriin syntyy nykymallin mukaan tehtävien erillispoimintojen lisäksi uusi toimintakerros, jolloin käsittelyajat kasvavat. Erillispoimintojen mallia ei voida myöskään perustella tietoturvanäkökulmasta, koska samojen tietojen toistuvat poiminnat ja luovutukset aiheuttavat ylimääräisen käsittelytarpeen.

Sama käyttöluvanhakija voi pyytää tietoja eri aikana useaan eri tarkoitukseen ja projektit voivat alkaa samaan tai eri aikaan. Esimerkiksi tutkijalla tai tutkimusryhmällä voi olla samanaikaisesti käynnissä useampi tutkimus, jolloin kysymyksessä ovat toisistaan erilliset tutkimustarkoitukset. Käyttöluvanhakija voi myös samanaikaisesti harjoittaa esimerkiksi kehittämis- ja innovaatiotoimintaa ja siihen liittyvää tutkimusta, edellyttäen kuitenkin, ettei niissä käsitellä erityisiin henkilötietoryhmiin kuuluvien henkilötietoja. Kysymyksessä on tällöin erillinen tutkimustarkoitus sekä kehittämis- ja innovaatioprojekti. Koska henkilötietoja käytetään näissä tilanteissa eri käyttötarkoituksiin, niiden keskinäisiä tietoja ei saa yhdistää. Käyttölupia myöntävänä viranomaisena tilastokeskuksen tulee korostaa lupaehdoissa, ettei eri käyttötarkoituksiin luovutettuja tietoja saa yhdistää.

Käyttölupia myöntävänä viranomaisena tilastokeskus luovuttaa yhdistellyt henkilötiedot käyttöluvan mukaisina luvansaajan käsiteltäviksi tietoturvalliseen käyttöympäristöön. Tämä edellyttää useimmiten, että yhdistelyn jälkeen tiedot pseudonymisoidaan ennen kuin ne luovutetaan luvansaajalle. Prosessissa muodostetaan yksilölliset tunnisteet, joiden avulla henkilöt voidaan jälkikäteen yhdistää luvansaajalle luovutettuihin tietoihin. Vain tilastolain 19 §:ssä tarkoitetussa poikkeustapauksessa lupa myönnetään tunnisteellisiin tietoihin, joiden perusteella luvansaaja voi suoraan tunnistaa rekisteröidyt henkilöt. Tämä on välttämätöntä esimerkiksi silloin, kun sähköisissä henkilörekistereissä olevia tietoja joudutaan tutkimuksessa yhdistelemään erikseen yksittäistapauksittain.

Pykälän 3 momentin mukaan, jos tietoja luovutetaan pseudonymisoituna samalle käyttäjälle usean eri tutkimussuunnitelman perusteella, eri aineistojen yhdistäminen tutkija- ja aineistopalvelussa on estettävä. Jos mahdollista, eri käyttötarkoituksiin voidaan myös poimia eri henkilöistä koostuvaa tietoa tai karkeistaa aineistot eri tavoin eri luovutuksiin. Pseudonymisoinnin tapa riippuu kuitenkin luovutustarkoituksesta ja aineistosta, koska esimerkiksi karkeistaminen voi heikentää tiedon käyttömahdollisuuksia. Tällä pyritään varmistamaan se, ettei luvansaajalle synny helposti yhdisteltävissä olevaa aineistoa samoista rekisteröidyistä. Tunnisteiden vaihtaminen on yksi tässä laissa asetetuista tietosuoja-asetuksen mukaisista rekisteröidyn oikeuksia ja vapauksia turvaavista suojatoimista. Muita keinoja ovat esimerkiksi luvansaajan salassapitovelvollisuus ja tietojen käsittelyn rajoittaminen tietoturvalliseen käyttöympäristöön.

Pykälän 4 momentin ensimmäisen virkkeen mukaan tilastokeskus voi 1 momentissa tarkoitetun palvelutehtävänsä sujuvoittamiseksi muodostaa valmisaineistoja tilastointitarkoitukseen keräämistään sekä muun rekisterinpitäjän päätöksellä tutkija- ja aineistopalvelua varten vastaanottamistaan tiedoista, joita sillä on oikeus saada myös muutoin tämän lain mukaisiin palvelutehtäviinsä. Momentin toisen virkkeen mukaan tilastokeskus päättää tietojen luovuttamisesta ja käyttöoikeuden antamisesta valmisaineistoihin, jotka on muodostettu tilastointitarkoitukseen kerätyistä tiedoista tai muun rekisterinpitäjän tutkija- ja aineistopalvelua varten toimittamista tiedoista. Momentin kolmannen virkkeen mukaan tilastokeskus raportoi valmisaineistojen käyttäjien tiedot (henkilön nimi ja hankkeen nimi) alkuperäiselle rekisterinpitäjälle vuosittain. Käyttölupia myöntävänä viranomaisena tilastokeskus voi momentin neljännen virkkeen mukaan käyttölupapäätösten mukaisesti avata käyttöoikeuden valmisaineistoihin tai poimia käyttölupapäätöksen mukaiset tai anonymisoidun tiedon tuottamiseksi tarvittavat tiedot valmisaineistoista. Tilastokeskus on tietoja yhdistettäessä tuotettujen valmisaineistojen rekisterinpitäjä. Sopimuksella toisen rekisterinpitäjän kanssa voidaan sulkea pois muun rekisterinpitäjän toimittaman aineiston luovuttaminen esimerkiksi yhteiskuntaoloja koskevia tilastollisia selvityksiä varten, joskin toisiolaki saattaa rajoittaa eräiden rekisterinpitäjien, kuten THL:n mukaan sen mahdollisuutta sopimuksiin.

Esityksellä pyritään mahdollistamaan se, että tilastokeskus voi nykyistä laajemmin muodostaa valmisaineistoja suoraan tilastokeskukseen tulleista muiden rekisterinpitäjien aineistoista ja tarjota näitä tutkimus- ja selvityskäyttöön sellaisenaan. Valmisaineisto muodostetaan pääsääntöisesti tilastokeskuksen käsittelemästä tilastoaineistosta, jossa kuvaus sisältää muun muassa määritellyn kohdejoukon, käsitteet ja muuttujat sekä tarkistetut ja korjatut aineistot. Lisäksi on mahdollisesti muodostettu uusia tietoja usean aineiston tai tietolähteen perusteella. Valmisaineistot tehdään valmiiksi tutkimus- ja selvityskäyttöön (”hyllylle odottamaan”) ja niitä voidaan avata tutkijoille heti, kun tutkija on saanut käyttöluvan. Säännös vastaa pääosin nykytilaa, jossa valmisaineistojen laatimisesta on sovittu tilastokeskuksen ja toisen viranomaisen välillä erikseen, minkä jälkeen tilastokeskus on laatinut valmisaineistot toisen viranomaisen toimeksiannosta ja lukuun henkilötietojen käsittelijänä. Valmisaineistot ovat tilastokeskuksen omaksuma tapa tuottaa tilastoaineistoja tutkimus- ja selvityskäyttöön kustannustehokkaasti ja lievemmin käyttörajoituksin. Säännös kuitenkin antaa tilastokeskukselle uuden tehtävän, jossa tilastokeskus vastaa rekisterinpitäjänä valmisaineistojen muodostamisesta ja niiden luovuttamisesta. Jos toinen viranomainen haluaa rajoittaa tehtävän hoitamiseen liittyviä tilastokeskuksen tiedonsaantioikeuksia, tästä olisi sovittava kyseisten viranomaisten kesken erikseen.

Valmisaineistoja on muodostettu tilastoaineiston ohella myös raaka-aineistosta, jota on voitu toisessa viranomaisessa jo käsitellä, kuten Tulorekisteristä muodostetusta TAX-valmisaineistosta (https://taika.stat.fi/). Raaka-aineisto puolestaan on tiedontoimittajalta vastaanotettua pääosin muokkaamatonta aineistoa, yleensä toisen rekisterinpitäjän ylläpitämää tietoa, jota poimitaan esimerkiksi tietoteknisestä rajapintapalvelusta ja joka voi sisältää puuttuvia tietoja, virheellisiä koodeja ja virheellistä tietoa. Raaka-aineistoa ja valmisaineistoa ei kuitenkaan tule rinnastaa karkeistamattomaan ja karkeistettuun aineistoon, koska niitä kumpaakin voidaan karkeistaa. Valmisaineiston vastakohta on räätälöity tutkimusaineisto, joka muodostetaan tilastokeskuksen tietovarannoissa olevista tiedoista vasta sitten, kun tutkija tekee tilauksensa.

7.2 Tilastolaki

Esityksen keskeinen linjaus on suhtautuminen henkilötietojen käsittelyn lainmukaisuutta koskevaan tietosuoja-asetuksen 6 artiklaan. Esityksen jaottelussa tilastokeskuksessa henkilötietojen käsittelyyn ehdotetut muutokset tilastolakiin perustuvat asetuksen 6 artiklan 1 kohdan c-alakohtaan (”käsittely on tarpeen rekisterinpitäjän lakisääteisen velvoitteen noudattamiseksi”). Oikeus käsitellä erityisiin henkilötietoryhmiin kuuluvia tietoja perustuu puolestaan asetuksen 9 artiklan 2 kohdan j-alakohtaan, jonka perusteella käsittely on tarpeen yleisen edun mukaisia arkistointitarkoituksia taikka tieteellisiä ja historiallisia tutkimustarkoituksia tai tilastointitarkoituksia varten.

1 §. Lain soveltamisala. Pykälän 2 momenttia ehdotetaan lakiteknisesti täsmennettäväksi lisäämällä sulkuihin tietosuoja-asetuksesta muualla laissa käytetty lyhennetty ilmaisu.

12 §. Tietojen salassapito ja julkisuus. Pykälän 1 momentin toista virkettä ehdotetaan lakiteknisesti täsmennettäväksi laajentamalla valtion ja kunnan viranomaisiin kohdistuva salassapitovelvollisuuden poikkeus koskemaan myös kuntayhtymien, hyvinvointialueiden ja hyvinvointiyhtymien viranomaisia. Ehdotus lisää siten asiakirjajulkisuutta ja myötäilee eduskunnan perustuslakivaliokunnan näkemystä (PeVL 17/2021 vp, hyvinvointialueiden perustaminen ja sosiaali- ja terveydenhuollon sekä pelastustoimen järjestämisen uudistus).

13 §. Salassa pidettävien tietojen luovuttaminen. Pykälän 5 momenttia ehdotetaan täsmennettäväksi, sillä on muitakin tiedonantajia kuin viranomaisia, joille on ollut tarve palauttaa saatua aineistoa. Momenttia myös selkeytetään mahdollistamalla tietojen antaminen alkuperäisessä tietosisällössä takaisin sille viranomaiselle tai muulle tiedonantajalle, joka on toimittanut tietoaineiston tilastoviranomaiselle. Muutos parantaa tiedonantajien edellytyksiä saada tietoonsa analyysin tulokset tilastokeskukselle luovutetusta aineistosta. Toisaalta muutos saattaa edellyttää tilastokeskuksen luovutuskäytäntöjen tarkistamista sen varmistamiseksi, ettei tuloksista ole mahdollista tunnistaa välillisesti tilastoyksiköitä ja etteivät muut tiedonantajat rasita tilastokeskusta palautuspyynnöillä.

14 §. Tilastokeskuksen oikeus kerätä tietoja tiedonantovelvollisuuden nojalla. Pykälän 2 momenttia ehdotetaan lakiteknisesti täsmennettäväksi muuttamalla kuntiin ja kuntayhtymiin kohdistuva tiedonantovelvollisuus kuntien ja kuntayhtymien viranomaisten tiedonantovelvollisuudeksi sekä lisäämällä hyvinvointialueiden ja hyvinvointiyhtymien viranomaiset tiedonantovelvollisiksi tilastokeskukselle. Ehdotus myötäilee eduskunnan perustuslakivaliokunnan näkemystä (PeVL 17/2021 vp).

15 §. Tilastokeskuksen oikeus kerätä henkilötietoja tiedonantovelvollisuuden nojalla. Tilastolain 15 §:ssä säädetään valtion viranomaisten velvollisuudesta antaa salassapitosäännösten estämättä tilastokeskukselle tilastojen laatimisen kannalta välttämättömiä henkilötietoja. Pykälän 1, 4 ja 6 momenttia ehdotetaan täsmennettäväksi EU:n tilastoasetuksen 17 a artiklaan liittyvää käytännesääntöjen periaatetta 2 vastaavalla tavalla, jotta tilastokeskuksen tiedonsaantioikeus ulottuu varhaiskasvatusta koskeviin välttämättömiin henkilötietoihin. Varhaiskasvatuksen tiedot ovat tarpeen muun muassa koulutustilastojen laatimisessa. Varhaiskasvatuslain (540/2018) 13 luvussa säädetään Varhaiskasvatuksen tietovarannosta, jäljempänä Varda. Varhaiskasvatuslain 73 §:n mukaan OPH päättää tietojen luovuttamisesta Vardasta. Epäselvää on tilastolain näkökulmasta kuitenkin ollut, voidaanko varhaiskasvatuksen katsoa sisältyvän koulutuksen käsitteeseen. Siinä tapauksessa, että varhaiskasvatuksen henkilöpohjaisten tietojen luovutukselle on perusteena vain tilastolain 15 §, on OPH:n ja tilastokeskuksen välisissä keskusteluissa pidetty tarpeellisena lisätä tilastolakiin myös maininta varhaiskasvatuksesta.

Tilastokeskus teki 11.12.2020 OPH:lle tietopyynnön Varda-aineiston luovutuksesta tilastokeskuksen käyttöön. OPH:n 19.2.2021 antaman tietojenluovutuspäätöksen mukaan pyydetyt tiedot voidaan luovuttaa tilastokeskuksen käyttöön. Päätöksen mukaan tilastokeskuksella on lakisääteiseen tehtäväänsä perustuen oikeus saada pyytämänsä varhaiskasvatukseen liittyvät henkilötiedot (lapset, huoltajat, työntekijät) sekä varhaiskasvatuksen toimijoiden ja toimipaikkatiedot (ja myös näihin sisältyvät henkilötiedot). Näistä syistä tilastokeskuksen tiedonsaantioikeus koskee OPH:n ohella myös muita varhaiskasvatustoimijoita, kuten kuntien, kuntayhtymien, hyvinvointialueiden ja hyvinvointiyhtymien viranomaisia. Tilastokeskuksen suora henkilöpohjainen tiedonkeruuoikeus koskee myös tietoja, jotka eivät sisälly Vardaan tallennettavaan tietosisältöön, vaan jotka ovat saatavilla suoraan varhaiskasvatustoimijoilta. Tilastokeskus voi siten esimerkiksi pyytää OPH:ta toimittamaan kaikki opiskelijavalintarekisterin tiedot (myös arvosanatiedot, joita ei käytetä tilastoinnissa) ja muodostamaan arvosanoista valmisaineiston. Tämän aineiston rekisterinpitäjänä säilyy kuitenkin OPH, joka antaa käyttöluvat siihen. OPH:n ja tilastokeskuksen välillä voidaan toisaalta sopia siitä, että OPH muodostaa aineiston ja että tilastokeskus toimii OPH:n lukuun henkilötietojen käsittelijänä sille valmisaineistolle, jonka OPH toimittaa tilastokeskukselle etäkäyttöjärjestelmässä ylläpidettäväksi.

Pykälän 1 momentin ilmaisu valtion viranomaisista jätetään ennalleen, vaikkei sitä ole määritelty. Mahdollinen käsitteenmäärittely kuuluu kuitenkin yleishallinto-oikeuden alaan ja siten OM:n valmisteluvastuulle. Vaikka myös hallinnon yleislaeissa on erilaisia valtion viranomaisen määritelmiä kutakin lainsäädäntöä palveleviin tarkoituksiin, esityksessä on pidättäydytty laintasoisesta valtion viranomaisen määrittelystä enemmän fragmentoitumisen välttämiseksi. Käytännössä käsitettä on tilastolaissa tulkittu siten, että se tarkoittaa valtion hallintoviranomaisia eikä lainkäyttöviranomaisia.

Pykälän 6 momentin ilmaisu arkaluonteisista henkilötiedoista jätetään myös ennalleen. Eduskunnan perustuslakivaliokunta on ottanut kantaa arkaluonteisten henkilötietojen käsitteeseen (PeVL 15/2018 vp). Vaikka tietosuoja-asetuksen soveltamisen johdosta kansallisessa lainsäädännössä tulee sääntelyn selvyyden ja tietosuoja-asetuksen 9 artiklassa säädetyn erityisten henkilötietoryhmien käsitteen vuoksi välttää arkaluonteisten tietojen käsitteen käyttämistä, on valiokunta pitänyt edelleen perusteltuna kuvata valtiosääntöisesti tiettyjä henkilötietoryhmiä nimenomaan arkaluonteisiksi, minkä ohella on syytä painottaa erityisten henkilötietoryhmien erityistä arkaluonteisuutta (johdanto-osan 51. kappale).

Lisäksi pykälän 1 momenttiin lisätään maininnat maksuja ja velkoja koskevista tiedoista. Ehdotukset liittyvät varhaiskasvatuksen henkilöpohjaisten maksutietojen saamisen varmistamiseen ja positiivisesta luottotietorekisteristä annettavaan lakiin. Henkilöiden yhteystietoja käytetään suorassa henkilötiedonkeruussa, jossa henkilöiden tavoitettavuus on heikentynyt vuosi vuodelta muun muassa puutteellisten yhteystietojen vuoksi. Tietojen käyttötarvetta tukee se, että Suomi on jäsenvaltiona velvollinen toimittamaan komissiolle tietosuoja-asetuksessa määritellyt tiedot. Tilastokeskus käyttää julkisia yhteystietopalveluja ja muun muassa väestötietojärjestelmän sähköpostitietoja tavoitellessaan tiedonantajia vastaamistapahtumiin. Puhelinnumeroiden salaaminen on yleistynyt uusien liittymien tai liittymäsiirtojen yhteydessä, minkä lisäksi prepaid-liittymien yleistynyt käyttö on johtanut siihen, ettei kyseisiä numeroita saa numeropalveluista enää kattavasti. Myöskään sähköpostiosoitteille ei ole muuta lähdettä. Tiedonantajien tavoittamattomuuden seurauksena tiedonkeruun vastausaste laskee ja aineisto vinoutuu, tiedonkeruun kustannukset kasvavat ja tilastoinnin laatu laskee. Vaikka verkkokeruun osuus on kasvanut, puhelinhaastatteluilla ja vastaajien ohjaamisella verkkoon on merkittävä vaikutus saatujen vastausten määrään. Tiedonkeruu on keskeinen tilastoinnin vaihe ja suorassa tiedonkeruussa (haastattelut, verkkokeruu) yhteystiedot sekä niiden laatu ja kattavuus ovat ensiarvoisen tärkeitä kustannustehokkaan toiminnan kannalta. Tiedonkeruu on keskeinen osa tilastointitarkoituksen toteuttamista. Tilastointitarkoitus määritellään tietosuoja-asetuksessa (johdanto-osan 162. kappale) laajasti: "Tilastollisilla tarkoituksilla tarkoitetaan mitä tahansa henkilötietojen keräämis- ja käsittelytoimenpidettä, joka on tarpeen tilastotutkimuksia varten tai tilastollisten tulosten tuottamiseksi." Näistä syistä on ilmennyt tarvetta pyrkiä parantamaan edellytyksiä henkilöiden tavoittamiseksi. Nykyisin käytössä olevien Digi- ja väestötietoviraston aineistojen lisäksi esimerkiksi Verohallinnon aineistot voivat olla tarpeellisia. Toisaalta yhteystiedot ovat verotustietojen julkisuudesta ja salassapidosta annetun lain 4 §:n mukaan salassa pidettäviä. Tästä syystä Verohallinto ei ole luovuttanut hallussaan olevia yhteystietoja tilastokeskukselle. Pykälän 4 momenttiin lisätään maininta yhteystiedoista (puhelinnumero, sähköpostiosoite) sekä Kelan hallussa olevien yhteystietojen toimittamisesta tilastokeskukselle. Digi- ja väestötietoviraston tietosuojasta on säädetty laissa eräistä henkilörekistereistä (2019/1156).

18 §. Yrityksiä ja yhteisöjä koskevien tietojen julkisuus. Pykälän 5 momenttia ehdotetaan lakiteknisesti täsmennettäväksi, sillä momentissa mainittu henkilötietolaki on kumottu tietosuojalailla. Tämän johdosta säädösviittaus momentin toisessa virkkeessä muutetaan koskemaan tietosuoja-asetusta ja säädösviittaus momentin kolmannessa virkkeessä henkilötietojen käsittelyä koskevia säännöksiä, joita on tietosuoja-asetuksen lisäksi useassa kansallisessa säädöksessä, kuten julkisuuslaissa, tietosuojalaissa ja tiedonhallintalaissa. Säännöksessä mainittu kielto-oikeus vastaa tietosuoja-asetuksessa tarkoitettua vastustamisoikeutta.

8 Lakia alemman asteinen sääntely

Esitykseen ei välittömästi liity lakia alemman asteista sääntelyä. Esityksen johdosta on kuitenkin arvioitava tarvetta sisällöllisesti kehittää perinteisesti kahden vuoden välein teknisesti päivitettävää VM:n asetusta tilastokeskuksen suoritteiden maksullisuudesta vuosina 2020 ja 2021 (1271/2019, jäljempänä VM:n TK-asetus), joka nykyisin (1137/2021) on voimassa vuoden 2022 loppuun. Lisäksi on tarpeen selvittää tilastoneuvostoa koskevan sääntelyn ajantasaistamista vanhassa asetuksessa tilastokeskuksesta (1110/1991 ja 105/1992, joista jälkimmäinen vaikuttaa tulleen kumotuksi mutta edellinen ei) ja tarvetta arvioida tarvetta nostaa sääntely perustuslaista johtuvista syistä lain tasolle.

9 Voimaantulo

Ehdotetaan, että lait tulevat voimaan 1.1.2023.

10 Toimeenpano ja seuranta

Ehdotettujen lainmuutosten vaikutuksia seurataan VM:ssä. Kansalliseen tilastolainsäädäntöön kohdistuu edelleen paitsi ajantasaistamistarpeita myös keskustelua tilastokeskuksen tiedonsaantioikeuksien laajentamisesta esimerkiksi varallisuustilastoinnin ja alueellisen tilastoinnin kehittämiseksi sekä tiedonantamisvelvollisuuden täsmentämisestä erityisesti tutkija- ja aineistopalvelun vahvistamiseksi. Näitä aiheita, tarvetta ottaa käyttöön toiminnan tavoitteiden toteutumisen arviointia tukevia selkeitä mittareita sekä jäljempänä mainittuja hallintovaliokunnan näkemyksiä on tarkoitus erityisesti uudistuvan EU-sääntelyn vaikutusten näkökulmasta tarkemmin käsitellä kansallisen tilastolainsäädännön muita kuin kiireellisiä uudistamistarpeita koskevassa, myöhemmin julkistettavassa arviomuistiossa, joka julkistetaan viimeistään esityksen eduskuntakäsittelyn jälkeen, jolloin valiokuntien mahdolliset jatkovalmistelutoiveet ovat selvinneet. Kansallisen tilastolainsäädännön muiden uudistustarpeiden, kuten valmisteilla ja voimassa olevan EU-sääntelyn ja tietosuojan uudistuneen sääntelyn ja soveltamiskäytännön, arviointia jatketaan kuluvan hallituskauden aikana, missä yhteydessä myös nyt ehdotettujen lainmuutosten toimivuutta ja vaikutuksia seurataan.

Eduskunnan hallintovaliokunta on todennut, käsitellessään hallituksen esitystä 77/2019 vp eduskunnalle laiksi tilastolain muuttamisesta, että ”EU:n yleisen tietosuojalainsäädännön voimaantulon vaikutuksia tilastolakiin on syytä vielä erikseen tarkemmin arvioida ja tarvittaessa ryhtyä lainvalmistelutoimiin tilastolain uudistamiseksi” (HaVM 14/2019 vp, s. 3-4). Valiokunnan toteamus on pyritty ottamaan esityksessä huomioon.

Eduskunnan hallintovaliokunta on lisäksi antanut useita lausuntoja tietosuoja-asetuksesta (HaVL 11/2012 vp, HaVL 6/2013 vp, HaVL 30/2014 vp, HaVL 22/2014 vp, HaVL 36/2014 vp, HaVL 2 /2015 vp, HaVL 10/2015 vp ja HaVL 25/2015 vp). Myös perustuslakivaliokunta on antanut lausunnon tietosuoja-asetuksesta (PeVL 12/2012 vp), johon esitystä on peilattu.

Jatkovalmistelussa on tarkoitus arvioida kansallisen tilastolainsäädännön sääntelyrakennetta, kuten (i) tarvetta uudistaa TK-laki ottamalla paremmin huomioon moderni sääntely keskusvirastoista sekä tavoitteet tilastokeskuksen strategiseksi kehittämiseksi, etenkin osana tiedon arvoketjun kehittämistä ja selkeyttämistä, (ii) tarvetta tarkastella VN:n TK-asetuksen ja VM:n TK-asetuksen lainsäädäntöä täydentävää asemaa ja päivittämistarvetta, erityisesti tutkija- ja aineistopalvelun kehittämisen kannalta, (iii) mahdollista tarvetta säännellä tilastokeskuksen tehtävistä sekä mainittujen asetusten ja tilastokeskuksen työjärjestyksen sisällöstä tarkemmin lain tasolla, (iv) seurata ja arvioida vireillä olevien yleishallinto-oikeuteen liittyvien OM:n hankkeiden (julkisuuslaki, automaattinen päätöksenteko, valmiuslaki (1552/2011)) vaikutusta kansalliseen tilastolainsäädäntöön, ensi vaiheessa TK-lakiin, sekä EU:n datahallintosäädöksen, 21.4.2021 annetun tekoälyn harmonisoitua sääntelyä koskevan asetusehdotuksen (U 28/2021 vp) ja 23.2.2022 annetun EU:n Data Act -asetusehdotuksen (U 29/2022 vp) vaikutusta kansalliseen tilastolainsäädäntöön. Lisäksi on edelleen tarvetta arvioida (v) tilastotiedon suhdetta sisäpiirintiedon ja markkinoiden väärinkäytön rikosoikeudelliseen sääntelyyn sekä (vi) tarvetta tilastotoimen tiedonkeruuvaltuuksien päivittämiseen käytännesääntöjen periaatetta 2 vastaavalla tavalla, etenkin valtioneuvoston ja sen ministeriöiden politiikkatavoitteiden ja tietoaineistotarpeiden tukemiseksi. Samoin voi olla tarvetta arvioida, onko tarpeen säätää laissa (vii) muista tilastokeskuksen viranomaistoimintaa tukevista nykyisistä ja osaksi sen rooliin valtion tilastotoimen yleisviranomaisena kuuluvista tehtävistä (esimerkiksi mikrosimulointi, energia- ja ympäristötilastointi, kasvihuonekaasuinventaario, Eurostatille toimitettava julkisyhteisöjen alijäämä ja velkaraportointi (excessive deficit procedure, EDP), väestöennuste ja toimiminen kuolinsyyasiakirjojen arkistoviranomaisena). Näitäkin kysymyksiä käsitellään kansallisen tilastolainsäädännön muita kuin kiireellisiä uudistamistarpeita koskevassa arviomuistiossa, jonka liitteenä on luonnos modernia keskusvirastosääntelyä vastaavaksi uudeksi TK-laiksi.

Tilastokeskuksen työjärjestys antaa pääjohtajalle keskusvirastoille tyypilliseen tapaan laajat toimivaltuudet, mikä muun muassa on mahdollistanut päätöksen Tilannehuoneen hyväksi toteutetusta erillispalvelusta saada ajantasaista tilastoaineistoa muista tiedontarvitsijoista poikkeavin ehdoin. Myös tilastokeskuksen tehtävien kehittäminen palvelu- ja tieto-organisaation suuntaan sekä avoimen datan periaatteen noudattaminen ja tiedon pitäminen tietoturvallisessa käsittely-ympäristössä, mahdollisimman tasapuolisesti tiedontarvitsijoiden saatavilla, ajantasaisena aineistona ja ilman aiheetonta viivytystä puoltavat sitä, että etenkin TK-lakia on modernisoitava.

STM on 13.9.2021 julkaistussa kolumnissa kertonut käynnistäneensä selvityksen toisiolain vaikutuksista (https://stm.fi/-/toisiolakia-kehitetaan-yhteistyossa-). Tavoitteena on selvittää, miten hyvin toisiolaille asetetut tavoitteet ovat toteutuneet ja tunnistaa toisiolain erilaiset vaikutukset. Saadun tiedon mukaan STM:n selvitys ei tule johtamaan lainsäädäntötoimiin kuluvalla vaalikaudella. Lisäksi OKM on 17.11.2021 julkaissut hallituksen TKI-tiekartan (Kestävän ja kehittyvän yhteiskunnan ratkaisuja tuottava Suomi, 23.4.2020) mukaisen selvityksen ”tutkimusta koskevien sosiaali- ja terveydenhuollon säädösten vaikutuksesta tutkimuksen vapauteen ja tutkimus-, kehittämis- ja innovaatiotoimintaan” (OKM:n julkaisuja 2021:42), missä on käsitelty henkilötiedon relatiivisia ja objektiivisia tulkintalinjoja sekä niihin liittyvää, relatiivista tulkintalinjaa tukevaa eurooppalaista oikeuskäytäntöä. Sama tieto voi siis olla henkilötietoa yhdelle, mutta anonyymia toiselle. Selvityksen 19 ratkaisuehdotuksen yhteyttä tilastokeskuksen toimintaan käsitellään tarkemmin esityksen jatkovalmistelussa. Esitys pyrkii noudattamaan hallituksen TKI-tiekartan mukaisia suuntaviivoja ja nojautuu tietosuoja-asetuksen 159. johdantokappaleeseen, kun se pyrkii edistämään kehittämis- ja innovaatiotoimintaa tieteessä ja tutkimuksessa.

Esityksen kiireellisyyden ja valittujen rajausten vuoksi toisiolaista on käytetty vain 14 §:ää mallina TK-lakiin ehdotetulle uudelle 2 b §:lle, mutta ei toisiolakia laajemmin, useastakin syystä: (i) toisiolaki on huomattavasti tilastolainsäädäntöä yksityiskohtaisempi, (ii) toisiolaissa tarkoitettu tutkimusaineisto (tietosisällöt, tietotyypit) on paljolti erilaista kuin tilastokeskuksen tarjoama aineisto, joka toisiolaista poiketen ei olennaisesti perustu vahvasti suojattuihin yksityisiin henkilötietoihin eikä siksi sulje kehittämis- ja innovaatiotoimintaa tieteen ja tutkimuksen edistämisen ulkopuolelle, (iii) eduskunnan perustuslakivaliokunta ja sosiaali- ja terveysvaliokunta ovat edellyttäneet toisiolain viipymätöntä korjaamista, (iv) toisiolain Findatalle tarjoama asema kansallisessa tutkimusinfrastruktuurissa on erilainen kuin se rooli, joka tilastokeskukselle on tarpeen säätää valtion tilastotoimen yleisviranomaisena, ja (v) STM on ilmoittanut arvioivansa toisiolain toimivuutta. Saadun tiedon mukaan STM:ssä on tehty toistaiseksi julkaisematon esiselvitys toisiolain vaikutuksista ja toimeenpanosta, minkä lisäksi lainsäädäntökysymysten arviointia varten on perustettu työryhmä selvittämään kansainvälisiä tietoluovutuksia.

OKM:n selvitys korostaa tarvetta pikaisesti ratkaista pseudonymisoidun tiedon henkilötietoluonnetta koskeva ongelma tilanteessa, jossa tiedon luovutuksensaajalla ei ole tosiasiallisia tai laillisia keinoja tunnistaa rekisteröityä lisätietoja käyttämällä tai muutoin yksilöimällä rekisteröityä tiedoista. OKM:ssä on lisäksi valmisteilla hallituksen esitys laiksi CSC – Tieteen tietotekniikan keskus Oy -nimisestä osakeyhtiöstä ja sen tehtävistä. Yhtiö hallinnoi, ylläpitää ja kehittää julkista tutkimusinfrastruktuuria sekä tarjoaa omistajilleen tutkimuksen, koulutuksen, kulttuurin ja julkishallinnon asiantuntijapalveluja. Esitysluonnoksen mukaan yhtiö voi markkinahintaisesti myydä julkisen tutkimusinfrastruktuurin ylimääräistä kapasiteettiaan myös muille kuin omistajilleen.

Näistä syistä esitys on rajoitettu koskemaan tutkija- ja aineistopalvelun vakiinnuttamista lain tasolla ja eräitä tilastokeskuksen uusia tiedonsaantioikeuksia. Toisaalta esitystä on peilattu suhteessa toisiolakiin ja otettu siten huomioon eduskunnan perustuslakivaliokunnan ehdotus siitä, että ”sosiaali- ja terveysvaliokunnan on syytä tarkastella huolellisesti toisiolain uudistamistarpeita erityisesti tieteellisen tutkimuksen näkökulmasta” (PeVL 25/2021 vp).

Jatkovalmistelua varten on valmisteilla arviomuistio muista esitystä valmisteltaessa esille nousseista kansallisen tilastolainsäädännön kehittämistarpeista, joiden ei ole arvioitu olevan niin kiireellisiä, että niitä olisi ollut käsiteltävä tässä esityksessä. Kansallisesta tilastolainsäädännöstä on tarkoitus tällöin arvioida ensisijaisesti VM:n hallinnonalan sääntelyä (tilastokeskus, Tulli) mutta ottaa huomioon myös liikenne- ja viestintäministeriön, maa- ja metsätalousministeriön ja STM:n hallinnonalan tilastotointa koskeva sääntely. Alustavasti VM:n tietoon tulleita tällaisia kehittämisnäkökohtia on niin runsaasti, että esityksen valmistelussa noudatettua VM:n ja tilastokeskuksen intensiivistä kahdenvälistä valmistelutapaa lienee tarkoituksenmukaista myöhemmin laajentaa muihinkin sidosryhmiin.

11 Suhde muihin esityksiin

11.1 Esityksen riippuvuus muista esityksistä

Esitys liittyy hallituksen esitykseen 22/2022 vp eduskunnalle laiksi positiivisesta luottotietorekisteristä ja eräiksi siihen liittyviksi laeiksi. Positiiviseen luottotietorekisteriin talletetaan tietoja luonnollisen henkilön luotoista ja tuloista. Rekisterinpitäjänä toimii Verohallinnon Tulorekisteriyksikkö. Rekisterin avulla luotonantaja voi nykyistä helpommin ja luotettavammin arvioida lainanhakijan kykyä maksaa luotto takaisin. Rekisterin käyttötarkoituksia ovat tietojen käyttö luotonannossa sekä rahoitusvakauden ja rahoitusmarkkinoiden seurannassa ja valvonnassa. Laissa positiivisesta luottotietorekisteristä säädetään rekisterinpitäjästä, rekisteriin talletettavista tiedoista, velvollisuudesta ilmoittaa tiedot rekisteriin, tietojen luovutuksesta rekisteristä sekä lain sisältämien velvollisuuksien valvonnasta. Tietojen ilmoitusvelvollisuuden valvontaviranomaisina toimivat Finanssivalvonta ja Etelä-Suomen aluehallintovirasto. Rekisterin käyttöä valvovat ne viranomaiset, joiden tehtäviin kuuluu jo nykyisin lain soveltamisalaan kuuluvien luotonantajien valvonta. Laki positiivisesta luottotietorekisteristä on tarkoitettu tulemaan voimaan 1.8.2022. Lakia sovelletaan kuitenkin porrastetusti ja kokonaisuudessaan vasta 1.4.2024 lähtien, jolloin rekisteri otetaan käyttöön.

Arkistolainsäädännön uudistus on valmisteilla OKM:ssä. Hankkeessa on tarkoitus muun muassa muuttaa arkistoinnin keskeisiä käsitteitä yhdenmukaistamalla niitä tiedonhallintalain kanssa. Hankkeesta on aloitettu lausuntomenettely huhtikuussa 2022. Esityksessä ei aikataulusyistä ole voitu ottaa huomioon tätä arkistolain esiselvitykseen perustuvaa valmistelua eikä siksi esimerkiksi säilytysaikaa koskeviin vaatimuksiin ehdoteta muutoksia: https://okm.fi/documents/1410845/33413091/Arkistolain+esiselvitysraportti.pdf/5c7763b9-9081-fabf-98b8-3e69dfeeedd2?t=1598526812096.

Positiivisesta luottotietorekisteristä annettavan lain ja arkistolainsäädännön uudistuksen vaikutuksia kansalliseen tilastolainsäädäntöön on tarkoitus käsitellä esityksen jatkovalmistelussa. Hankkeen taloudelliset vaikutukset liittyvät muun muassa eri viranomaisten automaattista tietojenkäsittelyä koskeviin investointitarpeisiin. Kiireellisimmät, etenkin positiivisesta luottotietorekisteristä johtuvat muutostarpeet tilastolainsäädäntöön pyritään tarvittaessa ja mahdollisuuksien mukaan ottamaan esille esityksen eduskuntakäsittelyn yhteydessä. Arkistointia ja säilytystä koskevien tilastolainsäädännön muutostarpeiden arvioidaan sen sijaan edellyttävän yhteisvalmistelua paitsi tilastokeskuksen myös muiden tilastoviranomaisten kanssa.

EU:n datahallintosäädöksen soveltaminen alkaa 15 kuukauden kuluttua säädöksen voimaantulosta. Esityksen mukaisen sääntelyn on tarkoitus tulla voimaan 1.1.2023, ja datahallintosäädöksen mukainen sääntely tulee sovellettavaksi jo muutamia kuukausia tämän jälkeen. Esityksessä on pidättäydytty tekemästä EU:n datahallintosäädökseen liittyviä ehdotuksia, koska EU:n datahallintosäädöksen kansallista täytäntöönpanoa valmistellaan VM:ssä erillisenä esityksenä ja koska EU:n tilastoasetukseen kuluvana vuonna komission todennäköisesti ehdottamat muutokset liittyvät myös EU:n datahallintosäädökseen.

Julkisuuslain uudistaminen on vireillä OM:n työryhmässä, jonka tarkoitus on ajantasaistaa nykyinen julkisuussääntely. Koska hanke on asetettu päättymään kesäkuussa 2023, esityksessä on rajoituttu tarkastelemaan julkisuuslain uudistamistarpeita ja sen käytännön toteutumisen keskeisimpiä esteitä tilastoviranomaisten näkökulmasta. Julkisuuslain muutossuunnitelmien vaikutusta kansalliseen tilastolainsäädäntöön on tarkoitus käsitellä esityksen jatkovalmistelussa.

11.2 Suhde talousarvioesitykseen

Esitys vahvistaa tutkija- ja aineistopalvelun lakisääteistä asemaa ja parantaa tutkijayhteisön tiedonsaantioikeuksien lisäksi valtioneuvoston ja sen ministeriöiden edellytyksiä talousarvioesityksen laadintaan, kun valmistelua varten tarvittavat aineistot saadaan tilastokeskuksesta nopeammin, tehokkaammin ja karkeistamattomina, mikä samalla välillisesti parantaa edellytyksiä eduskunnan tiedonsaantiin. Esityksen taloudellisia vaikutuksia arvioitaessa on otettava huomioon tutkija- ja aineistopalvelun hinnoittelu, organisointi ja resursointi, siirtyminen – maksuperustesääntelyn niin salliessa – hinnoittelun mahdolliseen porrastukseen soveltamalla erilaisia maksuperusteita eri asiakasryhmiin, tilastokeskuksen palvelutason, toimintatapojen ja voimavarojen kehittyminen sekä valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien käyttölupahakemusten etusija valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden. Taloudelliset vaikutukset johtuvat siten pikemminkin kannusteista kustannusvastaavuuteen tähtääviin muutoksiin tilastokeskuksen toiminnassa kuin suoraan esityksestä. Esityksen keskeiset vaikutukset ovat (i) tilastokeskuksen kannustaminen tutkija- ja viranomaisyhteisön tiedontarvitsijoiden etuja edistäviin investointeihin ja ratkaisuihin, (ii) tilastokeskuksen tiedonsaantioikeuksien laajentuminen muilta viranomaisilta saataviin tietoihin (esimerkiksi tiedot, joita ei tarvita tilastointitarkoitukseen, oikeus ottaa vastaan hallinnollisia rekisteriaineistoja tutkija- ja aineistopalvelun hoitamiseksi sekä aineistojen keräämisen ja tutkimus- ja selvityskäyttöön luovuttamisen tehostaminen muutoin) sekä (iii) valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien käyttölupahakemusten asettaminen etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden. Esitys parantaa siten valtioneuvoston ja sen ministeriöiden palvelutasoa hallituksen kiireellisten (esimerkiksi TEAS-hanketta koskevien) tietopyyntöjen toteuttamiseksi ja liittyy samalla olennaisilta osin eduskunnan tietoaineistotarpeiden tyydyttämiseen.

Tilastokeskus on ilmoittanut osoittaneensa Tilannehuoneen voimavaroiksi palvelun perustamisvaiheeseen alun perin kaksi henkilötyövuotta. Tutkija- ja aineistopalvelun säätäminen tilastokeskuksen lakisääteiseksi tehtäväksi saattaa toteutustavasta (tekninen tuotantoympäristö, lisenssit) ja valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien käyttölupahakemusten ehdotetun etusijan valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden edellyttämästä lisätyöstä riippuen aiheuttaa erilaisia seurauksia esimerkiksi resurssitarpeiden näkökulmasta sekä siten kustannuspaineita ja tarvetta osoittaa lisävoimavaroja tutkija- ja viranomaisyhteisölle suunnatun tilastoaineiston vastaanottamiseen, tuottamiseen ja jakeluun. Kysymys on sekä esitykseen että tilastokeskuksen voimavaroihin liittyvistä seikoista, jotka käsitellään VM:n ja tilastokeskuksen välisissä tulosohjausneuvotteluissa. Tilastokeskukselle voidaan osoittaa talousarviovalmistelussa lisämääräraha (budjettirahoitus) taikka toissijaisesti ratkaista kustannuspaine kokonaan tai osittain tutkija- ja aineistopalvelun maksullisuutta lisäämällä (yhteisrahoitus). On myös arvioitava, tuleeko tutkija- ja aineistopalvelussa siirtyä kustannukset kattavaan hinnoitteluun tai valtion maksuperustelain (150/1992) 7 §:n 1 momentissa tarkoitetun hintatuen käyttöön. Tutkijapalvelun tuloista suurin osa (noin 70 %) syntyy nykyisin läpilaskutuksena etäkäyttöjärjestelmän ylläpitämiseen liittyvistä maksuista.

Toisiolain vaikutuksia tutkimukseen ja data-analytiikan sovelluksiin kartoittanut selvitys nosti esille sen, ettei tutkimusrahoitusten rakenne ole kaikilta osin seurannut tiedon hankintaan liittyvän kustannusrakenteen muutosta. Tietosuoja-asetuksen ja toisiolain edellyttämän tietoturvallisen infrastruktuurin ja tiedon hankinnan kustannuksia ei oteta huomioon tutkimusrahoituksessa, mikä on osoittautunut ongelmaksi erityisesti pienille akateemisille toimijoille. Samat ongelmat koskevat tilastokeskuksen tutkija- ja aineistopalvelun käyttäjiä.

Tutkijapalvelun nykyiset vuosittaiset kokonaiskustannukset on arvioitu noin 5,5 miljoonaksi euroksi ja kustannusvastaavuus 25-30 prosentiksi. Kokonaiskustannusten hintatuki asiakkailta perittyjen maksujen korotusten jälkeenkin on laskelmien mukaan 3,8-4,4 miljoonaa euroa vuoden 2022 tasossa. Kustannuksia ei voida viedä täysimääräisesti asiakashinnoitteluun, koska tutkimusrahoituksessa ei useinkaan oteta huomioon tietoturvallisen käyttöympäristön ja aineistohankinnan kustannuksia.

Esitys ei VM:n arvion mukaan sellaisenaan vaikuta menoja kasvattavasti, sillä ehdotukset ovat lähinnä (i) mahdollistavia (tutkija- ja aineistopalvelun palvelutason kohentaminen ja mahdollisuus antaa tilastokeskuksesta tutkija- ja viranomaisyhteisön käyttöön eräitä aineistoja nykyistä aikaisemmin), joskin tutkija- ja aineistopalvelulle aiheutuu kustannuksia aineistojen valmistamisesta tutkijoille valmisaineistoiksi, (ii) teknisluontoisia (rekisterinpito) tai (iii) nykyistä käytäntöä vahvistavia (etäkäyttö). Nykyisen varsin tiukan menokehyksen oloissa on siten nähtävissä kaksi selkeästi toisistaan erottuvaa vaihtoehtoa: joko (i) Tilannehuoneelle ohjatut voimavarat osoitetaan valtioneuvoston ja sen ministeriöiden hyväksi ehdotetun kiireelliseksi ilmoitettujen käyttölupahakemusten etusijan perusteella valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden, jolloin olemassa olevan erillispalvelun kohde muuttuu Tilannehuoneesta valtioneuvostoksi ja sen ministeriöiksi, minkä seurauksena Tilannehuoneen palvelutaso palaa samalle tasolle muiden tutkija- ja viranomaisyhteisön tiedontarvitsijoiden kanssa tai (ii) tutkija- ja aineistopalvelun toiminnan luonne ja volyymi muuttuu, jolloin kaikkien tiedontarvitsijoiden asema tutkija- ja viranomaisyhteisössä kohoaa samalle tasolle Tilannehuoneen nykyisen palvelutason kanssa, mikä edellyttää tilastokeskuksen tutkija- ja aineistopalveluun kohdentamien voimavarojen lisäämistä. Jälkimmäisessä vaihtoehdossa (i) valtioneuvoston ja sen ministeriöiden kiireelliseksi ilmoittamien käyttölupahakemusten asettaminen etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden ei mahdollisesti korostu yhtä voimakkaasti eikä muiden viranomaisten, kuten KKV:n ja VATT:n, ole tarpeen rakentaa omia tietojärjestelmiä tiedon hyödyntämistä varten, ja (ii) Tilannehuoneen tietovarannot (osana voimavaroja) säilyvät tilastokeskuksen hallinnassa, eikä vaihtoehdosta ilmeisesti myöskään aiheudu kysymyksiä EU:n tilastoasetuksen tilastoviranomaisten riippumattomuutta koskevan vaatimuksen näkökulmasta.

Tutkija- ja aineistopalvelu on tilastokeskuksen maksullista toimintaa, joka hinnoitellaan liiketaloudellisin perustein tuntihinnan mukaan siten, että toiminnan tulot kattavat vähintään toiminnasta aiheutuvat menot. Tilastokeskuksen maksullista toimintaa ohjaavat perinteisesti kahden vuoden välein teknisesti päivitettävä VM:n TK-asetus, valtion maksuperustelaki ja valtion maksuperusteasetus (211/1992). VM:n TK-asetuksen 2 § edellyttää, että toimeksiantopalvelut, tutkimukset ja selvitykset, tilasto- ja muut asiantuntijapalvelut, tutkimus- ja muiden aineistojen muokkaaminen sekä muut niihin liittyvät kulut ja palvelut ovat suoritteita, jotka tilastokeskus hinnoittelee liiketaloudellisin perustein. Tutkija- ja aineistopalvelu on hinnoiteltava liiketaloudellisin tai kustannusperustein (7 §), koska palvelu ei ole julkisoikeudellinen suorite vaan monopolisuorite. Kustannusperusteisessa hinnoittelussa palvelun asiakkailta saadut tulot kattavat palvelun tuottamisen kustannukset. Hinnoittelu liiketaloudellisin perustein tarkoittaa, että asiakkailta saadut tulot vastaavat kustannuksia ja tuottavat kohtuullista katetta niin, että syntyy voittoa. Koska tilastokeskuksen määrärahamomentti on nettobudjetoitu, maksullisesta toiminnasta asiakkailta saadut tulot jäävät tilastokeskuksen käyttöön. Tutkija- ja aineistopalvelun on oltava maksullista, jos suoritteen maksuttomuudelle ei ole perusteita (4 §). Palvelun tuottamisen kustannus tarkoittaa suoritteen tuottamisesta valtiolle aiheutuvien kokonaiskustannusten määrää. Nykyisessä tutkijapalvelussa tämä tarkoittaa niitä kustannuksia, joita ei synny, jos tutkijapalvelua ei ole, ja tutkijapalvelun henkilöstökulujen suuruista osuutta tilastokeskuksen yhteisistä kustannuksista (esimerkiksi hallinnointikustannuksista).

Tutkijapalvelun käytöstä viime vuosina kasvaneista tuloista huolimatta tilastokeskus kattaa suurimman osan tutkijapalvelun kustannuksista budjettirahoituksella ylläpitääkseen riittäviä henkilövoimavaroja ja pitääkseen hinnat tutkijoille matalampina kuin heidän aiheuttamansa kustannukset. Tutkija- ja aineistopalvelun palvelukyvyn saattaminen hyväksyttävälle tasolle voi kuitenkin edellyttää lisämäärärahaa valtion talousarviosta rahoitettaviin tilastokeskuksen toimintamenoihin. Tutkijapalvelu tuotetaan nykyisin vain osittain (25-30 %) asiakasrahoitteisesti, joten tilastokeskuksen sisäisesti subventoima osuus (yli kaksi kolmannesta) on edelleen merkittävä.

Toisaalta valmisaineistoissa merkittävä määrä tehtävästä käsittelystä aiheuttaa tilastokeskukselle kustannuksia, jotka syntyvät esimerkiksi aineiston käytettävyyden parantamisesta osalle aineiston käyttäjistä (tutkinnot) tai aineiston karkeistamisesta tavalla, joka ei muutoin kuin tietosuojasyistä ole välttämätöntä. Tilastokeskus luovuttaa pseudonymisoituja aineistoja nykyisin vain tutkijapalvelun tai Findatan etäkäyttöympäristöihin. Ylimääräinen palvelu tulee lähtökohtaisesti laskuttaa asiakkailta. Jos asiakas tarvitsee aineiston alkuperäismuodossa (tutkintorekisteri relaatio-muotoisena tai tulotiedot karkeistamattomina), laskutustarvetta ei ole. Jos palvelutasoa kasvatetaan, tällaisia toimeksiantoja toteutetaan nykyistä enemmän. Tästä seuraa tilastokeskukselle tulovirta, jolla se voi vastaavasti kattaa palvelutason parantamisesta syntyviä menoja. Kustannusten vieminen täysimääräisesti tutkijoiden maksettavaksi ei välttämättä onnistu, koska tutkimusrahoitus ei nykyisin ota huomioon datan hankkimiskustannuksia eikä tietosuoja-asetuksen ja sosiaali- ja terveystietojen käyttöä koskevan toisiolain edellyttämän tietoturvallisen käyttöympäristön infrastruktuurikustannuksia. Tämä on ongelma erityisesti pienille akateemisille toimijoille (edellä mainittu VTT-R-00118-21).

Tilastokeskuksessa on arvioitu kustannuksia syntyvän myös siitä, että 'käsittelemättömästä’ aineistosta tehdään valmisaineisto, joka on työläämpää viedä tutkija- ja aineistopalveluun kuin valmisaineistojen tekeminen tilastoaineistoista. Tilastokeskuksesta on ilmoitettu, että siltä puuttuvat ’käsittelemättömien’ aineistojen tarkemmat metatiedot (muut kuin tekniset tiedot), joten samasta aineistosta syntyy kaksi versiota: (i) ’käsittelemätön’ valmisaineisto ja (ii) ’lopullinen’ laatukorjattu ja kuvattu valmisaineisto. Lisäksi kustannuksia aiheutuu ICT-palveluntarjoaja CSC:n ja mahdollisesti Valtion tieto- ja viestintätekniikkakeskus Valtorin laskuttamasta tallennuskapasiteetin käytöstä. Tilastokeskuksen 1.1.2022 voimaan tulleiden hinnankorotusten kerrottiin tilastokeskuksen asiakkaille järjestetyssä verkkotiedotustilaisuudessa 22.11.2021 perustuvan ICT-palveluntarjoaja CSC:n veloitusten aiheuttamiin nousseisiin kustannuksiin. Tutkija- ja aineistopalvelussa säilytetään näitä uusia isoja 'käsittelemättömiä' valmisaineistoja, koska tilastokeskuksessa ei ole muuten tarvetta niitä säilyttää. Tilastokeskuksen voimassa oleva päätös on, että käsittelemätön aineisto poistetaan vuoden kuluessa. Esityksen perusteella näitä tietoja säilytetään niin pitkään kuin se on tarpeellista tutkija- ja aineistopalvelua koskevan tehtävän vuoksi tai pysyvästi Kansallisarkiston päätöksellä. Ehdotus vastaa siten arkistolain 8 §:ää, jonka mukaan arkistonmuodostaja päättää säilytysajat ja arkistolaitos (nykyinen Kansallisarkisto) puolestaan pysyvästä säilytyksestä. Esitystä valmisteltaessa on kuitenkin arvioitu, että viranomaiset, jotka toimittavat tietoja tilastokeskukselle, voivat sopimusperusteisesti toimittaa teknisen kuvauksen ohella selitteen siitä, mitä kyseinen tieto tarkoittaa. Viranomaisilla on tyypillisesti tämä metatieto hallussaan, koska metatiedot ovat käytännössä välttämättömiä aineiston käsittelyyn sekä tilastointi että tutkimustarkoitukseen.

Data-analyysin hyödyntämistä päätöksenteon tukena ja datahuone-pilottia selvittävä, edellä jaksossa 5.1 selostettu Datahuonetyöryhmä on ehdottanut budjettirahoitusta toimintaan sekä tilastokeskukselle että VATT:lle. Osana julkisen talouden JTS-suunnitelmaa hallitus on 5.4.2022 päättänyt, että data-analyysitoimintaa pilotoidaan vuosina 2023-2025 ja että toimintaan varataan yhteensä 1 200 000 euron vuosittainen rahoitus ajanjaksolle. Tarkemmat linjaukset tehdään Datahuonetyöryhmän selvitysten pohjalta. Lisäksi hallitus arvioi, mitä lisätoimia tarvitaan, jotta Tilannehuoneen pikainen jatko voidaan turvata eduskunnan lausuman mukaisesti jo vuoden 2022 aikana (EV 12/2022 vp – TaVM 5/2022 vpHE 9/2022 vp).

12 Suhde perustuslakiin ja säätämisjärjestys

Tietosuoja-asetus

Eduskunnan perustuslakivaliokunta on todennut, että tietosuoja-asetus on kaikilta osiltaan velvoittava EU:n säädös, jota sovelletaan sellaisenaan kaikissa jäsenvaltioissa. EU:n tuomioistuimen, jäljempänä EUT, vakiintuneen oikeuskäytännön mukaan EU:n lainsäädäntö on ensisijaista suhteessa kansallisiin säännöksiin oikeuskäytännössä määriteltyjen edellytysten mukaisesti (PeVL 1/2018 vp, s. 3). Valiokunta on myös todennut, ettei sen valtiosääntöisiin tehtäviin kuulu kansallisen täytäntöönpanosääntelyn arviointi EU:n aineellisen lainsäädännön kannalta (PeVL 31/2017 vp, s. 4). Valiokunta on kuitenkin esittänyt huomioita EU:n lainsäädännön ja kansallisen lainsäädännön suhteesta. Valiokunta on tulkintakäytännössään pitänyt tärkeänä, että siltä osin kuin EU:n lainsäädäntö edellyttää kansallista sääntelyä tai mahdollistaa sen, tätä kansallista liikkumavaraa käytettäessä otetaan huomioon perus- ja ihmisoikeuksista seuraavat vaatimukset (PeVL 1/ 2018 vp, s.3, PeVL 25/2005 vp, s. 3). Valiokunta on tämän johdosta painottanut, että hallituksen esityksessä on erityisesti perusoikeuksien kannalta merkityksellisen sääntelyn näkökulmasta syytä tehdä selkoa kansallisen liikkumavaran alasta (PeVL 26/2017 vp, s. 42, PeVL 2/2017 vp, s. 2, PeVL 44/2016 vp, s. 4, PeVL 1/2018 vp, s. 3). Erityisesti esityksen 1. lakiehdotuksessa on pyritty noudattamaan näitä valiokunnan asettamia yleisiä lähtökohtia tietosuoja-asetuksen soveltamisesta. Tilastokeskus on tilastointitarkoituksiin kerätyn aineiston rekisterinpitäjä ja tutkija- ja aineistopalvelua varten vastaanotettujen tietojen rekisterinpitäjä, silloin kun tiedoista muodostetaan tutkija- ja aineistopalvelussa säilytettävä valmisaineisto. Tilastokeskus on lisäksi tutkija- ja aineistopalvelua varten vastaanotettujen tietojen henkilötietojen käsittelijä, jos tiedot tulevat yksittäisen tutkimushankkeen käyttöön tutkija- ja aineistopalvelussa eikä niistä muodosteta valmisaineistoa.

Perustuslakivaliokunta on lisäksi korostanut arkaluonteisten tietojen käsittelyn käyttötarkoitussidonnaisuuden vaatimusta (PeVL 1/2018 vp, s. 4). Tietojen käyttämiseen varsinaisen keräämis- ja tallettamistarkoituksen ulkopuolelle jääviin tarkoituksiin on valiokunnan mukaan ollut syytä suhtautua kielteisesti esimerkiksi laajojen biometrisiä tunnisteita sisältävien rekisterien yhteydessä (PeVL 14/2009 vp, s. 4/II). Käyttötarkoitussidonnaisuudesta on voitu tällöin tehdä vain täsmällisiä ja vähäisiksi luonnehdittavia poikkeuksia. Sääntely ei ole saanut johtaa siihen, että muu kuin alkuperäiseen käyttötarkoitukseen liittyvä toiminta muodostuu rekisterin pääasialliseksi tai edes merkittäväksi käyttötavaksi (PeVL 14/2017 vp, s. 5-6). Erityisesti esityksen 1. lakiehdotuksessa on pyritty noudattamaan näitä valiokunnan asettamia tietojen luovuttamiseen ja käyttötarkoitussidonnaisuudesta poikkeamiseen liittyviä edellytyksiä.

Perustuslakivaliokunnan mukaan henkilötietojen suojaan kohdistuvassa valtiosääntöisessä arviossa painopiste on henkilötietojen suojan ja käsittelyä määrittävien säännösten sisällössä. Kansallisen liikkumavaran käyttöä arvioitaessa ovat merkityksellisiä esimerkiksi sekä (i) yksityiselämän ja henkilötietojen suojan turvaamiseksi asetetut sisällölliset vaatimukset että (ii) muiden informaatioon liittyvien perusoikeuksien suojan suhde yksityiselämän ja henkilötietojen suojaan. Valtiosääntöisiä kysymyksiä liittyy myös esimerkiksi kansallista sääntelyä edellyttäviin oikeusturvan ja hyvän hallinnon takeisiin (PeVL 14/2018 vp, s. 7). Valiokunta on edelleen painottanut, ettei yksityiselämän ja henkilötietojen suojalla ole etusijaa muihin perusoikeuksiin nähden (PeVL 14/2018 vp, s. 8). Arvioinnissa on kysymys kahden tai useamman perusoikeussäännöksen yhteensovittamisesta ja punninnasta (PeVL 54/2014 vp, s. 2, PeVL 10/2014 vp, s. 4). Valiokunta on korostanut erityisesti asiakirjajulkisuuden ja henkilötietojen suojan välistä tasapainoa (PeVL 22/2008 vp, s. 4). Erityisesti esityksen 1. lakiehdotuksessa on pyritty noudattamaan näitä perusoikeuksien suojaa tähdentäviä valiokunnan asettamia yleisiä edellytyksiä.

Perustuslakivaliokunta on tietosuoja-asetusta täydentävää lainsäädäntöä koskevassa lausunnossaan pitänyt perusteltuna tarkistaa aikaisempaa kantaansa henkilötietojen suojan kannalta tärkeistä sääntelykohteista. Valiokunnan mielestä tietosuoja-asetuksen yksityiskohtainen sääntely, jota tulkitaan ja sovelletaan EU:n perusoikeuskirjassa turvattujen oikeuksien mukaisesti, muodostaa yleensä riittävän säännöspohjan myös perustuslain 10 §:ssä turvatun yksityiselämän ja henkilötietojen suojan kannalta. Valiokunnan käsityksen mukaan tietosuoja-asetuksen sääntely vastaa asianmukaisesti tulkittuna ja sovellettuna myös ihmisoikeuksien ja perusvapauksien suojaamiseksi tehdyn yleissopimuksen (Euroopan ihmisoikeussopimus, jäljempänä EIS) mukaan määräytyvää henkilötietojen suojan tasoa. Näin ollen erityislainsäädäntöön ei ole tietosuoja-asetuksen soveltamisalalla enää valtiosääntöisistä syistä välttämätöntä sisällyttää kattavaa ja yksityiskohtaista sääntelyä henkilötietojen käsittelystä. Valiokunnan mielestä henkilötietojen suoja tulee jatkossa turvata ensisijaisesti tietosuoja-asetuksen ja säädettävän kansallisen yleislainsäädännön nojalla (PeVL 14/2018 vp, s. 4). Valiokunta katsoo myös, että sääntelyn selkeyden vuoksi kansallisen erityislainsäädännön säätämiseen tulee jatkossa suhtautua pidättyvästi ja rajata sellainen säätäminen vain välttämättömään tietosuoja-asetuksen antaman kansallisen liikkumavaran puitteissa. Sama pidättyvyys koskee EUT:n oikeuskäytännön valossa esimerkiksi tietosuoja-asetuksen 26 artiklassa tarkoitettua kansallista sääntelyä yhteisrekistereistä, joskin käytäntö perustuu tietosuoja-asetusta edeltäneeseen EU-sääntelyyn (Wirtschaftsakademie Schleswig-Holstein C-210/16, Jehovan todistajat C-25/17 ja Fashion ID C-40/17). Valiokunnan mielestä on kuitenkin selvää, että erityislainsäädännön tarpeellisuutta on arvioitava tietosuoja-asetuksenkin edellyttämän riskiperusteisen lähestymistavan mukaisesti kiinnittämällä huomiota tietojen käsittelyn aiheuttamiin uhkiin ja riskeihin. Mitä korkeampi riski käsittelystä aiheutuu luonnollisen henkilön oikeuksille ja vapauksille, sitä perustellumpaa on yksityiskohtaisempi sääntely. Tällä seikalla on erityistä merkitystä arkaluonteisten tietojen käsittelyn kannalta (PeVL 14/2018 vp, s. 5). Erityisesti esityksen 1. lakiehdotuksessa on pyritty noudattamaan näitä henkilötietojen käsittelyyn liittyviä valiokunnan asettamia lähtökohtia.

Esityksen molemmissa lakiehdotuksissa on näistä syistä (i) pyritty ottamaan huomioon tietosuoja-asetuksen sallima rajoitettu kansallinen liikkumavara ja (ii) kiinnitetty erityistä huomiota erityisiin henkilötietoryhmiin ja arvioitu sääntelyn riittävyyttä tältä osin. Lisäksi huomiota on 1. lakiehdotuksessa kiinnitetty tietosuoja-asetuksen asettamaan edellytykseen riskiperusteisesta lähestymistavasta ja sen mukaisesti tietojen käsittelyn aiheuttamiin uhkiin ja riskeihin. Esityksessä ehdotettu kansallisen liikkumavaran käyttö on puolestaan välttämätöntä, koska tietosuoja-asetuksen 6 artiklan 1 kohdan e-kohdassa edellytetty yleinen etu liittyy Suomen kansalliseen strategiaan kehittyä tietoyhteiskuntana ja vahvistaa luovuuteen, osaamiseen ja uuden tiedon tuottamiseen perustuvan talouskasvun mukaisia edellytyksiä hyvinvointivaltion ylläpitämiseen. Näistä syistä molempien lakiehdotusten arvioidaan täyttävän perustuslain 10 §:stä seuraavat vaatimukset sen mukaisesti kuin perustuslakivaliokunta on tarkistanut tulkintaansa. Kansallisen liikkumavaran käytöstä on tehty tarkemmin selkoa säännöskohtaisten perustelujen ohella edellä jakson 2 lopussa. Lakiehdotusten arvioidaan myös olevan sopusoinnussa tietosuoja-asetuksen kanssa.

Eduskunnan ja valtioneuvoston tiedonsaanti sekä yhdenvertaisuus

Esitys pohjautuu (i) tarpeeseen kehittää tilastokeskuksen tehtäviä palvelu- ja tieto-organisaation suuntaan vahvistamalla tutkija- ja aineistopalvelun asemaa ja toimintaedellytyksiä sekä (ii) tavoitteeseen edistää eduskunnan tiedonsaantia valtioneuvostosta (PeVL 30/2020 vp) vähintään tavalla, jolla vastataan eduskunnan valtioneuvostolta edellyttämiin lyhyen aikavälin potentiaalisiin tietoaineistotarpeisiin. Jälkimmäiseen tavoitteeseen liittyen ehdotetaan vahvistettavaksi yhtäältä valtioneuvoston ja sen ministeriöiden tiedonsaantioikeuksia tilastokeskukselta asettamalla niiden käyttölupahakemukset etusijalle ja tilastokeskuksen tiedonsaantioikeuksia muilta valtion viranomaisilta sekä toisaalta tilastokeskuksen nykyistä laajempaa mahdollisuutta luovuttaa tilastoaineistoja, erityisesti hallinnollisia rekisteriaineistoja, tutkimus- ja selvityskäyttöön ennen kuin kyseiset tilastoaineistot on julkaistu, jollei tiedon luovuttaminen muulla kuin tilastolain 13 §:ssä säädetyllä tavalla riko tilastosalaisuutta tai olennaisella tavalla ja perusteettomasti vaaranna muiden tiedontarvitsijoiden tasapuolista kohtelua. Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittaman käyttölupahakemuksen asettaminen valtioneuvoston alaisen hallinnon viranomaisen käyttölupahakemuksen edelle ja toteuttaminen ilman aiheetonta viivytystä on tällainen hyväksyttävä peruste samoin kuin se, että toinen viranomainen on jo itse omasta rekisteristään taulukoinut anonymisoitua tietoa avoimeen tietokantaansa. Rekisteriaineiston antaminen tutkimus- ja selvityskäyttöön mahdollisimman nopeasti on suotavaa, koska tiedon käytön nopeus on tärkeämpää kuin yksittäisten pienehköjen virheiden korjaaminen, vaikka raaka-aineistossa toisinaan saattaa olla laaja-alaisiakin virheitä. Näillä rajauksilla ja sillä, että kysymys on erityisesti tutkimus- ja selvityskäytössä tarpeellisista hallinnollisista rekisteriaineistoista, varmistetaan myös, ettei rekisteriaineiston antaminen tutkimus- ja selvityskäyttöön ole vastoin muita hyvän hallinnon periaatteita. Erityisesti esityksen 1. lakiehdotuksessa asetettujen edellytysten tietojen luovuttamiselle ja käyttötarkoitussidonnaisuudesta poikkeamiselle katsotaan täyttävän valiokunnan asettamat niihin liittyvät edellytykset.

Eduskunnan tiedonsaantioikeus on (i) osa parlamentarismia ja parlamentaarista valvontaa, (ii) osa lainsäädäntö- ja budjettivaltaa ja (iii) osa toimivaltaa kansainvälisissä asioissa ja EU-asioissa, kun eduskunta osallistuu kansainvälisten velvoitteiden voimaansaattamiseen ja EU-asioiden valmisteluun. Eduskunnan oikeus saada valtioneuvostolta tarpeelliset tiedot sisältää valtioneuvoston velvollisuuden (i) oma-aloitteisesti toimittaa eduskunnan tarvitsemat tiedot ja (ii) toimittaa eduskunnan erikseen pyytämät tiedot. Eduskunnan oikeus saada valtioneuvostolta pyytämänsä tiedot on ehdoton. Valtioneuvostolla ei ole toimivaltaa kieltäytyä luovuttamasta pyydettyjä tietoja sillä perusteella, etteivät tiedot ole asian käsittelyn kannalta tarpeellisia. Eduskunta arvioi itsenäisesti, mitä tietoja se tarvitsee asioiden käsittelyssä. Tiedonsaantioikeuden toteuttaminen edellyttää oma-aloitteista ja ennakoivaa tiedon antamista, joka on asian käsittelyn kannalta kattavaa ja oikeellista (PeVL 30/2020 vp). Näistä syistä valtioneuvoston oikeutta kiireellisten tietoaineistotarpeiden toteuttamiseen ja niiden edellyttämään tiedonsaantiin tilastokeskuksesta on vahvistettava. Myöskään tilastokeskus ei valtioneuvoston alaisena ja VM:n hallinnonalan keskusvirastona voi suhtautua eduskuntaan ikään kuin se olisi vain yksi asiakas muiden joukossa. Valtioneuvoston tiedonsaantioikeus tilastokeskukselta puolestaan perustuu lähtökohtaisesti julkisuuslain 28 §:ään, jonka 1 momentin mukaan ”viranomainen voi, jollei lailla toisin säädetä, antaa yksittäistapauksessa luvan tietojen saamiseen salassa pidettävästä asiakirjastaan tieteellistä tutkimusta, tilastointia taikka viranomaisen suunnittelu- tai selvitystyötä varten, jos on ilmeistä, ettei tiedon antaminen loukkaa niitä etuja, joiden suojaksi salassapitovelvollisuus on säädetty”. Esitys tukeutuu etenkin mainitun momentin toiseen virkkeeseen, jonka mukaan ”lupaa harkittaessa on huolehdittava siitä, että tieteellisen tutkimuksen vapaus turvataan”. Julkisuuslain 28 §:n 2 momentin mukaan ”lupa voidaan antaa määräajaksi, ja siihen on liitettävä yleisen ja yksityisen edun suojaamiseksi tarpeelliset määräykset” ja ”peruuttaa, milloin siihen harkitaan olevan syytä”. Harkintaa luvan myöntämisestä ei ole sidottu minkäänlaisiin kriteereihin, mikä voi olla ongelmallista erityisesti silloin, kun kysymys on tieteellisen tutkimuksen vapaudesta ja sen toteuttamisesta luvan kautta. Lisäksi voi olla epäselvää, mitä luvan peruuttaminen käytännössä tarkoittaa silloin, jos luvan myöntämisen jälkeen asiakirjat on jo annettu tiettyyn tarkoitukseen, ja kohdistuuko luvan peruuttaminen siihen, miten tietoja on oikeus hyödyntää tutkimuksessa tai muussa toiminnassa vai rajaako se vain pääsyä tietoon luvan peruuttamisen jälkeen.

Erityisesti esityksen 1. lakiehdotus täydentää siten julkisuuslain 28 §:n säännöstä. Käytännössä esimerkiksi VM:n tiedonsaantioikeutta on perinteisesti perusteltu talousarvioesityksen ja julkisen talouden suunnitelman valmisteluun liittyvillä usein kiireellisillä työtehtävillä. Tilastotarkoituksiin kerättyjen tietojen luovuttamisesta säädetään puolestaan tilastolain 13 §:ssä. Näistä syistä lakiehdotusten arvioidaan täyttävän valiokunnan asettamat edellytykset eduskunnan tiedonsaannille valtioneuvostolta (PeVL 30/2020 vp).

Esityksessä ehdotetaan, vähäisenä poikkeuksena tasapuolisesta kohtelusta, että valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittama (esimerkiksi TEAS-hanketta koskeva) käyttölupahakemus on asetettava etusijalle valtioneuvoston alaisen hallinnon viranomaisten käyttölupahakemuksiin nähden ja toteutettava ilman aiheetonta viivytystä. Tilaston julkaisemattomuus ei ole aiheellinen viivytys tilastoinnissa käytettävän hallinnollisen rekisteriaineiston luovuttamiseen tutkija- ja aineistopalveluun, ellei tiedon luovuttaminen muulla kuin tilastolain 13 §:ssä säädetyllä tavalla riko tilastosalaisuutta tai olennaisella tavalla ja perusteettomasti vaaranna muiden tiedontarvitsijoiden tasapuolista kohtelua. Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittaman käyttölupahakemuksen asettaminen valtioneuvoston alaisen hallinnon viranomaisen käyttölupahakemuksen edelle ja toteuttaminen ilman aiheetonta viivytystä on esimerkiksi tällainen hyväksyttävä peruste samoin kuin se, että toinen viranomainen on jo itse omasta rekisteristään taulukoinut anonymisoitua tietoa avoimeen tietokantaansa. Näillä rajauksilla ja sillä, että kysymys on erityisesti tutkimus- ja selvityskäytössä tarpeellisista hallinnollisista rekisteriaineistoista, varmistetaan myös, ettei rekisteriaineiston antaminen tutkimus- ja selvityskäyttöön ole vastoin muita hyvän hallinnon periaatteita. Käyttölupahakemuksen kiireellisyyttä on etusijan selvärajaisuuden vuoksi arvioitava objektiivisin kriteerein, kuten Tilannehuoneen tapauksessa (tutkimuksen merkitys kriisinratkaisussa). Koska ehdotus etusijasta olennaisilta osin liittyy eduskunnan tietoaineistotarpeiden tyydyttämiseen, joka välillisesti tukee eduskunnan toimintaa ja siten myös EU:sta tehdyn sopimuksen (SEU) 2 artiklan mukaisia EU:n perustana olevia arvoja, 2 ehdotuksen ei katsota olevan vastoin SEUT 338 artiklan 2 kohdassa eikä EU:n tilastoasetuksessa (2 artiklan 1 b kohta) säädettyä puolueettomuusperiaatetta, eikä siten myöskään vaarantavan yleisön luottamusta tilastojen puolueettomuuteen ja objektiivisuuteen. Vastaava kaksiportainen jaottelu valtioneuvoston ja sen ministeriöiden sekä valtioneuvoston alaisen ja muun julkisen hallinnon viranomaisten erilaisesta asemasta on voimassa esimerkiksi lakia alemman asteista norminantovaltaa koskevassa perustuslain 80 §:ssä. Ehdotukset eduskunnan ja valtioneuvoston tiedonsaantioikeuksien vahvistamisesta eivät myöskään loukkaa perustuslain 6 §:n takaamaa yhdenvertaisuutta, joka koskee ihmisiä ja estää kansalaisiin tai kansalaisryhmiin kohdistuvan syrjinnän. Näistä syistä lakiehdotusten arvioidaan täyttävän perustuslain 6 §:n vaatimukset ja olevan myös sopusoinnussa EU:n tilastoasetuksen kanssa.

Käytännesäännöt ja eduskunnan tiedonsaanti

Tilastoinnissa noudatetaan lisäksi EU:n tilastoasetuksessa säädettyjä käytännesääntöjä, jollei tilastolaista tai TK-laista muuta johdu. Esitys täsmentää ja vahvistaa tilastokeskuksen sitoutumista EU:n tilastosääntelyyn, sitä tukeviin tilastoperiaatteisiin ja näitä periaatteita täydentäviin käytännesääntöihin. Käytännesäännöt ovat luonteeltaan itsesääntelyn (soft law) kaltaisia ja eurooppalaisten valvontaviranomaisten Q&A-tiedonantoihin (Questions and Answers) rinnastettavia sopimusjärjestelyjä, joita eurooppalaiset ja jäsenvaltioiden kansalliset tilastoviranomaiset ovat luoneet itselleen. Eduskunnan aseman ja tilastoviranomaisten vastuunalaisuuden varmistamiseksi ehdotetaan mahdollisuutta tulkita niitä yksittäistapauksittain kansallisella lailla. Esityksessä ehdotettu tulkinta käytännesääntöjen kohdista 7.7 ja 15.4 on, että tilastoaineistoja voidaan luovuttaa eräin rajauksin tutkimuskäyttöön jo ennen kuin ne on julkaistu. Kohdan 15.4 mukaan ”Yksikköaineistoihin pääsy sallitaan tutkimustarkoituksiin, ja siinä noudatetaan erityisiä sääntöjä tai protokollaa”.

Ehdotus ei kuitenkaan tarkoita sitä, että EU:n tilastoasetuksessa säädetyistä sitoviksi tarkoitetuista tilastoperiaatteista poiketaan. Käytännesäännöt sisältävät 16 periaatteeksi nimitettyä yleisluonteista näkemystä (i) institutionaalisesta ympäristöstä (ammatillinen riippumattomuus, koordinointi ja yhteistyö, tiedonkeruuvaltuudet ja tiedonsaanti, riittävät voimavarat, laatuun sitoutuminen, tilastollinen tietosuoja (tilastosalaisuus) ja tietoturva, puolueettomuus ja objektiivisuus), (ii) tilastoprosessista (pätevät menetelmät, asianmukaiset tilastolliset menettelytavat, kohtuullinen vastausrasite, kustannustehokkuus), ja (iii) tilastotuotteista (relevanssi, tarkkuus ja luotettavuus, oikea-aikaisuus ja täsmällisyys, johdonmukaisuus ja vertailukelpoisuus, saatavuus ja selkeys). Kutakin 16 periaatetta täsmentävät yleispiirteiset selitykset (indikaattorit), joita on yhteensä 84. Käytännesäännöt ovat eräänlainen julistus tai viranomaisten itselleen tekemä huoneentaulu, jonka yksityiskohtaiseksi noudattamiseksi eräitä sen periaatteita voi olla kansallisista syistä tarpeen tulkita tarkemmin laissa ja lain perusteluissa. Käytännesääntöihin sitoutuminen hallinnollisilla päätöksillä on lakia alemman asteisen sääntelyn näkökulmasta tosiasiallisesti rinnastettavissa tilastokeskuksen harjoittamaan perustuslain 80 §:n 2 momentissa tarkoitettuun valtioneuvoston alaisen ja muun julkisen hallinnon viranomaisten norminantovaltaan. Näistä syistä lakiehdotusten arvioidaan täyttävän perustuslain 80 §:n vaatimukset ja olevan sopusoinnussa myös EU:n tilastoasetuksen kanssa.

Esitys vahvistaa siten osaltaan eduskunnan edellytyksiä välillisesti seurata komission harjoittamaa EU:n tilastoasetusta täydentävien käytännesääntöjen noudattamisen ja täytäntöönpanon valvontaa. Suomessa vakiintuneeseen EU-asioiden käsittelyjärjestelmään kuuluu olennaisena piirteenä, etteivät ministeriöiden edustajat voi osallistua EU-sääntelyn käsittelyyn ja säätämiseen ilman eduskunnan myötävaikutusta ja suostumusta. Johdonmukaisuuden vuoksi tämä vaatimus on esityksessä välillisesti ulotettu koskemaan myös valtioneuvoston alaiseen hallintoon kuuluvia tilastoviranomaisia ja niiden virkamiehiä. Näistä syistä lakiehdotusten arvioidaan osaltaan täyttävän valiokunnan asettamat edellytykset eduskunnan tiedonsaannille valtioneuvostolta (PeVL 30/2020 vp).

Yksityiselämän ja henkilötietojen suoja sekä tieteen vapaus

Ehdotetut lainmuutokset ovat merkityksellisiä perustuslain 10 §:ssä turvatun henkilötietojen ja yksityisyydensuojan kannalta. Perustuslain 10 §:n 1 momentin mukaan henkilötietojen suojasta on säädettävä tarkemmin lailla. Perustuslakivaliokunta on aikaisemmin pitänyt henkilötietojen suojan kannalta tärkeinä sääntelykohteina ainakin rekisteröinnin tavoitetta, rekisteröitävien henkilötietojen sisältöä, niiden sallittuja käyttötarkoituksia (mukaan luettuna tietojen luovutettavuus), tietojen säilytysaikaa henkilörekisterissä ja rekisteröidyn oikeusturvaa (PeVL 25/1998 vp). Näiden seikkojen sääntelyn lain tasolla on tullut lisäksi olla kattavaa ja yksityiskohtaista. Erityisesti esityksen 1. lakiehdotuksessa on pyritty noudattamaan näitä valiokunnan asettamia henkilötietojen suojaa koskevia yleisiä lähtökohtia.

Perustuslain 10 §:n mukaista suojaa täydentävät EIS 8 artiklan mukainen yksityiselämän suoja sekä EU:n perusoikeuskirjan 7 artiklassa turvattu yksityiselämän suoja ja 8 artiklassa turvattu henkilötietojen suoja (PeVL 1/2018 vp, s 2-3). EU:n perusoikeuskirjan 52 artiklan 1 kohdan mukaan perusoikeuskirjassa tunnustettujen oikeuksien ja vapauksien käyttämistä voidaan rajoittaa vain lailla, kyseisten oikeuksien ja vapauksien keskeistä sisältöä kunnioittaen. Suhteellisuusperiaatteen mukaisesti rajoituksia voidaan säätää vain, jos ne ovat välttämättömiä ja vastaavat tosiasiallisesti EU:n tunnustamia yleisen edun mukaisia tavoitteita tai tarvetta suojella muiden henkilöiden oikeuksia ja vapauksia. EU:n perusoikeuskirjan 52 artiklan 3 kohdan mukaan, siltä osin kuin perusoikeuskirjan oikeudet vastaavat EIS:ssa taattuja oikeuksia, niiden merkitys ja ulottuvuus ovat samat. Oikeuskäytännössä EUT:n antamat tuomiot määrittävät näiltä osin yksityiselämän ja henkilötietojen suojan keskeistä sisältöä. Samoin EIS 8 artiklan on Euroopan ihmisoikeustuomioistuimen, jäljempänä EIT, jäljempänä selostettavassa oikeuskäytännössä katsottu kattavan myös henkilötietojen suojan.

Perustuslain 10 §:ssä turvattua yksityiselämän suojaa ei esityksessä loukata, koska tilastoaineistoa koskeva käyttölupahakemus on toteutettava tilastosalaisuutta vaarantamatta. Tietosuoja-asetuksen valmistelussa Suomi piti välttämättömänä kansallisen liikkumavaran määrittelyä niin, ettei tietosuoja estä perustuslain 12 §:n 2 momentissa säädetyn julkisuusperiaatteen soveltamista. Julkisuutta voidaan perustuslain mukaan rajoittaa lailla erikseen vain, jos siihen on välttämättömiä syitä. Etenkin toisen perusoikeuden, kuten yksityiselämän suojan, turvaaminen voi olla tällainen välttämätön syy (PeVL 4/2014 vp, PeVL 2/2008 vp). Tilastosalaisuus puolestaan edellyttää, että (i) suoraan tilastointitarkoitukseen tai välillisesti hallinnollisista tai muista lähteistä saatuja yksittäisiin tilastoyksiköihin liittyviä salassa pidettäviä tietoja suojataan, ja (ii) estetään sekä saatujen tietojen käyttö muuhun kuin tilastointitarkoitukseen että tietojen laiton paljastaminen. Toisaalta tilastolain 13 § mahdollistaa myös salassa pidettävien tietojen luovuttamisen. Tilastoyksiköllä tarkoitetaan EU:n tilastoasetuksessa (3 artiklan 6 kohta) tarkastelun perusyksikköä eli luonnollista henkilöä, kotitaloutta, talouden toimijaa ja muita yrityksiä, joihin tiedot viittaavat. Perustuslain 10 §:n mukaan henkilötietojen suojasta säädetään tarkemmin lailla. Henkilötietojen suojaa on käsitelty nykytilan arviointia koskevassa edellä jaksossa 2. Esitysluonnoksesta saadun lausuntopalautteen perusteella viranomaisten tulkinnat esimerkiksi tilastoyksiköstä poikkeavat Suomessa toisistaan, minkä vuoksi kysymystä suoraan velvoittavassa EU-sääntelyssä määritellyistä käsitteistä (tilastoyksikkö, tekninen käyttöympäristö) on tarkoituksenmukaista käsitellä kansallisen tilastolainsäädännön muita kehittämistarpeita koskevassa, viimeistään esityksen eduskuntakäsittelyn jälkeen julkistettavassa arviomuistiossa, jolloin valiokuntien mahdolliset jatkovalmistelutoiveet ovat selvinneet.

Salassapitoperusteiden riskinä on sääntelyn hajautuminen erityislakeihin perustuvaan henkilötietojen luovuttamista koskevaan erityissääntelyyn. Lainvalmisteluohjeiden mukaan lainsäädäntö on pyrittävä säilyttämään selkeänä, ja sen hajautuminen on estettävä. Yleislakeja kunnioittamalla myös hillitään normitulvaa. Myös perustuslakivaliokunta on kiinnittänyt huomiota henkilötietojen käsittelyä koskevan sääntelyn raskauteen ja monimutkaisuuteen (PeVL 2/2018 vp, PeVL 49/2017 vp, PeVL 31/2017 vp, PeVL 71/2014 vp). Valiokunta on toisaalta korostanut henkilötietoja koskevan sääntelyn laintasoisuutta, kattavuutta ja yksityiskohtaisuutta (PeVL 31/2017 vp, s. 2). Valiokunta on katsonut, ettei henkilötietojen suojan toteuttaminen voi enää jatkossa perustua erityislakeihin pohjautuvan sääntelymallin varaan, vaan henkilötietojen suojan toteuttaminen tulee jatkossa ensisijaisesti taata tietosuoja-asetuksen ja säädettävän kansallisen yleislain nojalla. Tähän liittyen tulee välttää kansallisen erityislainsäädännön säätämistä sekä varata sellaisen säätäminen vain tilanteisiin, joissa se on yhtäältä sallittua tietosuoja-asetuksen kannalta ja toisaalta välttämätöntä henkilötietojen suojan toteuttamiseksi (PeVL 2/2018 vp, PeVL 14/2018 vp). Näistä syistä esitykseen sisältyvän tietosuojasääntelyn määrä tilastolainsäädännössä on pyritty pitämään mahdollisimman suppeana. Lähtökohtana on, että erityisesti esityksen 1. lakiehdotus täydentää julkisuuslain 28 §:n säännöstä. Kansallisen liikkumavaran ja sääntelyn välttämättömyyttä koskevia edellytyksiä on selostettu edellä.

Esityksen 1. lakiehdotuksessa Tilannehuoneen erityisaseman purkamiseksi ja pyrkimyksessä muiden tutkija- ja viranomaisyhteisön tiedontarvitsijoiden mahdollisimman yhdenvertaiseen kohteluun on otettu huomioon perustuslain 16 §:n 3 momentissa turvattu tieteen vapaus.

Erityiset henkilötietoryhmät

Perustuslakivaliokunnan mielestä arkaluonteisten tietojen käsittelyä koskevaa sääntelyä on edelleen syytä arvioida myös aikaisemman sääntelyn laintasoisuutta koskevan käytännön pohjalta (PeVL 14/2018 vp, PeVL 15/2018 vp). Vaikka tietosuoja-asetuksen johdosta kansallisessa lainsäädännössä tulee tietosuoja-asetuksen 9 artiklaan valitun erityisten henkilötietoryhmien käsitteen ja sääntelyn selvyyden vuoksi välttää arkaluonteisten tietojen käsitteen käyttämistä (PeVL 14/2018 vp), on valiokunta edelleen pitänyt perusteltuna kuvata valtiosääntöisesti tiettyjä henkilötietoryhmiä nimenomaan arkaluonteisiksi (PeVL 15/2018 vp). Näillä tarkoitetaan laajempaa tietojoukkoa kuin vain tietosuoja-asetuksessa tarkoitetut erityiset henkilötietoryhmät (PeVL 17/2018 vp.). Valiokunta on painottanut arkaluonteisten tietojen käsittelyn aiheuttamia uhkia ja arkaluonteisia tietoja sisältäviin laajoihin tietokantoihin sisältyviä, tietoturvaan ja tietojen väärinkäyttöön liittyviä vakavia riskejä, jotka voivat viime kädessä muodostaa uhan henkilön identiteetille (PeVL 15/2018 vp, PeVL 13/2016 vp, PeVL 14/2009 vp).

Myös tietosuoja-asetuksen 51. johdantokappaleen mukaan asetuksen 9 artiklassa tarkoitettuja erityisiä henkilötietoja, jotka ovat erityisen arkaluonteisia perusoikeuksien ja -vapauksien kannalta, on suojeltava erityisen tarkasti, koska niiden käsittelyn asiayhteys voi aiheuttaa huomattavia riskejä perusoikeuksille ja -vapauksille. Perustuslakivaliokunta on tämän johdosta kiinnittänyt erityistä huomiota siihen, että arkaluonteisten tietojen käsittely on syytä rajata täsmällisillä ja tarkkarajaisilla säännöksillä vain välttämättömään (PeVL 15/2018 vp). Tämän vuoksi esityksessä on rajoitettu tilastokeskuksen oikeutta vastaanottaa vain välttämättömiä salassa pidettäviä tietoja, minkä lisäksi on kuitenkin tarpeen varautua ennakoimattomiin ja nopeisiin tilanteisiin (kuten esimerkiksi koronaepidemia, josta pika-analyysit asetettujen rajoitusten vaikutuksista yhteiskuntaan ja elinkeinoelämään ovat olleet kysyttyjä, ja Ukrainan sota, jota paenneiden sijoittuminen ja työllistyminen antaa lisätietoja siitä, millaisia lisätoimenpiteitä on tarpeen toteuttaa). Ehdotus ei siten merkitse tilastokeskukselle asiallisesti uutta tiedonsaantioikeutta, vaan menettelytavan täsmennystä. Valiokunta on varhaiskasvatusta koskevien tietovarantojen näkökulmasta edellyttänyt, että terveydentilatietojen ja muiden arkaluonteisten henkilötietojen käsittelyä koskevan sääntelyn on oltava tietosuoja-asetuksen mahdollistamissa puitteissa yksityiskohtaista ja kattavaa (PeVL 17/2018 vp).

Erityisiin henkilötietoryhmiin kuuluvia henkilötietoja sekä muutoin arkaluonteisiksi katsottavia henkilötietoja koskevia säännöksiä ei varsinaisesti ehdoteta tarkistettavaksi. Esityksen perusteluissa on arvioitu näitä henkilötietojen käsittelyyn liittyviä erityisiä suojatoimia rekisteröidyn oikeuksien turvaamiseksi. Esityksellä ei siten ole merkittäviä rekisteröidyn yksityiselämän suojaa rajoittavia vaikutuksia. Rekisteriin talletettavilla uusilla henkilötietoryhmillä on kuitenkin rekisteröidyn yksityiselämän suojaa kaventavaa vaikutusta, vaikka ehdotetuissa rekisterin tietosisältöä koskevissa säännöksissä pyritään tarkkarajaisuuteen. Tällä on merkitystä myös henkilötietojen luovuttamisen kannalta. Näiden henkilötietojen rekisteröinti ja muu käsittely sekä henkilötietojen luovuttamiskynnys rajataan kuitenkin siihen, mikä on välttämätöntä tietoja vastaanottavan rekisterinpitäjän tehtävän hoitamisen kannalta.

Esityksen 1. lakiehdotuksessa ehdotetaan kuitenkin rajausta, jonka mukaan tilastokeskus voi salassapitosäännösten estämättä ottaa vastaan, koostaa ja säilyttää tutkija- ja aineistopalvelua varten sellaisia välttämättömiä tietoja, joita luovutetaan tieteelliseen tutkimukseen, yhteiskuntaoloja kuvaavien tilastollisten selvitysten tekemiseen taikka valmisaineistojen muodostamiseen julkisuuslain 28 §:n perusteella. Esityksessä on pyritty noudattamaan hallituksen TKI-tiekartan suuntaviivoja ja nojauduttu tietosuoja-asetuksen 159. johdantokappaleeseen kehittämis- ja innovaatiotoiminnan edistämiseksi tieteessä ja tutkimuksessa. Mahdollisuutta kehittää tilastolain käsitteistöä esimerkiksi korvaamalla arkaluonteisten tietojen käsite muulla ilmaisulla, kuten erityisiin henkilötietoryhmiin kuuluvien henkilötietojen käsitteellä, on tarkoitus selvittää esityksen jatkovalmistelussa.

Esityksessä on otettu huomioon perustuslakivaliokunnan huomiot arkaluonteisten henkilötietojen käsitteestä (PeVL 15/2018 vp). Vaikka tietosuoja-asetuksen soveltamisen alkamisen johdosta kansallisessa lainsäädännössä tulee tietosuoja-asetuksen 9 artiklassa säädetyn erityisten henkilötietoryhmien käsitteen johdosta sääntelyn selvyyden vuoksi välttää arkaluonteisten tietojen käsitteen käyttämistä, on valiokunta pitänyt edelleen perusteltuna kuvata valtiosääntöisesti tiettyjä henkilötietoryhmiä nimenomaan arkaluonteisiksi. Tietosuoja-asetuksessa (johdanto-osan 51. kappale) painotetaan myös erityisten henkilötietoryhmien erityistä arkaluonteisuutta. Näistä syistä esityksen 2. lakiehdotuksen 15 §:n 6 momentissa ilmaisu arkaluonteisista henkilötiedoista jätetään toistaiseksi ennalleen. Esityksen suhdetta toisiolakiin ja esityksen siihen liittyviä eroavaisuuksia on myös valtiosääntöisestä näkökulmasta käsitelty edellä jaksossa 10.

Henkilötietojen luovuttaminen

Perustuslakivaliokunta on arvioinut viranomaisten tietojen saamista ja luovuttamista salassapitovelvollisuuden estämättä koskevaa sääntelyä perustuslain 10 §:n 1 momentissa säädetyn yksityiselämän ja henkilötietojen suojan kannalta ja kiinnittänyt huomiota muun muassa siihen, mihin ja ketä koskeviin tietoihin tiedonsaantioikeus ulottuu ja miten tiedonsaantioikeus sidotaan tietojen välttämättömyyteen. Viranomaisen tietojensaantioikeus ja tietojenluovuttamismahdollisuus ovat voineet liittyä jonkin tarkoituksen kannalta "tarpeellisiin tietoihin", jos tarkoitetut tietosisällöt on pyritty luettelemaan laissa tyhjentävästi. Jos taas tietosisältöjä ei ole samalla tavoin luetteloitu, sääntelyyn on pitänyt sisällyttää vaatimus "tietojen välttämättömyydestä" jonkin tarkoituksen kannalta (PeVL 17/2016 vp, s. 2-3 ja siinä viitatut lausunnot). Valiokunta ei toisaalta ole pitänyt hyvin väljiä ja yksilöimättömiä tietojensaantioikeuksia perustuslain kannalta mahdollisina edes silloin, kun ne on sidottu välttämättömyyskriteeriin (PeVL 19/2012 vp).

Tilastokeskuksen noudattama käytäntö on vakiintuneesti perustunut kahteen jo kauan voimassa olleeseen lainkohtaan. Yhtäältä tilastolain 13 §:n mukaisesti tilastoviranomainen voi luovuttaa tilastotarkoituksiin keräämiään salassa pidettäviä tietoja, minkä lisäksi tilastokeskus voi luovuttaa tilastolain 19 §:n mukaisesti tieteellistä tutkimusta ja yhteiskuntaoloja koskevaa tilastollista selvitystä varten, salassapitosäännösten estämättä, tunnistetietoineen tiedot henkilön iästä, sukupuolesta, koulutuksesta, ammatista ja sosioekonomisesta asemasta. Toisaalta julkisuuslain 28 §:n mukaan viranomainen voi antaa yksittäistapauksessa luvan tietojen saamiseen salassa pidettävästä asiakirjastaan tieteellistä tutkimusta, tilastointia taikka viranomaisen suunnittelu- tai selvitystyötä varten. Esityksessä on tukeuduttu näihin lainkohtiin ja arvioitu niiden tarjoavan riittävät reunaehdot henkilötietojen luovuttamista koskevalle edellytykselle välttämättömyydestä.

Perustuslakivaliokunta on, arvioidessaan täsmällisyyttä ja sisältöä, antanut erityistä merkitystä luovutettavien tietojen luonteelle arkaluonteisina tietoina. Jos ehdotetut säännökset tietojen luovutuksesta kohdistuvat myös arkaluonteisiin tietoihin, on tavallisen lainsäätämisjärjestyksen käyttämisen edellytyksenä sääntelyn täsmentäminen viranomaisten tietojen saamista ja luovuttamista salassapitovelvollisuuden estämättä koskevaa sääntelyä koskevan valiokunnan käytännön mukaiseksi (PeVL 15/2018 vp, PeVL 38/2016 vp). Toisaalta mahdollisuudesta yhdistää rekisteritietoja on säädettävä lailla (PeVL 17/2007 vp ja PeVL 30/2005 vp). Valiokunnan käsityksen mukaan estettä ei ole sille, että henkilötietojen suojaan liittyvät sääntelyn kattavuuden sekä täsmällisyyden ja tarkkarajaisuuden vaatimukset voidaan joiltakin osin täyttää myös asianmukaisesti laaditulla kansalliseen oikeuteen sisältyvällä yleislailla (PeVL 38/2016 vp, s. 4).

Valiokunta on painottanut, että erottelussa tietojen saamisen tai luovuttamisen tarpeellisuuden ja välttämättömyyden välillä on kysymys tietosisältöjen laajuuden ohella myös siitä, että salassapitosäännösten edelle menevässä tietojensaantioikeudessa on viime kädessä kysymys siitä, että tietoihin oikeutettu viranomainen omine tarpeineen syrjäyttää ne perusteet ja intressit, joita tiedot omistavaan viranomaiseen kohdistuvan salassapidon avulla suojataan. Mitä yleisluonteisempi tietojensaantiin oikeuttava sääntely on, sitä suurempi on vaara, että tällaiset intressit voivat syrjäytyä hyvin automaattisesti. Toisaalta, mitä täydellisemmin tietojensaantioikeus kytketään säännöksissä asiallisiin edellytyksiin, sitä todennäköisemmin yksittäistä tietojensaantipyyntöä joudutaan käytännössä perustelemaan. Myös tietojen luovuttajan on tällöin mahdollista arvioida pyyntöä luovuttamisen laillisten edellytysten kannalta. Tietojen luovuttaja voi lisäksi kieltäytymällä tietojen antamisesta tosiasiallisesti saada aikaan tilanteen, jossa tietojen luovuttamisvelvollisuus eli säännösten tulkinta saattaa tulla ulkopuolisen viranomaisen tutkittavaksi. Tämä mahdollisuus on tärkeä tiedonsaannin ja salassapitointressin yhteensovittamiseksi (PeVL 7/2019 vp, PeVL 15/2018 vp sekä PeVL 17/2016 vp, s. 6 ja siinä viitatut lausunnot).

Valtiolla on pitkään katsottu olevan eräissä tilanteissa laaja kansallinen harkintamarginaali siinä, mikä on välttämätöntä, kuten henkilötietojen tallentamisessa henkilöistä, joita epäillään terrorismirikoksista. Rajoituksen on kuitenkin perustuttava lakiin ja sen on oltava välttämätön ja oikeasuhteinen toimenpide (Leander v. Ruotsi, hakemus 9248/81, 26.3.1987, EIT:n tuomion kohdat 58-59, Segerstedt-Wiberg ja muut v. Ruotsi, hakemus 62332/00, 6.6.2006, EIT:n tuomion kohdat 87 ja 88). Yksityiselämään puuttumiseksi on katsottava jo se, että viranomainen kerää ja tallentaa tietoja myöhempää käyttöä varten (S. ja Marper v. Yhdistynyt Kuningaskunta, hakemukset 30562/04 ja 30566/04, 4.12.2008, EIT:n tuomion kohta 85). Jotta yksityiselämän rajoitustoimenpide olisi lain mukainen, edellytyksenä ei ole pelkästään se, että toimenpide perustuu lakiin, vaan sen on oltava rekisteröityjen henkilöiden saatavilla ja ennakoitavissa vaikutusten kannalta (Segerstedt-Wiberg ja muut v. Ruotsi, EIT:n tuomion kohta 76). EIT:n oikeuskäytännössä on korostettu muun muassa toimivaltaperusteiden täsmällistä ja ennakoitavaa laintasoista määrittelyä, välttämättömyyskriteerin tiukkaa tulkintaa, objektiivisia perusteita välttämättömien tietojen saamiselle, tuomioistuimen tai riippumattoman hallinnollisen elimen etukäteisvalvontaa, riippumatonta jälkikäteisvalvontaa ja tuomioistuimessa toteutettavan oikeusturvan saatavuutta (Weber ja Saravia v. Saksa, hakemus 54934/00, 29.6.2006, EIT:n tuomion kohta 95, Liberty ja muut v. Yhdistynyt Kuningaskunta, hakemus 58243/00, 1.10.2008, EIT:n tuomion kohta 59-60, Zakharov v. Venäjä, hakemus 47143/06, 4.12.2015, EIT:n tuomion kohta 229-230 ja Szabó ja Vissy v. Unkari, hakemus 37138/14, 12.1.2016, EIT:n tuomion kohta 89).

Edellä esitetyn perusteella esityksen arvioidaan ottavan huomioon perusoikeuksien kannalta merkitykselliset vaatimukset tietosuoja-asetuksen salliman kansallisen liikkumavaran sekä henkilötietojen (etenkin valtiosääntöisesti arkaluonteisina pidettävien tietojen) käsittelyn oikeasuhtaisuudesta, yleisen edun mukaisuudesta ja välttämättömyydestä. Esityksellä ei näistä syistä katsota olevan merkittäviä liittymiä perustuslain sääntelyyn tai perusoikeuksien toteutumiseen.

Edellä esitetyillä perusteilla lakiehdotukset voidaan käsitellä tavallisessa lainsäätämisjärjestyksessä. Tästä huolimatta ja erityisesti, koska tietosuoja-asetukseen liittyvä soveltamiskäytäntö on uutta sekä edelleen melko epäyhtenäistä ja vähäistä, ja koska tilastokeskusta koskevaa lainsäädäntöä ei ole aikaisemmin käsitelty perustuslakivaliokunnassa, pidetään suotavana, että hallituksen esityksestä hankitaan eduskunnan perustuslakivaliokunnan lausunto.

Ponsi

Edellä esitetyn perusteella annetaan eduskunnan hyväksyttäviksi seuraavat lakiehdotukset:

1.

Laki tilastokeskuksesta annetun lain muuttamisesta

Eduskunnan päätöksen mukaisesti

lisätään tilastokeskuksesta annettuun lakiin (48/1992) uusi 2 a ja 2 b § seuraavasti:

2 a §

Tilastokeskuksen tehtävänä on 2 §:ssä säädetyn lisäksi ylläpitää, kehittää ja parantaa tilastojen ja tietoaineistojen tuottamiseen ja jakeluun liittyviä palveluja tieteellisen tutkimuksen ja yhteiskuntaoloja koskevien tilastollisten selvitysten edistämistä varten (tutkija- ja aineistopalvelu). Tutkija- ja aineistopalvelu on tarkoitettu tieteellistä tutkimusta ja yhteiskuntaoloja kuvaavien tilastollisten selvitysten tuottamiseen ja yliopistoissa, korkeakouluissa, ammattikorkeakouluissa, tutkimuslaitoksissa ja ajatuspajoissa sekä muissa tutkimusta tekevissä organisaatioissa toimivien tutkijoiden tietoaineistotarpeisiin vastaamiseen ilman aiheetonta viivytystä, tietoturvallisessa käsittely-ympäristössä, ajantasaisella aineistolla ja mahdollisimman tasapuolisella tavalla. Sosiaali- ja terveystietojen luovuttamisesta tutkimus- ja tilastokäyttöön säädetään sosiaali- ja terveystietojen toissijaisesta käytöstä annetussa laissa (552/2019).

Valtioneuvoston tai sen ministeriön kiireelliseksi ilmoittama käyttölupahakemus on kuitenkin asetettava valtioneuvoston alaisen hallinnon viranomaisen käyttölupahakemuksen edelle ja toteutettava ilman aiheetonta viivytystä.

Hallinnolliseen rekisteriin perustuvan tilaston julkaisemattomuus ei ole este tai aiheellinen viivytys tilastoinnissa käytettävän hallinnollisen rekisteriaineiston luovuttamiseen tutkija- ja aineistopalveluun, ellei tiedon luovuttaminen muulla kuin tilastolain (280/2004) 13 §:ssä säädetyllä tavalla riko tilastosalaisuutta tai olennaisella tavalla ja perusteettomasti vaaranna muiden tiedontarvitsijoiden tasapuolista kohtelua. Tilastolaissa tarkoitettu tilastoviranomainen päättää rekisterinpitäjänä aina tilastointitarkoitukseen kerätyn aineiston luovutuksesta.

Tilastokeskuksen tilastointitarkoituksiin kerättyjen tietojen luovuttamisesta säädetään tilastolain 13 §:ssä. Tilastokeskus voi lisäksi salassapitosäännösten estämättä ottaa vastaan, koostaa ja säilyttää tutkija- ja aineistopalvelua varten sellaisia välttämättömiä tietoja, joita luovutetaan julkisuuslain 28 §:n perusteella valmisaineistojen muodostamiseen, tieteelliseen tutkimukseen tai yhteiskuntaoloja kuvaavien tilastollisten selvitysten tekemiseen. Tutkija- ja aineistopalvelua varten vastaanotetut tiedot luovutetaan aineiston omistajan tai rekisterinpitäjän päätöksellä. Edellä 1 momentissa tarkoitettu käyttölupahakemus voidaan evätä painavasta syystä.

Tilastokeskus voi luovuttaa tilastointitarkoitukseen kerättyjä tietoja sekä tutkija- ja aineistopalvelua varten vastaanotettuja tietoja tutkimus- ja selvityskäyttöön tieteellistä tutkimusta ja yhteiskuntaoloja koskevia tilastollisia selvityksiä varten. Tilastointitarkoitukseen kerätyt tiedot tulee luovuttaa ilman aiheetonta viivytystä jo ennen kuin tilasto on julkaistu.

Tilastokeskus päättää henkilötietojen käsittelijänä muiden rekisterinpitäjien lukuun tutkija- ja aineistopalvelua varten yksittäisiin toimeksiantoihin vastaanottamiensa muiden rekisterinpitäjien tietojen säilyttämisestä. Tilastokeskus päättää rekisterinpitäjänä valmisaineistojen säilyttämisestä. Kansallisarkisto päättää tietojen säilyttämisestä pysyvästi.

2 b §

Tilastokeskus kokoaa ja käsittelee sekä pseudonymisoi tai anonymisoi myöntämässään käyttöluvassa määritellyn aineiston luvansaajan käsiteltäväksi. Jos käyttöluvan on myöntänyt muu rekisterinpitäjä omissa rekistereissään oleviin tietoihin ja tiedot luovutetaan käytettäväksi tutkija- ja aineistopalvelussa, rekisterinpitäjän on toimitettava lupa ja siihen liittyvä tietoaineisto Tilastokeskukselle, joka yhdistää ja pseudonymisoi aineiston käyttöluvan mukaisesti käytettäväksi.

Tilastokeskuksen on säilytettävä kuvaus luovuttamiensa tietoaineistojen ja koostamiensa tilastotietojen muodostamisesta, käyttämistään pseudonymisointi- ja anonymisointimenetelmistä sekä luovutetuista lopputuloksista.

Jos tietoja luovutetaan samalle käyttäjälle usean eri tutkimussuunnitelman perusteella pseudonymisoituna, eri aineistojen yhdistäminen tutkija- ja aineistopalvelussa on estettävä.

Tilastokeskus voi muodostaa valmisaineistoja tilastointitarkoitukseen keräämistään sekä muun rekisterinpitäjän päätöksellä tutkija- ja aineistopalvelua varten vastaanottamistaan tiedoista. Tilastokeskus päättää tietojen luovuttamisesta ja käyttöoikeuden antamisesta valmisaineistoihin, jotka on muodostettu tilastointitarkoitukseen kerätyistä tiedoista tai muun rekisterinpitäjän päätöksellä tutkija- ja aineistopalvelua varten vastaanotetuista tiedoista. Tilastokeskus raportoi valmisaineistojen käyttäjien tiedot alkuperäiselle rekisterinpitäjälle vuosittain. Tilastokeskus voi käyttölupapäätösten mukaisesti avata käyttöoikeuden valmisaineistoihin tai poimia käyttölupapäätöksen mukaiset tarvittavat tiedot valmisaineistoista.


Tämä laki tulee voimaan päivänä kuuta 20 .


2.

Laki tilastolain muuttamisesta

Eduskunnan päätöksen mukaisesti

muutetaan tilastolain (280/2004) 1 §:n 2 momentti,12 §:n 1 momentti, 13 §:n 5 momentti, 14 §:n 2 momentti, 15 §:n 1, 4 ja 7 momentti ja 18 §:n 5 momentti, sellaisina kuin niistä 1 §:n 2 momentti,12 §:n 1 momentti, ja 14 §:n 2 momentti, ovat laissa 16/2020 sekä 13 §:n 5 momentti ja 15 §:n 1, 4 ja 7 momentti laissa 361/2013 seuraavasti:

1 §
Lain soveltamisala

Tilastotarkoituksiin kerättävien tietojen käsittelyyn sovelletaan luonnollisten henkilöiden suojelusta henkilötietojen käsittelyssä sekä näiden tietojen vapaasta liikkuvuudesta ja direktiivin 95/46/EY kumoamisesta annettua Euroopan parlamentin ja neuvoston asetusta (EU) 2016/679 (yleinen tietosuoja-asetus), tietosuojalakia (1050/2018) sekä viranomaisten toiminnan julkisuudesta annettua lakia (621/1999), jollei tässä tai muussa laissa toisin säädetä.


12 §
Tietojen salassapito ja julkisuus

Tilastointitarkoituksia varten annettujen tietojen julkisuudesta ja salassapidosta sekä tietoja koskevasta vaitiolovelvollisuudesta ja hyväksikäyttökiellosta säädetään viranomaisten toiminnan julkisuudesta annetussa laissa. Mainitun lain 24 §:n 1 momentin 16 kohtaa ei kuitenkaan sovelleta tilastoja laativan viranomaisen hallussa oleviin tietoihin, jotka kuvaavat valtion, kunnan, kuntayhtymän, hyvinvointialueen tai hyvinvointiyhtymän viranomaisten taikka valtion liikelaitosten toimintaa, tehtäviä tai julkisten palvelujen tuottamista, eikä tämän lain 18 §:ssä tarkoitettuja yrityksiä ja yhteisöjä koskeviin tietoihin.


13 §
Salassa pidettävien tietojen luovuttaminen

Mitä 1–4 momentissa säädetään, ei estä tietojen antamista takaisin alkuperäisessä tietosisällössä sille viranomaiselle tai muulle tiedonantajalle, joka on toimittanut tietoaineiston tilastoviranomaiselle.


14 §
Tilastokeskuksen oikeus kerätä tietoja tiedonantovelvollisuuden nojalla

Kuntien, kuntayhtymien, hyvinvointialueiden ja hyvinvointiyhtymien viranomaiset ovat velvollisia antamaan salassapitosäännösten estämättä Tilastokeskukselle tilastojen laatimisen kannalta välttämättömät tiedot niiden taloudesta, hyödykkeistä, toiminnan sijainnista, henkilöstöstä ja muista toiminnan edellyttämistä voimavaroista.

15 §
Tilastokeskuksen oikeus kerätä henkilötietoja tiedonantovelvollisuuden nojalla

Valtion viranomaiset ovat velvollisia antamaan salassapitosäännösten estämättä Tilastokeskukselle tilastojen laatimisen kannalta välttämättömät henkilötiedot, jotka kuvaavat henkilön:

1) sosioekonomisia ja demografisia ominaisuuksia mukaan lukien henkilön etninen alkuperä ja uskonto;

2) asumis- ja muita elinoloja;

3) tuloja, sosiaalietuuksia, maksuja, velkoja, varallisuutta, omistamaa ja hallitsemaa omaisuutta sekä muuta taloudellista asemaa;

4) elinkeinon- tai ammatinharjoittamista;

5) varhaiskasvatusta ja koulutusta sekä työllistymistä ja työoloja;

6) liikenneonnettomuuksiin ja tapaturmiin osallisuutta sekä niiden syitä ja seurauksia;

7) saamia rangaistuksia ja joutumista rikoksen kohteeksi;

8) saamaa oikeusapua, asioiden käsittelyä tuomioistuinlaitoksessa sekä ulosotto- tai muussa täytäntöönpanoviranomaisessa;

9) käyttämiä poliisin, Rajavartiolaitoksen ja Tullin palveluja sekä näiden viranomaisten toiminnan kohteena olemista;

10) ehdokkuutta vaaleissa ja muuta yhteiskunnallista toimintaa.


Eläketurvakeskus, Kansaneläkelaitos ja Keva ovat velvollisia antamaan salassapitosäännösten estämättä Tilastokeskukselle hallussaan olevat välttämättömät henkilötiedot vakuutettujen ammatista, palvelussuhteesta ja maksetuista etuuksista sekä Kansaneläkelaitos lisäksi yhteystiedoista.


Arkaluonteisia henkilötietoja saa sen lisäksi, mitä 1 momentin 1, 3, 7, 9 ja 10 kohdassa säädetään, kerätä tiedonantajilta vain, jos arkaluonteinen tieto on vaikuttanut välittömästi varhaiskasvatuksen, koulutuksen, etuuden tai palvelun saantiin tai sen muotoon taikka se ilmenee välillisesti varhaiskasvatuksen, koulutuksen, etuuden tai palvelun saantia tai viranomaisen päätöstä tai liikenneonnettomuuden tai tapaturman syitä ja seurauksia koskevista tiedoista.

18 §
Yrityksiä ja yhteisöjä koskevien tietojen julkisuus

Jokaisella on oikeus saada rekisteristä tietoja kopiona tai sähköisessä muodossa viranomaisten toiminnan julkisuudesta annetun lain 16 §:n 3 momentissa säädetyn estämättä. Rekisteröidyn oikeudesta kieltää itseään koskevien tietojen käsittely säädetään yleisen tietosuoja-asetuksen 21 artiklassa. Rekisteriin merkittyjen henkilötietojen käsittelystä säädetään yleisen tietosuoja-asetuksen lisäksi tietosuojalaissa.


Tämä laki tulee voimaan päivänä kuuta 20 .


Helsingissä 12.5.2022

Pääministeri
Sanna Marin

Kuntaministeri
Sirpa Paatero

Lisää muistilistalle

Muuta kansioita

Dokumentti ei ole muistilistallasi. Lisää se valittuun tai uuteen kansioon.

Lisää dokumentti kansioihin tai poista se jo liitetyistä kansioista.

Lisää uusi kansio.

Lisää uusi väliotsikko.