Dette innlegget ble holdt på Sametingets høring 20. november 2019
Først vil jeg si mange takk for invitasjonen. Jeg er veldig glad for å bli invitert hit for å diskutere denne viktige saken. Målet mitt er å gi et innspill til debatten om statistiske data om samer i Norge, ikke komme med et svar på om samisk etnisitet for statistikk- eller forskningsformål bør skje. Jeg vil si litt om hvor man bør være på særlig vakt og påpeke noe som må på plass for at dette skal være akseptabelt fra et personvernståsted. Som dere sikkert allerede har gjettet, tror Datatilsynet at slik registrering for forskningsformål kan skje, dersom det blir gjort riktig. Dette komme jeg tilbake til senere.
Diskusjonen om registrering av samisk etnisitet er ikke ny. Da det skulle opprettes et samemanntall, ble der reist spørsmål om det ville bryte med norske og internasjonale regler om personvern. Professor Carsten Smith, leder av samerettsutvalget, konkluderte slik: Et samisk nasjonalt organ, et sameting valg av samer og blant samer, lar seg ikke opprette med tilstrekkelig representativitet uten at det også blir opprettet et samemanntall. Dette var i mai 1987, altså for 32 år siden.
I dag er temaet samisk statistikk, etnisk registrering i folkeregisteret og i det lovpålagte helseregistre.
Da er det greit å starte med å fastslå det selvsagte; det er veldig mange helseregistre i Norge. Ifølge Folkehelseinstituttets oversikt fra oktober 2018 var det etablert, eller under etablering, 17 sentrale helseregistre, som for eksempel kreftregisteret og dødsårsaksregisteret. I tillegg er det, ifølge tall fra Nasjonalt servicemiljø for medisinske kvalitetsregistre, etablert 51 slike registre. Det er typisk registre med opplysninger om en spesiell lidelse eller sykdom, for eksempel nasjonalt register for prostatakreft og norsk diabetesregister. I tillegg finnes lokale registre på hvert enkelt sykehus, i tillegg til registre og store mengder statistikk om sosioøkonomiske forhold som arbeidsledighet, boforhold, trygd osv. Og endelig befolkningsundersøkelsene, som i noen grad inneholder informasjon om samisk etnisitet.
Så en selvsagt ting til: Disse registrene og denne statistikken er viktige. Forskning kan frembringe enormt viktig kunnskap i et samfunn, ja, faktisk er et godt samfunn helt avhengig av kunnskap, og god statistikk, for at man skal treffe riktige politiske beslutninger, sette inn riktige virkemidler, og ikke minst, vite om virkemidlene faktisk har en effekten man ønsker.
Men det er viktig å huske at statistikk ikke starter som statistikk. La meg ta et eksempel: Etnisitetsspesifikke data fra Australia viser at det er høyere forekomst av uførhet og sykdom blant urbefolkningen, de fullfører i mindre grad videregående skole, i større grad er arbeidsledige og har høyere selvmordsrate.
Skal vi få fram statistikk om denne typen data i Norge, må det kobles data fra «samisk etnisitet» i folkeregisteret, til ulike registre, ved hjelp av fødselsnummeret. Aktuelt register i eksemplet over er dødsårsaksregisteret, NAVs registre over sosialstønad og arbeidsledighetstrygd, Husbankens registre over boforhold og til Utdanningsdirektoratets registre. Det er ingen tvil om at dette er viktig kunnskap. Men det er viktig å ha i mente at statistikk er store mengder sensitive personopplysninger som blir gjort om til statistikk, og for å få fram slike tall, må man altså ha veldig mye data.
Et annet viktig moment er hvordan man skal få et representative antall personer med samisk etnisitet i folkeregisteret, og i de ulike typer registre man vil koble mot. Vi har ikke sikre tall på dette, men man må ha meget høy oppslutning i en gruppe for å få fram sikre tall. Dersom f eks kun 70% inkluderes i en undersøkelse, blir tallene usikre. Det er også en fare for såkalt selektivt frafall; de som virkelig trengs i statistikken, for eksempel de som bor dårlig, er arbeidsledige eller psykisk, ikke vil la seg registrere eller på annen måte ikke fanges opp.
En av regjeringens store satsinger er den såkalte helseanalyseplattformen. Det langsiktige målet er å samle det som i realiteten er all informasjon om alle norske borgere, til bruk for nær sagt alle formål. Rent teknisk vil dette bli gjort ved at f eks hjerte- og karregisteret og kreftregisteret, blir speilet, og en «kopi» legges inn i helseanalyseplattformen. Muligheten for kobling av ulike registre, koble med psykososiale forhold osv er uendelig. Hvis samisk etnisitet er ett av parameterne det kan kobles mot (altså ved at det kobles fra folkeregisteret til helseanalyseplattformen med fødselsnummer) kunne gi meget bred tilgang til data om den samiske befolkningen.
Spørsmålet jeg stiller, er om dette kan komme i konflikt med det svært viktige kravet, og den folkerettslige forpliktelsen, om at det samiske miljøet skal ha kontroll på dataene, og på forskningen som skjer på den samiske befolkningen. Dere vet, og har under at huden, at registering av etnisitet kan gå helt galt. Et viktig spørsmål å ta stilling til er derfor hvordan man skal sørge for en slik kontroll. Å fritt kunne koble data om samisk helse i helseanalyseplattformen, for eksempel, og til på sikte å bruke helt nye analysemetoder som kunstig intelligens, kan føre til tap av kontroll. Da kan man se for seg at det frembringes statistikk som kan bidra til å underbygge fordommer, eller til å få fram kunnskap som ikke er i det samiske folkets interesser. Jeg tror det her er viktig å ha i mente at et man skal bygge et forskningsetisk infrastruktur som ikke bare skal stå seg i rolige tider, men også i en situasjon der et samfunn stresses, det være seg av terrorhandlinger, miljøkatastrofer eller politisk omveltning.
Det må også foreligge et rettslig grunnlag for å registrere og analysere data. Et aktuelt rettslig grunnlag er å gi en lovbestemmelse om registrering og bruk av samiske data. Dette sikrer i mange tilfelle god debatt og demokratisk kontroll.
I de etiske retningslinjer brukes begrepet kollektivt samtykke for nye prosjekter, besluttet av Sametingsrådet, eller delegert til et ekstern og sakkyndig komite. Begrepet kollektivt samtykke er en fremmed fugl i den norske lovfloraen. Begrepet samtykke har et spesifikt innhold, og skal være informert, frivillig og uttrykkelig. Det er ikke er kollektivt samtykke. Det er også for oss uklart hva som ligger i et kollektivt samtykke, som ikke skal «rokke enkeltindividets rett til å samtykke, eller å ikke samtykke til deltagelse i forskningsprosjekter».
Det bør derfor jobbes videre med hva som kan være et rettslig grunnlag for registrering og bruk av personopplysninger om samiske befolkningen.
Når det gjelder registrering i registre, kan dette hjemles i lov. Men dette kan for eksempel kombineres med en reservasjonsrett blant annet mot utlevering til visse formål, slik tilfellet er for Kommunalt Pasientregister. Det er også viktige å begrense formålene helt tydelig, slik at data fra et register ikke kan utleveres til for eksempel et forsikringsselskap eller en arbeidsgiver.
Det er en egen hjemmel i personopplysningsloven om at kan registreres data for å utføre oppgaver i «viktige allmenne interesser, eller dersom en persons «vitale interesse», eller dersom formålet er knyttet til en berettiget interesse. Her legges det opp til brede vurdering, der mange hensyn kan komme inn, også de mange gode hensyn som taler for å registrere samisk etnisitet. Ved enkelte av disse rettslige grunnlagene stilles krav til såkalt supplerende rettsgrunnlag. Dette kan typisk være en lov som regulerer innsamling og bruk av data. Kanskje vil det i en slik vurdering også vektlegges at FNs traktatorganer er forpliktet til å spesifisere statistikk som gjelder etnisk tilhørighet og urfolk, og at Sametinget, eller Sametingsrådet, har fattet et vedtak om et prosjekt. Dette er uansett noe som må vurderes nærmere.
Statistikk er anonymt. Eller er det egentlig det? Det spørs på hvor mange individer som inngår i en statistikken. En statistikk basert på to tusen individers data vil være anonym. En statistikk basert på to individer vil ikke være det, tvert imot vil det være personopplysninger om to personer. Det er vanlig å operere med et tall på minst fem personer for å si at statistikken er anonym. Men muligheten til å krysskoble statistikk for dermed å avsløre identiteten, blir stadig større. Dette henger sammen med moderne dataanalyse, der selv helt uskyldige fragmenter av data kan sammenstilles og avsløre identitet. En av mine kollegaer har tvillinger født på hver sin dag. Det er trolig kun et fåtall personer i Norge dette gjelder, og registrering av henne og hennes tvillinger i tvillingregisteret er nærmest direkte identifiserbart. Jeg nevner dette fordi den samisk befolkningen er ganske liten, og med alle mulige forbehold om at jeg ikke har veldig god kjennskap til bosetningsmønsteret i de samiske områdene, vet jeg at det i hvert fall her i Finnmark er mange små samfunn, folk bor spredt, og de statistiske kretsene kan derfor lett bli for små. Skal innbyggerne på disse stedene delta i forskning, må man være veldig bevisst farene ved identifisering.
Kan man så registrere samisk etnisitet, drive forskning på samer og utarbeid samisk statistikk på en lovlig måte, og uten at dette kommer i konflikt med personvernet? Mitt svar på dette er ja. Det krever imidlertid en solid gjennomtenkning av blant annet av hvordan slik registrering skal skje, hvilke rettslige grunnlag man skal bruke og hvordan man skal holde samisk kontroll på forskninger. Og selvsagt hvordan man skal ivareta viktige personvernprinsipper, som for eksempel dataminimalisering. Men vi tror det juridiske kan ivaretas, og vi stiller vår kompetanse til disposisjon i dette viktige arbeidet. Så er spørsmålet om man virkelig ønsker dette, og om man har behov for det. Dette er et politisk spørsmål dere må avgjøre.