SOU 2012:36

Registerdata för forskning

Till statsrådet Peter Norman

Vid regeringssammanträde den 31 mars 2011 beslutade regeringen att tillsätta en särskild utredare med uppdrag att se över Statistiska centralbyrån (SCB) och systemet för den officiella statistiken och analysera för- och nackdelar med ett centraliserat respektive decentraliserat statistiksystem. Huvuduppdraget ska redovisas senast den 10 december 2012.

Vid regeringssammanträde den 8 mars 2012 bemyndigades statsrådet Peter Norman att i tilläggsdirektiv ge utredaren i uppdrag att också föreslå organisatoriska och tekniska åtgärder som kan underlätta registerbaserad forskning. Tilläggsuppdraget redovisas i föreliggande delbetänkande.

Till särskild utredare förordnades den 31 mars 2011 f.d. statsrådet Bengt Westerberg.

Att som sakkunnig biträda utredningen förordnades den 2 maj 2011 ämnesrådet Agne Pettersson (Finansdepartementet). Att som experter biträda utredningen förordnades samma dag professorn Kristina Alexanderson (Karolinska Institutet), utredaren Helge Bennmarker (Institutet för arbetsmarknads- och utbildningspolitisk utvärdering), professorn Harry Flam (Institutet för internationell ekonomi, Stockholms universitet), verksamhetsområdeschefen Eva-Lo Ighe (Försäkringskassan), rättssakkunnige Andreas Krantz (Justitiedepartementet), f.d. riksrevisorn Eva Lindström, professorn Cecilia Magnusson Sjöberg (Institutet för rättsinformatik, Stockholms universitet), chefsjuristen Eva Nilsson (Statistiska centralbyrån), professorn Måns Rosén (Statens beredning för medicinsk utvärdering) och gästprofessorn Bo Sundgren (Institutionen för data- och systemvetenskap, Stockholms universitet).

Som sekreterare i utredningen anställdes fr.o.m. den 8 april 2011 hovrättsassessorn Sofia Tollgerdt, fr.o.m. den 1 augusti 2011 civilekonomen Svante Eriksson och fr.o.m. den 8 mars 2012 docenten Magnus Stenbeck. De två förstnämnda arbetar med utred-

ningens huvuduppdrag, medan Magnus Stenbeck varit ensamt ansvarig sekreterare i arbetet med tilläggsuppdraget.

Utredningen har antagit namnet Statistikutredningen 2012. Utredningen får härmed överlämna delbetänkandet Registerdata för forskning (SOU 2012:36).

Stockholm den 2 maj 2012

Bengt Westerberg

/Magnus Stenbeck

Sammanfattning

Svensk registerforskning har vunnit stort anseende internationellt och lett till en hög produktivitet i svensk forskning. De kanske mest iögonfallande vinsterna kan noteras på det medicinska området. I kapitel 2 ges några exempel på sådan forskning.

Regeringen uttalade i 2008 års forskningsproposition ”Ett lyft för forskning och innovation” (prop. 2008/09:50) ambitionen att stärka den forskning som utnyttjar de svenska befolkningsbaserade registren.

Under perioden 2009–2011 har några viktiga initiativ tagits i detta syfte. Vetenskapsrådet (VR) har satsat betydande resurser på att i en nationell struktur samordna de biologiska prover som används i forskning, Biobankning och Analys av Biologiska Prover (BBMRI), och på att utveckla ett system för fjärråtkomst till registerdata vid Statistiska centralbyrån (SCB), det s.k. Microdata online access system (MONA). Staten och Sveriges Kommuner och Landsting (SKL) har gemensamt satsat på nationell samordning och utveckling av hälso- och sjukvårdens kvalitetsregister.

Det saknas dock fortfarande en samordning av dessa initiativ och ett införlivande av registerdata från andra statliga myndigheter i MONA-systemet.

Mot denna bakgrund beslutade regeringen i februari i år om ett antal åtgärder. En av dessa var att ge Statistikutredningen 2012 i uppdrag att föreslå organisatoriska och tekniska åtgärder för att stimulera registerforskning.

I detta betänkande identifieras de viktigaste datakällorna för forskning inom medicin, samhällsvetenskap, beteendevetenskap och ekonomisk vetenskap. De kan delas in i fyra grupper:

1. Data som finns hos statliga förvaltningsmyndigheter, såsom SCB och Socialstyrelsen.

2. Data från biologiska prover.

3. Data från regionala och lokala myndigheter, särskilt hälso- och sjukvårdens kvalitetsregister.

4. Data genererade i forskningsprojekt.

Ambitionen att samla och underlätta tillgängligheten till data för forskare måste balanseras mot behovet att skydda individens integritet. Det finns ett stort antal författningar som reglerar registerhållningen, och för närvarande pågår översyn av reglerna såväl inom den europeiska unionen1 som i Sverige2. Sedan år 2004 ska forskare som vill använda personuppgifter i forskningen få forskningen godkänd av en etikprövningsnämnd samt få datauttaget godkänt av den eller dem som förvaltar data i enlighet med bestämmelser om sekretess till skydd för den personliga integriteten. Processen innebär att forskning ska definieras för avgränsade ändamål och på förhand. Detta förhindrar i vissa fall insamling av uppgifter för breda ändamål, vilket har inneburit hinder för uppbyggnad av gemensamma forskningsresurser. Datainspektionen har i några tillsynsärenden av detta skäl förelagt projekt eller organisationer att upphöra med datainsamling.

Tillståndsprocessen är ofta tidsödande och innefattar bedömningar i flera led. Den uppfattas av många forskare som krånglig och svårbegriplig vilket kan försena forskningen. Forskningsdataprocessens olika led och forskares upplevelser av den behandlas i kapitel 4. I kapitlet noteras, utöver ett behov av regelöversyn som ligger utanför detta uppdrags ram, behov av organisatorisk samordning samt bättre information och utbildning.

I kapitel 5 redovisas vilken information och dokumentation som finns, vilka aktörer som ansvarar för denna och vilka nationella behov som finns av samordning och enhetlighet. Jag konstaterar att samordningsbehov finns, men att utspridningen av den detaljerade informationen hos många registerhållare är nödvändig för att upprätthålla kvaliteten. För att kunna dra nytta av data som finns i ett starkt decentraliserat system måste samordningen bli bättre.

I kapitel 6 redogör jag för de nya möjligheter som finns att hantera data via fjärråtkomst. Fjärråtkomstsystemet MONA vid SCB har samtidigt inneburit förbättringar avseende forskarservice, säkerhet och integritetsskydd. För att samordna data med fjärråtkomst från flera aktörer behövs utveckling av distribuerade data-

1 Översyn av det europeiska dataskyddsdirektivet 95/46/EG genom förslag till ny författning publicerad av kommissionen den 25 januari 2012. 2 Bl.a. Informationshanteringsutredningen (Ju 2011:11).

lösningar där data sambearbetas utan att de flyttas från dataförvaltaren, s.k. federerade datasystem. Det saknas en ansvarig aktör som beställer och driver ett sådant system.

I kapitel 7 föreslås organisatoriska åtgärder som syftar till att förbättra datatillgängligheten, integritetsskyddet och kostnadseffektiviteten. På grund av de känsliga uppgifter som behandlas i forskningen finns det starka skäl att lägga uppgiften på en myndighet. I kapitlet redovisas de delar av Vetenskapsrådets och SCB:s verksamhet som är berörda. Ingen av dessa myndigheter bedömer att ett operativt ansvar för utveckling och drift av ett system som är anpassat till forskningens behov på ett naturligt sätt kan inlemmas i deras övriga verksamhet. Jag föreslår därför att en ny myndighet bildas.

Tre övergripande områden där förbättringar behövs har identifierats. Det behövs samordning av:

1. dokumentation och information,

2. den rättsliga prövningen av forskning och datautlämnande, samt

3. den praktiska datahanteringen inklusive utnyttjandet av data från

olika registerhållare.

Den nya myndigheten bör därför ges den övergripande uppgiften att ansvara för en databasinfrastruktur för forskning med hjälp av personidentifierade myndighetsdata.

Det är väsentligt att de principiellt viktiga beslut som den ansvariga myndigheten fattar förankras hos andra berörda myndigheter och organisationer. För att säkerställa detta föreslår jag att det till myndigheten knyts ett Forskningsdataråd med uppgift att främja användningen av myndigheternas registerdata i forskningen.

Den nya myndigheten föreslås få en rad uppgifter rörande organisation, prövningsprocess, information och dokumentation, datahantering och analys vilka närmare redovisas i kapitel 7. Som konsekvens av de svårigheter av legala och andra skäl som finns att upprätthålla en generellt syftande databas som understödjer mikrosimulering för planering och forskning föreslås att den nya myndigheten ges uppgiften och rättigheten att upprätta en analysmiljö för detta syfte.

I kapitel 8 till sist redovisas förslagets förutsättningar och konsekvenser. En rad av de uppgifter som föreslås ligger inom ramen för gällande rätt, medan andra kan förutsätta regeländringar. Jag har inte på den korta utredningstid som har stått till förfogande

haft möjlighet att i detalj belysa detta. Det bör utredas vidare i den närmare planeringen av verksamheten.

Förslaget innebär att myndigheten bör ta över organisatoriskt ansvar för

1. hela eller delar av MONA och mikrosimuleringssystemet FASIT

från SCB,

2. Svensk Nationell Datatjänst från Göteborgs universitet, samt

3. mikrosimuleringsmodellen SESIM från Regeringskansliet.

I övrigt förutsätts förslaget inte leda till några förändringar av de arbetsuppgifter som i dag utförs av dessa organ.

Vissa av de verksamheter som den nya myndigheten föreslås få ansvar för finansieras i dag av SCB, Regeringskansliet, Göteborgs universitet och VR. Detta ekonomiska ansvar bör överföras till den nya myndigheten.

Utöver detta tillkommer kostnader för Forskningsdatarådet, ny personal vid myndigheten, kostnader för utveckling av forskningsanpassade system vid datamyndigheterna, kostnader för information till forskare och allmänhet samt kostnaden för att utveckla en federerad datastruktur.

Den sammanlagda kostnaden för den nya myndighetens verksamhet uppskattas inledningsvis till omkring 98 miljoner kronor per år, varav cirka 51 miljoner kronor i dag finansieras genom andra huvudmän. Kostnadsökningen för den föreslagna organisationen för att stimulera registerforskning kan alltså i initialskedet uppskattas till knappt 50 miljoner kronor. På sikt tillkommer kostnader för investering i och implementering av ny teknik för att underlätta samkörning av data.

1. Utredningens uppdrag

1.1. Bakgrund till tilläggsdirektiven

Regeringen uttalade i 2008 års forskningsproposition ”Ett lyft för forskning och innovation” (prop. 2008/09:50) ambitionen att stärka den forskning som utnyttjar de svenska befolkningsbaserade registren. I propositionen sägs:

Registerhållningen över hela befolkningen och systemet med personnummer ger unika förutsättningar för att studera angelägna, tvärvetenskapliga frågor kring sambandet mellan samhällsförhållanden, ekonomi och hälsa. Sverige har mycket goda förutsättningar för ledande forskning genom dessa registerbaserade data som i dagsläget är underutnyttjade. För att fullt ut kunna dra nytta av de svenska unika förutsättningarna behövs ett mer effektivt utnyttjande av befintliga databaser och register. I dag finns det en begränsad samordning av infrastruktur och databaser inom humaniora och samhällsvetenskap, medicin och livsvetenskaper. Att bättre utnyttja dessa är viktigt, inte bara för forskning på området utan även för en framgångsrik och kunskapsbaserad utveckling av berörda verksamheter inom hälso- och sjukvård. Regler och lagar för samutnyttjande av registerdata och andra data kan behöva granskas och anpassas till nya organisatoriska och tekniska förutsättningar. Vetenskapsrådet har också en större satsning, det så kallade DISCprojektet, som syftar till att möta behovet av nya organisatoriska och tekniska förutsättningar genom att samordna kvalitetssäkrade forskningsdatabaser. Projektet innebär också arbete för ökad tillgänglighet, kvalitetssäkring och integritet.1

Under perioden 2009–2011 har två viktiga större initiativ tagits. Vetenskapsrådet (VR) har satsat betydande resurser på att samordna de biologiska prover som används i forskning i en nationell struktur, Biobankning och Analys av Biologiska Prover (BBMRI, se bbmri.se). Staten och Sveriges Kommuner och Landsting (SKL)

1Prop. 2008/09:50, s. 190 f.

har gemensamt satsat på nationell samordning och kraftigt ökade bidrag till utveckling av hälso- och sjukvårdens kvalitetsregister (se www.kvalitetsregister.se). Jag beskriver dessa båda initiativ närmare i det följande.

Det nämnda DISC-projektet (DISC = Database Infrastructure Committee) innebar bl.a. en stor satsning på utbyggnad av det s.k. MONA-systemet hos Statistiska centralbyrån (SCB) och service till forskare som använder det. VR har sedan år 2006 bidragit med utvecklings- och årliga driftsanslag till MONA.

MONA-systemet (MONA = Micro data Online Access) utvecklades, med utgångspunkt i ett existerande system vid Danmarks Statistik, fr.o.m. år 2004 vid SCB för leverans av mikrodata till forskare där uppgifterna i stället för att skickas till forskaren tillhandahålls i myndighetens egen servermiljö. SCB prioriterar denna leveransmetod för att kunna öka säkerhet och kontroll över mikrodata och samtidigt erbjuda en rationellare och snabbare datahantering och leverans till forskaren. Forskaren ges möjlighet att via sin dator koppla upp sig mot myndigheten och analysera data som finns där. Om forskaren har egna data, som ska påföras registeruppgifter, läggs också dessa upp i MONA-miljön. År 2012 finns omkring 850 användare i systemet, varav knappt 500 forskare.

DISC-projektet innebar att VR tog på sig en operativ roll för att stimulera registerforskning. Sedan år 2009 har VR emellertid successivt förändrat sin roll och under våren 2012 slutligt beslutat att avveckla detta projekt.

Den problembild som ges i 2008 års forskningsproposition är i huvudsak alltjämt giltig. Således saknas det fortfarande en samordning av de initiativ som har tagits avseende forskningens användning av de befolkningsbaserade registren vid statliga förvaltningsmyndigheter och andra för forskningen viktiga register. Dessutom gäller alltjämt, som framhålls i citatet från 2008 års forskningsproposition, att ”regler och lagar för samutnyttjande av registerdata och andra data kan behöva granskas och anpassas till nya organisatoriska och tekniska förutsättningar”. Det har blivit tydligt att gällande lagar innebär vissa problem särskilt för uppbyggnaden av sådana databaser som skapas av forskare själva. Lagstiftningen och regeltolkningen innebär att ändamålen med sådana databaser när de byggs upp måste vara tydligt avgränsade till redan på förhand definierade forskningsproblem. Detta har betonats i bl.a. den till-

syn som utförs av Datainspektionen.2 Det innebär att det inte är möjligt att vid universiteten bygga mer generella databaser som i ett senare skede kan användas för att analysera nya forskningsfrågor.

Mot denna bakgrund beslutade regeringen i februari i år om ett antal åtgärder, vilka beskrevs på följande sätt i det aktuella pressmeddelandet3:

Regeringen aviserar nu tre åtgärder för att förbättra förutsättningarna för registerbaserad forskning. En viktig utgångspunkt i alla dessa insatser är att forskningens behov måste vägas mot den personliga integriteten.

1. Nya regler för forskningsregister såsom LifeGene

Regeringen inför nya regler för forskningsregister för bestämt ändamål. Den nya författningen ska gälla universitet och högskolor som ska få föra register för befolkningsbaserad forskning. Forskningen ska handla om vad arv och miljö betyder för uppkomsten av olika sjukdomar och för personers hälsa i övrigt. Personuppgifter ska enbart få samlas in om personen i fråga lämnat sitt uttryckliga samtycke och på begäran ska personuppgifterna utplånas.

2. Nya regler för att underlätta för sambearbetning

En utredare ska undersöka möjligheterna att underlätta att uppgifter från olika register sambearbetas för forskningsändamål. Utredningen ska också föreslå förbättrade förutsättningar för att genomföra forskningsprojekt som följer en grupp av individer över en längre tid och se över förutsättningarna för att uppdatera befintliga forskningsregister. Utredningen ska redovisas under 2013.

3. Ny organisation för sambearbetning

Den så kallade Statistikutredningen får ett nytt uppdrag att föreslå åtgärder för att underlätta registerbaserad forskning. Exempelvis kan forskare behöva information både från register som finns hos Socialstyrelsen och från SCB:s befolkningsregister. I dag kan olika regelverk och praktiska hinder försvåra samkörning av dessa uppgifter. Utredaren ska bland annat identifiera olika myndigheters ansvar för register och föreslå organisatoriska åtgärder, till exempel hur innehållet i register kan beskrivas mer enhetligt.

Regeringen beslutade den 8 mars 2012 om de tilläggsdirektiv till Statistikutredningen som nämns under punkt 3 i pressmeddelandet.

2 Se t.ex. det beslut Datainspektionen fattade den 16 december 2011, Tillsyn enligt personuppgiftslagen (1998:204), PuL av LifeGene Dnr 766-2011, och beslutet den 18 april 2012, Tillsyn enligt personuppgiftslagen (1998:204) – av Göteborgs universitet (Svensk nationell datatjänst). Dnr 811-2011. 3 Beskrivningen av åtgärderna har hämtats ur ett pressmeddelande från Utbildningsdepartementet från den 28 februari 2012.

1.2. Tilläggsdirektiv

Enligt tilläggsdirektiven ska utredningen ”föreslå organisatoriska och tekniska åtgärder som kan underlätta registerbaserad forskning”. Följande uppgifter specificeras:

1. Identifiera vilka de viktigaste datakällorna för forskning är och vilka centrala och regionala myndigheter som ansvarar för dessa.

2. Särskilt analysera och beskriva vilka hinder som finns för tillgänglighet till myndigheters registeruppgifter för forskningsändamål.

3. Föreslå åtgärder inom ramen för gällande rätt för att öka tillgängligheten till myndigheters registeruppgifter för forskningsändamål och underlätta för registeransvariga myndigheter att lämna ut uppgifter för forskning.

4. Föreslå åtgärder för att införa en mer enhetlig och tydlig struktur för dokumentation av innehållet i myndigheters register som kan användas i forskning och för uppgifternas lagringsform hos registeransvariga myndigheter, däribland mikrosimuleringsmodeller.

5. Föreslå organisatoriska och tekniska åtgärder som kan underlätta skapandet av register och användningen av registeruppgifter för forskningsändamål.

6. Vid utformningen av förslagen väga behovet av att förbättra förutsättningarna för registerbaserad forskning mot behovet av skydd för individens personliga integritet, samt redovisa vilka avvägningar som gjorts.

7. Redovisa konsekvenserna av förslagen när det gäller eventuella ekonomiska följder för registeransvariga myndigheter, universitet och högskolor samt andra berörda myndigheter och organisationer där forskningen utförs.

8. Redovisa förslagens konsekvenser när det gäller skyddet för enskilda människors integritet.

1.3. Arbetets genomförande

Som framgått av avsnitt 1.1 är det regeringens uppfattning att den svenska registerhållningen över hela befolkningen och systemet med personnummer ger unika förutsättningar för att studera angelägna, tvärvetenskapliga frågor kring sambanden mellan samhällsförhållanden, ekonomi och hälsa och att dessa registerbaserade data i dagsläget är underutnyttjade. Vidare anser regeringen att det behöver vidtas olika typer av åtgärder för att underlätta möjligheterna till registerbaserad forskning, t.ex. avseende samverkan mellan registerhållande myndigheter.

Med den begränsade tid som har stått till förfogande för tilläggsuppdraget har jag valt att ta de utgångspunkter som regeringen anger i tilläggsdirektiven i stort sett för givna. Någon i grunden problematiserande diskussion om varför det behövs ökad registerforskning och ytterligare åtgärder för stimulera en sådan utveckling redovisas därför inte i delbetänkandet. Jag delar dock i allt väsentligt regeringens åsikt att de svenska nationella registren är en potentiellt stor och internationellt unik tillgång för forskningen. Genom att använda de data som finns där, och kombinera dem på ett kreativt sätt, kan viktiga forskningsfrågor besvaras av betydelse för planering, beslut och utveckling av samhället.

Den begränsade utredningstiden har också inneburit att jag i huvudsak har tvingats fokusera arbetet på att ta fram ett förslag till organisatoriska åtgärder för att underlätta och stimulera registerbaserad forskning. Vissa övriga uppgifter redovisas mer översiktligt och förslagen kommer att närmare utvecklas i det slutbetänkande som ska läggas fram i slutet av detta år. Skapande av forskningsregister torde som framgått delvis förutsätta ny lagstiftning vilket ligger utanför utredningens mandat. Den uppgiften har därför endast berörts översiktligt i samband med det organisationsförslag som lämnas i detta delbetänkande och kommer heller inte att behandlas vidare i slutbetänkandet.

I tilläggsuppdraget har utredningen – i enlighet med vad som anges i tilläggsdirektiven – samrått med närmast berörda intressenter. Således har jag inhämtat synpunkter från Statistiska centralbyrån, Vetenskapsrådet, Socialstyrelsen, Centrala etikprövningsnämnden, de regionala etikprövningsnämnderna, Datainspektionen och Sveriges Kommuner och Landsting. Jag har även genom utredningens sekreterare varit i kontakt med flera kommittéer och utredare som arbetar med register- och statistikfrågor eller andra närliggande

frågeställningar, framför allt Informationshanteringsutredningen (Ju 2011:11), Statens vård- och omsorgsutredning (S 2011:01) och Utredningen om förbättrad tillgång till personuppgifter inom och mellan hälso- och sjukvården och socialtjänsten (S 2011:13). Dessutom har jag inhämtat information om forskningsdatainfrastrukturen i Norge genom kontakt med Statistisk Sentralbyrå i Norge och Norsk Samfunnsvitenskapelig Datatjeneste.

2. Registerforskningens värde och potential

2.1. Vad är registerforskning?

Tilläggsuppdraget handlar alltså om att utredningen ska föreslå organisatoriska och tekniska åtgärder som kan underlätta registerbaserad forskning. Med ”registerbaserad forskning” avses i denna utredning forskning som använder sig av uppgifter som kan knytas till fysiska personer, härrör från myndigheter eller andra organisationer och som i första hand inte primärt är insamlade för forskningsändamål. Det kan också röra sig om forskning med personuppgifter som samlats in för forskningsändamål där personidentifikationen behålls under längre tid och där personerna följs upp med ny datainsamling vid ett eller flera tillfällen.

Med ”personer” avses i denna text såväl levande som avlidna. Begreppet ”register” används i utredningen i en vid mening. Det kan innefatta data om personer, men kan också innefatta andra förteckningar, t.ex. metadatabaser över forskningsmaterial.

2.2. Vad kan vinnas med registerforskning?

Svensk, och nordisk, registerforskning har vunnit stort anseende internationellt och lett till en hög produktivitet i svensk forskning. Avsikten är att här endast ge smakprov på vad denna forskning har lett till.

De kanske mest iögonfallande vinsterna kan noteras på det medicinska området. Man kan här i princip räkna ut effekter i form av antalet sparade människoliv och förbättrad livskvalitet hos befolkningen. Värdet av svensk registerforskning sträcker sig emellertid långt utanför Sveriges gränser. I praktiken är därför det sammantagna värdet svårt att uppskatta.

Den pågående forskningsinsats som särskilt uppmärksammas i Utbildningsdepartementets ovan citerade pressmeddelande från den 28 februari 2012 är LifeGene. I detta projekt avser man att rekrytera flera hundra tusen frivilliga deltagare som ska följas under lång tid framöver i ett samarbete mellan de medicinska fakulteterna vid sex svenska universitet. Avsikten är att utvinna ny kunskap om bakgrund till och behandling av våra vanligaste folksjukdomar och hälsoproblem som exempelvis astma, allergier, infektioner, fetma, förslitningsskador, kronisk trötthet och smärta, och de stora sjukdomarna senare i livet – hjärt- och kärlsjukdomar och cancer. LifeGene ska följa hur personers biologiska arv och miljö påverkar deras hälsa och sjuklighet på lång sikt.

Forskning baserad på de nordiska cancerregistren har varit viktig för primär och sekundär cancerprevention. Snart sagt varje projekt inom epidemiologisk cancerforskning utgår från registermaterial. Ett exempel på pågående longitudinell forskning är den kontinuerliga uppföljning av Cancerfondens riksmarsch som pågår sedan omkring 15 år tillbaka. Riksmarschkohorten etablerades hösten 1997 i samband med en insamlingsaktivitet för Cancerfonden. Efter ett detaljerat informerat samtycke fyllde cirka 44 000 personer i ett omfattande frågeformulär om diverse livsstilsrelaterade exponeringar. De godkände samtidigt att forskarna vartannat år samkör data mot patientregistret, cancerregistret, dödsorsaksregistret och registret över totalbefolkningen. Under senare år har data även samkörts mot läkemedelsregistret, som tillkom år 2005. På detta sätt är det möjligt att följa en stor grupp människor över lång tid när det gäller hälsoeffekter av livsstil, något som skulle vara mycket komplicerat utan registrens existens.

Cancer- och dödsorsaksregistrens uppgifter används också till att analysera överlevnad i olika cancerformer, t.ex. med avseende på tiden för upptäckt och i relation till olika behandlingar. Kunskapen om detta har lett till nationella riktlinjer för cancervården. För bl.a. bröstcancer har dessa ansetts starkt bidra till att svenska kvinnor har betydligt bättre chanser att överleva sjukdomen än kvinnor i andra länder. Data från hälso- och sjukvården tillsammans med de centrala registren har använts för att analysera effekterna av hälsoundersökningar och screening. När det gäller t.ex. livmodershalscancer har man med hjälp av registerdata kunna påvisa att sjukdomen radikalt har minskat p.g.a. screeningens möjlighet att upptäcka förstadier till den.

Det medicinska födelseregistret har använts i ett stort antal studier som resulterat i flera hundra vetenskapliga artiklar och ett 25-tal doktorsavhandlingar. Analyser baserade på registret har t.ex. visat att rökning hos modern under graviditeten har negativa effekter på fostret och på barnets hälsa senare i livet. Med detta och andra registers hjälp har man också kunnat visa att K-vitaminsprutor till spädbarn inte har de negativa hälsoeffekter som misstänktes efter vissa mindre utländska studier. I Sverige kunde man genom en enkel förfrågan till förlossningsklinikerna som kombinerades med registeruppgifter på kort tid vederlägga dessa misstankar med hjälp av ett långt större komplett befolkningsbaserat material. Registrens uppgifter har också använts för att analysera riskerna med provrörsbefruktning, vilket har lett till en ändrad policy i hälso- och sjukvården. Genom att koppla registeruppgifter från Socialstyrelsen och SCB har man också sett att tonårsgraviditeter är knutna till ökade hälsorisker och till sociala problem för såväl mor som barn senare i livet.

Läkemedelsregistret har använts för att följa upp befolkningens läkemedelsanvändning. Det är ett viktigt komplement till de randomiserade läkemedelsprövningar som föregår läkemedlens införande på marknaden. Genom registret kan okända bieffekter och långtidseffekter upptäckas. Användningen av detta relativt nya register i forskningen ökar snabbt.

Ett flertal registerstudier har visat samband mellan rökning, blodfetter och hjärt-/kärlsjukdomar. SCB:s och Socialstyrelsens register har använts för att visa hur dessa sjukdomar, i likhet med många andra, har en ojämlik fördelning med avseende på kön, inkomst, utbildning och social ställning.

Genom användningen av data från centrala register har stora samhällsvinster uppnåtts. Men potentialen är långt större om forskningen i framtiden kan få förbättrad tillgång även till data från biobanker och hälso- och sjukvårdens s.k. kvalitetsregister. I förordet till den utredning om kvalitetsregister som genomfördes år 20101 sägs:

Utredningen om den kliniska forskningen och delegationen för samverkan inom den kliniska forskningen har visat att vi förlorat en del mark gentemot andra länder när det gäller klinisk forskning och att vi samtidigt insett vikten av en kraftfull satsning på register. Det har också funnits en enighet om att det egentligen bara är ett område där

1 Översyn av de nationella kvalitetsregistren, Guldgruvan i hälso sjukvården. Förslag till gemensam satsning 2011–2015, Måns Rosén oktober 2010.

svensk hälso- och sjukvård och medicinsk forskning har unika konkurrensfördelar gentemot övriga världen. Personnummer, heltäckande befolknings- och hälsodataregister samt nationella kvalitetsregister av hög kvalitet ger oss förutsättningar för att följa upp patienterna och därigenom utveckla vården och bedriva forskning som de flesta länder utanför Norden saknar.

I rapportens sammanfattning anges några praktiska resultat som uppnåtts genom användning av data från kvalitetsregister. Dessa innefattar att öppna jämförelser av hjärtinfarktvård och ortopedi har lett till förbättringar av dessa verksamheter, att sjukvården använder bättre och mer långlivade proteser och att strokesjukvården har förbättras. Det har också lett till att barn med cancer lever längre än tidigare, att behandlingsresultaten vid ljumskbråcksoperationer har förbättrats och antalet infektioner efter kataraktoperationer halverats.

Samtidigt påpekas att dessa för folkhälsan och patienterna positiva resultat skulle kunna mångdubblas genom en effektivare samordning av data. Detta har motiverat den satsning på inbördes samordning av kvalitetsregistren som nu sker med finansiering från staten och SKL. Alltjämt återstår dock extern samordning med andra datakällor.

Även inom samhällsvetenskaplig forskning har registerbaserade datamaterial en central betydelse. Registerdata avseende inkomster, utbildning, arbetsmarknad och socialförsäkring kompletterar regelmässigt data som samlas in i frågeundersökningar såsom Levnadsnivåundersökningen (LNU) vid Institutet för social forskning (SOFI) vid Stockholms universitet, SCB:s undersökning om levnadsförhållanden (ULF/SILC) och olika forskningsdatabaser vid Institutet för arbetsmarknads- och utbildningspolitisk utvärdering (IFAU) i Uppsala.

Under de senaste tio åren har förutsättningarna för registerbaserad forskning också förbättrats genom tillkomsten av nya databaser särskilt avsedda för analys. Ett exempel är SCB:s LISA (Longitudinell integrationsdatabas för sjukförsäkrings- och arbetsmarknadsstudier), som innehåller uppgifter om demografi, utbildning, arbete, inkomster, arbetsmarknadspolitiska åtgärder och ersättningar från socialförsäkringen. LISA har skapat bättre förutsättningar för longitudinella observationsstudier inom politikområdena utbildning, arbetsmarknad och socialförsäkring. LISA används i dag bland annat i forskning kring långvarigt sjukskrivnas möjligheter att finna nytt arbete, könsskillnader i sjukfrånvaro, relationen mellan inkomster och

barnafödande, möjligheterna att hävda sig på arbetsmarknaden vid olika socioekonomisk status samt i olika stressforskningsprojekt.

Ett ytterligare exempel inom politikområde socialförsäkring är Försäkringskassans databas MiDAS (MikroData för Analys av Socialförsäkringen) som är en vidareutveckling av datalagret STORE (STatistik Och REsultat). STORE förser bl.a. LISA med socialförsäkringsdata och utgör grunden för den officiella statistiken inom socialförsäkringsområdet. I STORE lagras framför allt olika typer av data hämtade från de administrativa registren. Syftet med MiDAS är att möjliggöra mer ingående studier av socialförsäkringen på en detaljerad nivå med individen som utgångspunkt. MiDAS har exempelvis använts för ingående studier av partiell sjukskrivning under längre sjukfall och vilken betydelse denna har för återgång i arbete. MiDAS utgör i dag den primära källan för forskare som vill komplettera sina data med detaljerade uppgifter om utfallet i sjukförsäkringen.

Sammantaget ger personnumren, befolknings- och hälsodataregistren, kvalitetsregistren och biobankerna unika möjligheter att bedriva forskning av högsta internationella kvalitet.

3. De viktigaste datakällorna för forskning samt ansvariga myndigheter

I uppdraget ingår att identifiera de viktigaste datakällorna för forskningen och de ansvariga myndigheterna för dessa. Förteckningar över personregister och databaser med intresse för forskningen finns i delbetänkandets bilagor 3–6. Nedan redovisas de kortfattat.

3.1. Befolkningsbaserade frågeundersökningar

Det finns register över befolkningsbaserade frågeundersökningar vid myndigheter, vilka primärt har gjorts för andra syften än forskning.

Viktiga exempel är Valundersökningarna, Undersökning av levnadsförhållanden/Survey of Income and Living Conditions (ULF/SILC), Hushållens ekonomi (HEK), Arbetskraftsundersökningen (AKU) och Arbetsmiljöundersökningen, som alla görs av SCB.

De för forskarna viktigaste befolkningsbaserade frågeundersökningarna är emellertid de som görs av dem själva och för vilka lärosätena är huvudmän. Förteckningar över universitetsbaserade forskningsstudier finns i viss utsträckning hos Svensk Nationell Datatjänst (SND) vid Göteborgs universitet. Frågeundersökningar som är knutna till biologiska provsamlingar dokumenteras ibland i anslutning till BBMRI:s uppgifter om forskningsprover (se avsnitt 3.2.4). Vilka databaser av detta slag som finns är emellertid ofullständigt kartlagt och jag avstår från att här beskriva dem närmare. SND har av Vetenskapsrådet getts uppgiften att genomföra en nationell kartläggning.

3.2. Administrativa personregister

3.2.1. Befolkningsregister (demografi, boende, familjeförhållanden, etc.)

SCB förfogar över ett trettiotal individbaserade register av intresse för forskningen. Basen utgörs av de demografiska registren som beskriver hur befolkningen är fördelad över åldrar, kön och geografiska områden, samt individers familjebindningar, boende, etniska bakgrund och migration. På basis av SCB-uppgifter har man konstruerat det s.k. Tvillingregistret, som förs vid Karolinska Institutet, men som av legala skäl inte har kunnat uppdateras med nya tvillingpar sedan år 2003. Släktskapsuppgifter kan dock hämtas direkt från SCB i samband med ändamålsspecificerade studier. Registret över totalbefolkningen (RTB) är särskilt viktigt för urvalsändamål. En särskilt viktig framtida källa kommer att bli den nya folkbokföring på lägenhet som nu genomförs av Skatteverket med hjälp av Lägenhetsregistrets uppgifter.

3.2.2. Socioekonomiska register

SCB för uppgifter om befolkningens socioekonomiska sammansättning, såsom utbildning, yrke, försörjning, inkomster, utgifter och taxering. Vissa av uppgifterna tas från totalregister medan andra härrör från de urvalsundersökningar som redovisats ovan. Många uppgifter som förvaras vid SCB kommer från andra myndigheter. Uppgifter om skolgång, betyg och utbildning härrör från Skolverket, om bidrag och pensioner från Försäkringskassan och Pensionsmyndigheten, om brott och lagföring från Brottsförebyggande rådet, etc. Uppgifterna är viktiga för exempelvis samhällsvetenskaplig, beteendevetenskaplig och medicinsk forskning. De utgör bl.a. en väsentlig bas för välfärdsforskning, beteendevetenskaplig forskning och ekonomiska prognos- och simuleringsmodeller.

3.2.3. Hälsodataregister

De centrala hälsodataregistren samlas in och förvaltas av Socialstyrelsen. De omfattar såväl hälsa som hälso- och sjukvård och är mycket flitigt använda i forskningen. Hälso- och sjukvårdsregister med personuppgifter rör sluten och öppen vård vid sjukhus, cancer,

läkemedel och tandhälsa. Data kring förlossningar registreras i det medicinska födelseregistret. Dödsorsaksregistret med gamla historiska rötter utgör en viktig komponent i mycket forskning. Socialstyrelsen ansvarar också för metadatainformation vad gäller hälso- och sjukvårdens kvalitetsregister.

3.2.4. Uppgifter från biologiska prover

I dag finns knappt 600 biobanker förtecknade i det svenska biobanksregistret (SBR)1. Över hälften av dessa (325 stycken) förs av landstingen, men det finns också biobanker i privat regi (knappt 200) och vid universitet (ett 60-tal). Av de sistnämnda utgörs ett fåtal (10 procent) av biobanksstrukturer, medan den dominerande delen är material från enskilda forskningsstudier. Enstaka biobanker finns vid statliga förvaltningsmyndigheter, t.ex. Smittskyddsinstitutet och Läkemedelsverket. Omkring tre procent av alla existerande prover har samlats in i forskningssyfte. Prover har registrerats sedan 1920-talet, men forskningsproverna härrör från senare år.

Sedan år 2009 har för forskningsändamål genom VR:s initiativ prover samordnats i BBMRI. En överenskommelse träffades år 2011 mellan SKL och VR om att satsa på en gemensam nationell resurs för svenska biobanker. Syftet är att bygga den största resursen för forskning i världen inom detta område. På BBMRI.SE finns i dag 74 provsamlingar förtecknade fördelat på nio olika diagnosgrupper. Proverna härrör från såväl befolkningsbaserade urvalsstudier som patienter inom hälso- och sjukvården. Ett förslag till ny biobankslag2 innehåller krav på att proverna ska kunna spåras till person, vilket möjliggör såväl försökspersonens kontroll över proverna som deras användning i forskning.

3.2.5. Register för verksamhetsuppföljning

Vid Socialstyrelsen finns sex register över socialtjänstinsatser för barn, äldre, personer med funktionsnedsättning, missbrukare och ekonomiskt utsatta. Inom forskningen används i första hand regist-

1 http://www.biobanksverige.se/ 2 En ny biobankslag. SOU 2010:81.

ret över insatser för barn och unga och registret över ekonomiskt bistånd.

Den huvudsakliga potentiella källan för forskning är dock hälso- och sjukvårdens kvalitetsregister, varav ett 90-tal i dag får bidrag för att utgöra nationella resurser. Som nämnts ovan görs för närvarande en stor nationell satsning på att samordna dessa data, bl.a. för användning inom den kliniska forskningen3.

3 http://www.kvalitetsregister.se/

4. Forskningsdataprocessen

4.1. Persondata för forskning

Data för forskning kan produceras genom primär insamling av uppgifter som behövs för att analysera en eller flera frågeställningar. Denna traditionella metod för empirisk forskning är tids- och resurskrävande. Investeringarna upprepas i varje enskilt forskningsprojekt. Om man i större omfattning skulle kunna utnyttja redan insamlade data skulle samhällets forskningsanslag kunna användas på ett mer rationellt sätt. VR har av denna anledning uppmuntrat framtagandet av gemensamma databaser avsedda för fler syften än ett enskilt forskningsprojekt. Sådana initiativ har också på senare år tagits vid flera universitet och högskolor. Ett exempel är den medicinska forskningens satsning på LifeGene (se kapitel 2 ovan).

Den fördel som svenska och nordiska forskare har är dock framförallt möjligheten att dessutom använda material från befolkningsbaserade administrativa register. Projekt som exempelvis baseras på LifeGene är beroende av att kunna komplettera den egna insamlade informationen med data från de administrativa registren och verksamhetsregistren, inklusive biologiska prover från den reguljära hälso- och sjukvården.

Även inom samhällsvetenskapen har framkommit idéer om att skapa större databaser för att följa befolkningen under lång tid i forskning om arbetsmarknad, välfärd och sociala relationer. Ett exempel är den s.k. Stockholm Birth Cohort1 där avsikten är att följa en komplett födelsekohort under lång tid med en kombination av registerdata och primärinsamlat material. I s.k. simuleringsstudier (se avsnitt 6.1.3) används också material från registren.

Persondata som finns i olika slag av register är integritetskänslig information. Det finns därför strikta regler för hur dessa data kan

1 http://www.stockholmbirthcohort.su.se/

göras tillgängliga för forskare. I det följande redovisas gällande regler och rutiner för detta.

4.2. Etikprövning och utlämnandeprövning

De uppgifter som används i registerforskningen är vanligen allmänna handlingar som är skyddade av sekretess eftersom de gäller ”enskilds personliga eller ekonomiska förhållanden” (tryckfrihetsförordningen, TF, 2 kap. 2 § pkt 6). Persondata insamlade för statistikändamål skyddas särskilt av statistiksekretessen, 24 kap. 8 § offentlighets- och sekretesslagen (2009:400), OSL. Persondata om hälsa och sjukdomar betraktas som känsliga personuppgifter som omgärdas av ett förstärkt skydd, 13 § personuppgiftslagen (1998:204), PUL. Rätten att behandla personuppgifter regleras i PUL, där det framgår att forskning är ett legitimt skäl för utlämnande av sådana.

Persondataskyddets konstruktion i lagstiftningen och den process som gäller för att få ut data för forskning har sedan tillkomsten av det nya etikprövningssystemet den 1 januari 2004 i stort sett varit oförändrade. Prövningen sker i två steg:

1. Forskningen ska godkännas av en etikprövningsnämnd i enlighet med lagen om etikprövning av forskning som avser människor (2003:460) och PUL. Etikprövningsnämnden prövar forskningen inklusive hur eventuell ny datainsamling får ske, men den prövar inte utlämnandet av data från existerande register.

2. Av PUL 19 § framgår att data för forskning som godkänts av etikprövningsnämnd ska lämnas ut om inte något annat följer av regler om sekretess och tystnadsplikt, dvs. av OSL. Den som förvarar de personuppgifter som ska användas ska därmed göra en utlämnandeprövning (TF 2 kap 14§). Om data finns hos flera dataförvaltare ska varje registerhållare göra en sådan prövning. Utlämnandeprövningen gäller för av etikprövningsnämnden godkänd forskning. En utlämnandeprövning med föregående etikprövning ska även göras forskare sinsemellan när data vid universitetet används för nya syften

4.3. Ansvar och åtaganden hos nuvarande aktörer

Ansvaret för de olika leden i prövningsprocessen är reglerat i lag. Etikprövningslagen reglerar etikprövningsnämndernas ansvarsområde och deras möjligheter att fatta beslut. För närvarande utesluter reglerna prövning av brett syftande databaser, som betjänar mer än ett smalt forskningsområde. TF anger en skyldighet för den som förvarar data att ta ställning till utlämnandet av data enligt OSL. Det existerande regelverket ger därmed begränsat utrymme för ändrad praxis.

4.3.1. Etikprövningsnämnderna

Vid de regionala etikprövningsnämnderna (EPN) fattas beslut om huruvida forskningens innehåll och sättet för dess genomförande kan godkännas. Godkännande är obligatoriskt för att få använda känsliga personuppgifter. EPN lämnar i allmänhet skriftlig motivering endast till de beslut som innebär avslag. Om beslutet går emot forskaren kan detta överklagas hos den centrala etikprövningsnämnden (CEPN). CEPN utövar tillsyn gällande efterlevnaden av etikprövningslagen och de föreskrifter som meddelas enligt denna lag.

4.3.2. Datainspektionen

Datainspektionen (DI) utövar tillsyn över efterlevnaden av bestämmelserna rörande integritetsskydd för personer, bl.a. i forskningsprojekt och organisationer som har persondata. DI informerar om och har till uppgift att sprida medvetenhet om bestämmelserna för integritetsskydd i allmänhet. DI:s huvudsakliga verksamhet ligger utanför forskningens område. DI har under senare tid i flera tillsynsärenden påpekat att insamling av data för breda, alltför allmänt beskrivna forskningsändamål inte är tillåten och forskare har förelagts att upphöra med verksamheten.

4.3.3. Myndigheter och andra dataförvaltare

Enligt tryckfrihetsförordningen har den som förvarar personuppgifter skyldighet att göra en prövning av om det finns laglig grund för att lämna ut data till annan. Om uppgiften är allmän handling ska den lämnas ut för forskning eller statistik om det inte hindras av den sekretess som beskrivs i 24 kap. OSL. Bl.a. krävs för utlämnande att EPN har godkänt forskningen. Om etikgodkännande finns ska uppgiften lämnas ut om det står klart att varken den enskilde eller någon närstående lider men av det.

Varje dataförvaltare ska göra denna prövning oavsett om denne har samlat in uppgifterna själv eller hämtat dem från annan källa, t.ex. myndighetsregister. Bestämmelsen gäller alltså var och en som har personuppgifter i förvar, också forskare på universiteten med tillgång till uppgifter som andra forskare önskar få tillgång till. Utlämnandet får ske om den avsedda personuppgiftsbehandlingen inte står i strid med det ursprungliga syfte för vilka uppgifterna samlades in.

Några myndigheter och organisationer har byggt upp specialistkompetens och har personal för att hantera denna prövning. Det gäller i första hand de statliga myndigheter som har många beställningar av datauttag för forskning, framförallt SCB och Socialstyrelsen. I de fall resurser för forskarservice saknas innebär det en risk för att dataförvaltarna inte kan fullgöra uppgiften på ett tillräckligt rättssäkert sätt. Det kan antas att detta problem kommer att öka med ökande användning av data från mindre dataförvaltare. De s.k. registercentra som byggts upp i anslutning till kvalitetsregistren är delvis avsedda att åtgärda detta problem. Det behövs en analys av behovet av motsvarande beslutsstöd även för statliga förvaltningsmyndigheter, universitet och högskolor, och inom biobankssystemet.

I VR:s rapport ”Rättsliga förutsättningar för en databasinfrastruktur för forskning” efterfrågas att etikprövningsnämnderna lämnar skriftliga motiveringar till alla sina beslut för att underlätta för de myndigheter som ska göra utlämnandeprövningen2. Flera EPN, liksom CEPN, har dock påpekat att en mer omfattande skriftlig motivering av besluten skulle innebära en avsevärd ökning av nämndernas arbetsbörda.

2 Rättsliga förutsättningar för en databasinfrastruktur för forskning, Vetenskapsrådet Rapportserie 11:2010, s. 99.

VR efterfrågar också bättre information om processerna och samordning mellan myndigheter, samt mellan EPN och myndigheterna:

De utlämnande myndigheterna skulle kunna bli bättre på att samordna sina utlämnanden. Genom att motivera sina beslut skulle etikprövningsnämnderna kunna underlätta för forskarna och de utlämnande myndigheterna. Genom att tydliggöra vilket underlag som krävs från forskarna vid ansökan om prövning vid en etikprövningsnämnd skulle processerna också effektiviseras. /.../ Slutligen skulle det kunna göras större ansträngningar att ha ett kunskapsutbyte mellan företrädare för etikprövningarna och sekretessprövningarna för att förbättra förståelsen för varandras verksamheter .3

4.4. Forskares upplevelser av och kunskaper om tillståndsproceduren

Proceduren innebär att forskaren vid användning av data från flera källor måste vända sig till flera registerhållare med ansökningar.

Forskare har i vissa fall bristfälliga kunskaper om de regler och rutiner som gäller vid utlämnande av data, t.ex. är det inte ovanligt att de inte är medvetna om att processen innebär prövning i flera instanser och enligt olika bestämmelser. Etikprövningen uppfattas ibland felaktigt som överordnad utlämnandeprövningen. Forskare kan också uppfatta att det görs olika bedömningar av likartade ärenden EPN sinsemellan eller att dataförvaltarens bedömning om utlämnande enligt OSL inte överensstämmer med EPN:s beslut. Detta kan leda till upplevelser av godtycke och bristande rättssäkerhet. Det är särskilt vanligt att processen leder till förvirring och frustration om

1. EPN godkänner forskningen medan den myndighet som ska lämna ut data nekar tillgång,

2. två datamyndigheter lämnar olika besked, eller

3. datamyndigheten krävde en större detaljeringsgrad i den informa-

tion som ska lämnas än vad EPN gjorde.

Den procedur som rör godkännandet av forskningen och utlämnandet av data kan därmed bli långvarig och upplevas som svårförutsägbar och krånglig. Forskare som själva är kunniga i gällande lagstiftning och registrens detaljerade innehåll och/eller har stöd

3 Ibid. s. 102.

från det egna universitetet när det gäller detta är gynnade i förhållande till andra. Liksom hos dataförvaltarna behövs här ett mer systematiskt kompetensstöd, som är tillgängligt för alla forskare. Ett sådant stöd skulle kunna reducera tidsåtgången hos både forskare och dataförvaltare med ett effektivare resursutnyttjande till följd. Det kan utformas

1. som utbildningsinsatser/”licensiering” för forskare som ska

använda personuppgifter4

2. som direkt stöd i konkreta ärenden rörande etikprövning och

utlämnandeprövning, t.ex. med att formulera ansökningar.

Inom den tid som stått till förfogande för detta delbetänkande har det inte varit möjligt att systematiskt inhämta information om hur forskare och myndigheter ser på dessa processer. Vissa, även erfarna, forskare har emellertid till mig redovisat vad de ofta uppfattar som ökade svårigheter att från statliga förvaltningsmyndigheter få ut data för forskningsändamål. De upplevda problemen när det gäller registerdata har i huvudsak att göra med:

1. Den ovan beskrivna prövningsproceduren. Forskare upplever ibland att myndigheternas restriktivitet vid utlämnandeprövningen har skärpts. Denna bild delas i regel inte av myndighetsföreträdare.

2. Tidsåtgången från beställning till leverans.

3. Kostnaderna som uppfattas som höga.

4. En upplevelse från forskares sida av bristande förståelse för forskningsprocessen hos EPN-er eller registerhållare, och från myndigheternas sida av bristande kunskaper hos forskare om vilken information som behövs för bedömning och datauttag. Detta kan leda till felaktiga och försenade leveranser.

Därtill kommer de tidigare berörda legala hindren som försvårar för forskare att lägga upp innehållsrika databaser som kan göra det möjligt att belysa nya frågeställningar, söka förklaringar till fenomen på ett induktivt sätt, genomföra mikrosimulering av effekterna av socialpolitiska reformer eller återkommande få ut data för uppföljning.

4 Se exempelvis motsvarande program vid RAND Corp. i USA: https://www.citiprogram.org/Default.asp

Flera av dessa svårigheter kan inom gällande rätt åtgärdas genom ett bättre stöd till forskare och dataförvaltare. För att möta det sistnämnda önskemålet krävs dock sannolikt lagändringar.

Det är angeläget att få till stånd en översikt av gällande bestämmelser med syfte att underlätta registerforskningen i framtiden och möjliggöra att fler datakällor än tidigare kan användas.

5. Information och dokumentation

Den första uppgiften när det gäller forskning som kräver tillgång till persondata är att identifiera vilka uppgifter som behövs för att belysa forskningsproblemet. Därefter måste man inventera vilka uppgifter som finns i tillgängliga databaser och vilka som kräver insamling av nya data. För att kunna göra denna inventering förutsätts att man har information om tillgängliga databaser på såväl övergripande som detaljerad nivå.

Det krävs således en övergripande allmän information om vilka data som finns och vilka de dataförvaltande myndigheterna och organisationerna är. Informationen behöver vara begriplig och lättöverskådlig och samlad på en plats. En generell bild av den nuvarande tillgången på resurser presenteras i detta delbetänkande, men det behövs en aktör som fortlöpande tar ett samlat ansvar för att producera, uppdatera och tillgängliggöra ett metadatasystem anpassat för forskare och andra som vill använda befintliga dataresurser för analyser.

5.1. Krav på dokumentationen

Forskare har ofta krav på detaljerad information om beståndens sammansättning och om den process som har lett fram till de data som finns i register. Detta inkluderar insamlingsmetoder och klassifikationssystem. I många fall är registerhållarens information svåröverskådlig och skiljer sig mellan olika datakällor, vilket leder till behov av personliga konsultationer mellan forskare och registerhållarens personal. Upplysningar som har betydelse för uppgifternas jämförbarhet över tid kan saknas, liksom information om förändringar i klassifikationer. Ibland är den detaljdokumentation som är tillgänglig i första hand avsedd för statistik- eller registerproduktionen och inte för den externa användaren. De statliga och

regionala myndigheterna har inte någon allmän skyldighet att förse forskarna med dokumentation avsedd för forskning.

På uppdrag av utredningen har professor Bo Sundgren, tillika expert i utredningen, analyserat vissa frågor kring dokumentation av officiell statistik i allmänhet.1 I sin rapport anger Sundgren att dokumentationen av officiell statistik borde tillgodose följande behov och krav:

1. Dokumentationen ska möjliggöra och underlätta för potentiella statistikanvändare att, givet en viss frågeställning, a. få en överblick över tillgänglig officiell statistik, som kan vara relevant för frågeställningen; b. mera exakt identifiera och lokalisera den potentiellt relevanta statistiken; c. mera exakt bedöma den potentiellt relevanta statistikens verkliga användbarhet för det tilltänkta ändamålet, med hänsyn till statistikens innehåll (definitioner) och kvalitet i olika avseenden; d. få tillgång till statistiken på ett lämpligt sätt med hänsyn till ändamålet; e. kunna analysera den tillgängliggjorda statistiken och få svar på följdfrågor i sammanhanget.

2. Dokumentationen ska möjliggöra och underlätta för producenter av officiell statistik att exekvera och övervaka produktionsprocesserna som frambringar den officiella statistiken, s.k. produktionsdokumentation.

3. Dokumentationen ska möjliggöra och underlätta för statistikansvariga att fortlöpande initiera och genomföra förbättringar av statistiken med avseende på bl.a. innehåll, kvalitet i olika avseenden samt kostnadseffektivitet.

4. Dokumentationen ska möjliggöra för finansiärer och beställare av officiell statistik att bedöma statistikens och de bakomliggande produktionssystemens effektivitet för avsedda ändamål, med utgångspunkt i bl.a. kostnadsredovisningar, användningsstatistik och kundnöjdhetsrapporter.

5. Dokumentationen ska bidra till såväl specifik som mera generell metodutveckling kring officiell statistik, så att utveckling av ny statistik kan dra nytta av tidigare erfarenheter, och så att t.ex. de

1 Utredning om dokumentation av officiell statistik (november 2011).

svenska och europeiska statistiska systemen kan utvecklas på önskat sätt.

6. Dokumentationen ska vara offentlig och lätt tillgänglig för alla. Eventuella undantag från detta måste vara explicit motiverade utifrån gällande sekretesslagstiftning.

Samtliga dessa kriterier är i princip relevanta för dokumentation av mikrodata för forskning. I tillägg är det angeläget att dokumentationen så långt det är möjligt koordineras mellan de olika datakällorna och registerhållarna. I VR:s rapport 2010:112 identifieras detta som ett nyckelområde för förbättrat samarbete mellan statliga myndigheter och motsvarande behov finns också när det gäller kvalitetsregister, provsamlingar och forskargenererade data.

Dokumentationen av aggregerad statistik är inte sällan otillräcklig för forskningsanvändning. Detta innebär att forskare ofta är beroende av personliga kontakter hos registerhållaren för att kunna genomföra beställningar och forskning. Det kan därför finnas skäl att om möjligt skapa automatiserade och enhetliga dokumentationssystem där användaren kan finna tillräcklig dokumentation på myndigheternas hemsidor utan att behöva konsultera registerexperter.

Behovet av bättre dokumentation har uppmärksammats av SCB som utvecklat dokumentationssystemet MetaPlus. Det huvudsakliga syftet för MetaPlus är att rationalisera registerproduktionen. Systemet används också som dokumentationssystem inom MONA för att öka enhetligheten för externa användare av mikrodata. Variabler listas och beskrivs på ett strukturerat sätt med kopplingar till variablernas värdemängder, objekttyp och population. MetaPlus inkluderar också den s.k. Klassifikationsdatabasen som beskriver olika klassifikationssystem. 92 procent av SCB:s produkter är dokumenterade i MetaPlus.

MetaPlus har erbjudits andra myndigheter som en möjlig gemensam dokumentationsstandard. Socialstyrelsen har prövat systemets användbarhet, men har bedömt att det i vissa avseenden inte är tillräckligt anpassat för myndighetens och de externa användarnas behov.

Jag avser att i slutbetänkandet återkomma till vilka generella krav som bör ställas på dokumentationen och hur detta ska regleras.

2 Rättsliga förutsättningar för en databasinfrastruktur för forskning, Vetenskapsrådet Rapportserie 11:2010.

5.2. Ansvar och åtaganden hos nuvarande aktörer

5.2.1. Statliga förvaltningsmyndigheter

När det gäller den egna verksamheten har myndigheterna var och en skyldighet att informera om frågor som rör respektive verksamhetsområden och att lämna andra myndigheter hjälp enligt förvaltningslagen (1986:223). Skyldigheten att föra förteckningar över vilka data som finns med personuppgifter finns enligt bl.a. PUL. Inte desto mindre saknas komplett sådan dokumentation ofta vid universiteten och högskolorna. I synnerhet saknas dock fullständig sådan dokumentation på övergripande nationell nivå vilken skulle möjliggöra utnyttjande av dessa datakällor utanför den lokala forskningsmiljön.

5.2.2. Svensk Nationell Datatjänst

För samhällsvetenskapliga data finns en dokumentationsmodell framtagen genom ett internationellt samarbete, det s.k. Data Documentation Initiative (DDI). Systemets finns nu i sin tredje version3 och används vid SND för dokumentation av forskardata. DDI initierades genom ett initiativ vid University of Michigan år 1995 inom det s.k. Inter-university Consortium for Political and Social Research (ICPSR). DDI beskrivs på sin hemsida på följande sätt:

The Data Documentation Initiative (DDI) is an effort to create an international standard for describing data from the social, behavioral, and economic sciences. Expressed in XML, the DDI metadata specification now supports the entire research data life cycle. DDI metadata accompanies and enables data conceptualization, collection, processing, distribution, discovery, analysis, repurposing, and archiving.

DDI är således ett dokumentationssystem anpassat för forskargenererade undersökningar inom samhällsvetenskap, beteendevetenskap och ekonomisk vetenskap. Det vidareutvecklas kontinuerligt genom internationellt samarbete. Någon motsvarande dokumentationsstandard för det medicinska området har inte utvecklats, men SND undersöker systemets användbarhet på detta område.

3 DDI3, se www.ddialliance.org

5.2.3. Svenska Biobanksregistret

Det svenska biobanksregistret (SBR) togs i bruk åren 2010/2011. Det är landstingens gemensamma dokumentation över alla sparade biobanksprov tagna inom vården i Sverige. Det innehåller i dag ett stort antal prover (cirka 150 miljoner). SBR är till för att underlätta den administration som den föreslagna biobankslagen4 ger upphov till med avseende på kraven på spårbarhet. SBR är också ett stöd för att hantera medborgarnas samtyckesbeslut, som är registrerade i registret. Detta innebär att en person kan kontakta registret och begära att samtycket raderas och/eller provet förstörs. Det innebär också att forskare kan söka i registret efter prover och/eller personer. Inom forskarnätverket BBMRI är cirka 74 provsamlingar i dag dokumenterade.

5.2.4. Nationella kvalitetsregister

SKL har inom ramen för projektet Nationella Kvalitetsregister5gett en övergripande redovisning av hälso- och sjukvårdens kvalitetsregister. Här finns länkar till dokumentation hos hälso- och sjukvårdshuvudmännen med mer utförlig information om dessa register. Socialstyrelsen har till uppdrag att bistå forskare och andra med en förteckning över kvalitetsregister. Dessa datakällor innehåller dock inte information på variabelnivån för användare utan särskild behörighet.

Hälso- och sjukvårdens kvalitetsregister innehåller varierande dokumentationssystem som skapats av de specialistgrupper som ansvarar för registrens skötsel. Samordningen mellan grupper av register sker genom s.k. kompetenscentra som stödjer registren. De bidrag som staten och SKL gemensamt satsar på utveckling av registren under åren 2012–2016 förväntas bl.a. kunna leda till en ökad samordning av dokumentationen.

Dokumentation av verksamhetsdata i register måste ske som en naturligt integrerad del av verksamheten och motiveras normalt av att informationen används i det dagliga arbetet. Den detaljerade dokumentationen bör ligga nära uppgiftslämnare och registerhållare för att garantera kvalitet och aktualitet.

4 En ny biobankslag. SOU 2010:81. 5 www.kvalitetsregister.se

5.2.5. Överväganden

En övergripande strategi för forskningssamordning syftar till att knyta samman de specialiserade dokumentationssystemen, förteckna dem och åstadkomma samordning mellan olika sektorer. Den första uppgiften bör vara att konstruera en ”metametadatabas” med information om och länkning till de olika metadatasystem som finns eller är under utveckling. Samverkan med dessa olika initiativ är en förutsättning, liksom att bibehålla ett system där forskare kan komma i kontakt med de specialister som befinner sig nära och/eller dagligen handhar registren. När det gäller statliga myndighetsregister och kvalitetsregister bör en komplett förteckning över dessa kunna upprättas. Förteckningen bör på ett övergripande plan beskriva vilka uppgifter som finns hos källorna.

På sikt kan det finnas skäl att utveckla ”supermetadatasystem” eller s.k. wrappers med vilka olika dokumentationsstandarder kan fås att tekniskt samverka med varandra.

Som framgått ovan sker utveckling i dag på flera områden parallellt. Det finns emellertid för närvarande ingen aktör som har ett samlat övergripande ansvar.

6. Hantering av data

6.1. En mer enhetlig struktur för lagring och dataöverföring

De viktiga datakällorna har beskrivits ovan i kapitel 3. De för forskningen nya datakällorna utgörs av biologiska prover, hälso- och sjukvårdens kvalitetsuppföljningsregister och data skapade av forskare. Ingen av dessa datakällor är i och för sig helt ny, men de har i förhållande till potentialen bara utnyttjats i begränsad omfattning för forskning.

Dessa nya datakällor är betydligt mer utspridda än myndighetsregistren. Samordningsproblemet är därför en större utmaning nu är tidigare. Det är mot den bakgrunden man ska se de samordningsinitiativ som har tagits beträffande biobanker, forskargenererade data och hälso- och sjukvårdens kvalitetsregister. Det är angeläget att åstadkomma nationell samordning utan att man förlorar det lokala och regionala engagemanget och inflytandet och de kunskaper som finns hos registrens specialister. Dessa är en viktig drivkraft i den basala insamlingen av prover och data liksom för skötseln av registren och provsamlingarna. En förutsättning för att de ska utnyttjas är således, förutom överblicken om vilka data som finns tillgängliga, att man kan skapa någon form av distribuerat system för datalagring och hämtning av data.1

6.1.1. MONA

I kapitel 1 beskrevs kort MONA-systemet, som är ett centraliserat system för fjärråtkomst av data i SCB:s datorer. MONA har en enhetlig dokumentation (MetaPlus) och data hanteras med moderna relationella databaser. De utgör stommen i det s.k. MONA

1 Se bl.a. Översyn av de nationella kvalitetsregistren, Guldgruvan i hälso- och sjukvården. Förslag till gemensam satsning 2011–2015, Måns Rosén oktober 2010.

datalager från vilket data för forskare lämnas ut via uppkoppling. MONA fungerar väl för många syften, men kompletteras med traditionellt utlämnande där sådant är nödvändigt. Datalagret innehåller endast de registerdata som finns vid SCB. Vid de övriga statistikmyndigheterna finns uppgifter som inte är tillgängliga via MONA. Ibland finns vissa uppgifter vid SCB, medan mer detaljerade uppgifter finns hos den statistikansvariga myndigheten. Ett exempel på detta är de uppgifter om sjuk- och aktivitetsersättning som finns i Försäkringskassans analysdatabas MiDAS.

De viktigaste uppgifterna som helt saknas vid SCB är Socialstyrelsens hälsodata- och socialtjänstregister. Socialstyrelsen framställer egen officiell statistik och anser sig förhindrad att lämna ut data till MONA datalager. Detta har inneburit att framför allt all hälsoforskning fortfarande sker via traditionellt utlämnande. Även mer komplicerad modellanvändning inom t.ex. ekonomisk forskning och simulering, där användning av speciell statistisk metod med tillhörande specialskriven programvara är nödvändig, sker utanför systemet. Det finns exempel på avancerad ekonomisk simulering som inte kunnat genomföras därför att MONAsystemet inte tillhandahållit den nödvändiga programvaran och där utlämning av data utanför MONA-systemet inte kunnat beviljas. Då den tekniska utvecklingen gått framåt borde det nu vara möjligt att komma ifrån denna begränsning genom att utnyttja s.k. virtualiseringsteknik och erbjuda avancerade användare ett helt separat utrymme (en virtuell dator) inom MONA-systemet på vilken de skulle kunna installera valfri programvara.

Den traditionella registerforskningen har genom framför allt SCB:s och Socialstyrelsens tillsammans relativt kompletta innehav av registeruppgifter, samt forskarnas hittills relativt begränsade egna datamaterial, varit tämligen överblickbar.

Persondatahanteringen skulle dock kunna effektiviseras och göras mer säker genom att man inför ett myndighetsövergripande system liknande MONA anpassat till de olika myndigheternas krav, i första hand genom utveckling av Socialstyrelsens datahantering.

6.1.2. Distribuerad lagring och tillgängliggörande av data

Heterogeniteten i de många datakällorna utesluter en centraliserad datahantering där alla data flyttas till samma fysiska miljö. Den komplexa bild som framtidens registerbestånd uppvisar kräver en distribuerad datalösning.

MONA-systemet är en intressant modell som innehåller följande komponenter:

1. inloggning och arbete sker via fjärranslutning istället för att data

skickas till användaren,

2. enhetlig dokumentation är tillgänglig online,

3. data från myndighetens originalregister lagras centralt hos SCB,

4. forskares egna data samt sambearbetade uppgifter lagras centralt

hos SCB.

Punkterna 1 och 2 kan och bör behållas även i framtiden. Men de nya datakällornas omfattning, volymen av den dokumentation som finns, antalet dataförvaltare, datas heterogenitet och behovet av detaljkunskaper gör det i praktiken omöjligt att bygga vidare på ett system där alla uppgifter hanteras på samma ställe eller där all dokumentation finns lagrad tillsammans. Dokumentation på övergripande nivå bör tillhandahållas på en gemensam portal från vilken användaren kan slussas vidare till dataförvaltaren för mer detaljerad information och dokumentation.. När det gäller den tredje punkten bör det övervägas om datalager vid flera dataförvaltare kan kopplas samman utan att data behöver flyttas. Detta gäller också den fjärde punkten där detta är möjligt och önskvärt. I samtliga fall måste systemet dock kompletteras med möjligheten att leverera forskningsdata på annat sätt när teknik, praktik eller regler kräver detta.

Inom VR:s DISC utvecklades åren 2008–2009 en modell för användning av data som innebär ett tekniskt system för att hämta och tillgängliggöra data från olika datakällor (Cross-Organizational Data Infrastructure for Research, CODIR). Systemet innebär att personidentifierade data inte lämnar registerhållaren, att samkörning görs med användning av säkra krypterade nycklar och att resultatet i form av forskningsdatabaser förvaras under begränsad tid i säkra miljöer. Ingen av de registerhållare som levererar data behöver hantera data från andra registerhållare. Forskaren får till-

gång till mikrodata utan personidentifikation och kan analysera dessa i en miljö som liknar dagens MONA-system. Arkivering av forskardata sker genom att programmeringskoden sparas och originalregistren förses med datumstämplar. Samkörda data behöver då inte arkiveras utan kan återproduceras vid behov. Auktoriseringskontrollerna i systemet skräddarsys så att användare kommer åt de delar av systemet de har rätt till. Registerhållaren kan också löpande kontrollera det egna registrets tillgänglighet i systemet.

Ett fungerande men mindre omfattande s.k. federerat system för dataåtkomst finns i bruk i Australien2. Systemet innefattar personuppgifter. Det har för närvarande 26 medlemsorganisationer och data kan hämtas från 18 sjukhus eller hälsocentraler. Ett svenskt system för samordning av data skulle omfatta betydligt större datamängder och ställa större krav på säkerhet. En samordnande aktör behöver definiera en implementeringsplan för en distribuerad datalösning gällande svenska register. Detta innefattar att specificera användarbehov utifrån dataleverantörers och dataanvändares perspektiv. Det inkluderar även att ta ställning till hur ett system successivt kan utvecklas via manuellt samarbete mellan ett fåtal medlemmar, t.ex. SCB och Socialstyrelsen, i riktning mot tekniskt säkra lösningar som betjänar fler aktörer och innefattar en större heterogenitet när det gäller data och dataförvaltare. Ett första steg är att bedöma vilka system som finns tillgängliga och att beställa utvecklingen av ett system där exempelvis SCB:s och Socialstyrelsens data kan kopplas samman. I ett andra steg kan man pröva anslutning av data från biologiska provsamlingar via BBMRI, för att sedan utveckla systemet i riktning mot tekniskt säkra lösningar som innefattar fler datakällor och federationsmedlemmar.

6.1.3. Samordning av resurser och planering av mikrosimulering

I tilläggsdirektiven anges särskilt att bättre och mer tydlig gemensam dokumentation och lagringsformer för mikrosimuleringsdata ska utredas. Mikrosimuleringsmodeller tar registerforskningen vidare genom att det underliggande datamaterialet används för experiment och scenarier. Mikrosimuleringsmodeller har använts i ett stort antal projekt där kort- och långsiktiga effekter av hypotetiska ekonomiska reformer har bedömts med hjälp av myndighet-

2 Biogrid Australia, se http://www.biogrid.org.au/

ernas registerdata. De används också i regeringens planering av den ekonomiska politiken. Som exempel kan nämnas SCB:s modell Fördelningsanalytiskt statistiksystem för inkomster och transfereringar (FASIT)3 som togs fram i samband med utredningen av skattereformen i slutet på 1980-talet och vars användning fortfarande ökar. FASIT används nu inför i stort sett alla regelförändringar i skatte- och transfereringssystemet. Ett annat exempel är populationssimuleringsmodellen SESIM4 som löpande används bl.a. för långsiktiga pensionberäkningar och för att bedöma den framtida befolkningens vårdbehov. Det finns en till stora delar outnyttjad potential för att med mikrosimulering också undersöka långsiktiga effekter av exempelvis hälsopolitiken och inom sociologi för att bedöma samhällsförändringar av annat slag. För att möjliggöra mikrosimulering i forskning och planering av denna typ behövs en miljö där data kan läggas upp och löpande analyseras av kvalificerad personal. Det finns en uppfattning bland användare av modellerna att utvecklingen av dessa, speciellt de senaste åren, har hämmats av en allt besvärligare och otillräcklig miljö och infrastruktur.

Mikrosimulering används direkt i riksdag, regering, myndigheter och intresseorganisationer. Det är därför naturligt att drift och utveckling av FASIT och SESIM läggs på en myndighet med ansvar att samordna registerforskningen.

3 www.scb.se/Pages/List____259365.aspx 4 www.sesim.org

7. Organisatoriska åtgärder

7.1. Grundläggande förutsättningar

Av ovanstående beskrivning och probleminventering framgår att de svenska nationella registren är en potentiellt stor och internationellt unik tillgång för forskningen. Genom att använda de data som finns där, och kombinera dem på ett kreativt sätt, kan viktiga forskningsfrågor besvaras av betydelse för planering, beslut och utveckling av samhället. Det framgår också att det i dag i flera avseenden behöver genomföras nya eller förstärkta insatser för att tillvarata denna ökande potential på bästa sätt. Reglerna för forskningsutnyttjandet av data behöver ses över och anpassas till en snabb teknisk utveckling. Organisatoriska och tekniska stödfunktioner behöver utvecklas för att på ett säkert sätt underlätta samutnyttjandet av data från olika källor.

För att registerbaserad forskning med ett bibehållet och stärkt integritetsskydd ska underlättas måste vissa grundläggande förutsättningar vara för handen: a. att det finns ett starkt integritetsskydd för data som avser

individer, b. att det kan ske en samordnad och enhetlig rättslig bedömning av

ansökningar om att få använda data, c. att forskare har god kännedom om vilka data som finns tillgäng-

liga för forskningsändamål, d. att det finns en samordnad, enhetlig och lättillgänglig dokum-

entation av data, e. att det i ett system där data lagras hos många olika register-

hållare finns teknik som möjliggör uttag och sambearbetning av stora datamängder, f. att forskare kan få stöd vid beställning och uttag av data.

7.2. Vetenskapsrådet roll

År 2004 initierade Vetenskapsrådet (VR) en satsning på registerbaserad forskning. Efter en intern utredning och ett regeringsuppdrag1 beslutade VR:s styrelse att inrätta kommittén Database Infrastructure Committee (DISC) och starta satsningen Swedish Initiative for Research on Microdata in Social and Medical Services (SIMSAM). Styrelsen avsatte betydande belopp ur VR:s medel för att underlätta och stimulera forskning med hjälp av registerdata, också genom att årligen utlysa medel för uppbyggnad av stora forskningsdatabaser, som betjänar flera forskargrupper och som tillgängliggörs på bred basis. DISC fick till uppgift att stimulera uppbyggnaden av en infrastruktur för att underlätta forskningen och SIMSAM att ge bidrag till ett antal forskargrupper inom den befolkningsbaserade registerforskningens område och att driva registerforskningen framåt genom att sprida kunskap till andra.

VR ska enligt sin instruktion ”långsiktigt planera tillgången till infrastruktur för forskning” och ”fördela medel till dyrbar vetenskaplig utrustning, nationella forskningsanläggningar, internationella åtaganden och högpresterande datorsystem”.2 I samband med att VR fick en ny instruktion år 2009 har myndigheten beslutat att dessa uppgifter inte ska inkludera utveckling av och operativt ansvar för infrastruktur. Dessa uppgifter bör enligt VR i första hand åvila enskilda universitet. Dessa kan, i likhet med vad som gäller för vanliga forskningsprojekt, i samband med VR:s utlysningar ansöka om medel för infrastrukturinvesteringar. VR kan också, ibland i samverkan med andra, ge tidsbegränsade uppdrag till enskilda universitet att ansvara för infrastruktur av nationellt intresse. Parterna avtalar då om infrastrukturens uppgifter och finansiering. Inom dataområdet kvarstår dessutom de tidigare nämnda medlen för utveckling av stora forskningsdatabaser.

VR:s styrmedel på infrastrukturområdet består således huvudsakligen av utlysningstexter, bedömning av ansökningar, beslut om anslagstilldelning samt avtal med vissa universitet.

Styrningsmodellen innebär att om VR av strategiska eller andra skäl vill förändra utvecklingsarbetet eller påverka den operativa verksamhetens inriktning i en infrastruktur av nationellt intresse,

1 ”Strategi och infrastruktur för världsledande forskning på svenska register” (ej diarieförd stencil 2005-09-23) respektive ”Om forskningens infrastrukturer inom humaniora och samhällsvetenskap i Sverige” (2005-04-27, VR Dnr 131-2004-8236). 2 Förordning (2009:975) med instruktion för Vetenskapsrådet, 1–2 §§.

så måste ett nytt avtal träffas med värduniversitetet. Normalt sker detta med några års mellanrum efter utvärderingar. VR kan dessemellan inte utöva någon egentlig styrning av verksamheten.

När det gäller registerforskning finns ett antal intressanta sådana nationella infrastrukturer.

  • Svensk Nationell Datatjänst (SND) är en enhet vid Göteborgs universitet som ansvarar för datasamordning och dokumentationsservice för samhällsvetenskap, medicin och humaniora.
  • Swedish National Infrastructure for Computing (SNIC) vid Uppsala universitet samordnar stora och avancerade resurser för lagring och beräkningar vid universiteten.
  • Svensk Nationell Forskningsinfrastruktur för Biobankning och Analys av Biologiska Prover (BBMRI) vid Karolinska Institutet samordnar befolkningsbaserade och patientrelaterade biobanker för forskning.
  • Dessutom finns Swedish University Net (SUNET), som ansvarar för kommunikation genom datanät. SUNET ligger emellertid direkt under VR och avviker därmed från principerna för styrningen av infrastrukturen. Ansvaret för SUNET är inskrivet i VR:s instruktion.

7.3. En samordnande organisation bör vara en myndighet

VR:s beslut att avveckla det operativa ansvar för att stimulera registerforskningen som innehades av DISC innebär att ingen myndighet i dag har detta ansvar. För att den registerbaserade forskningen ska kunna underlättas krävs både samordning mellan statliga myndigheter och andra registerhållare, service till forskare och teknisk utveckling. Det är också viktigt, såsom framhålls i tilläggsdirektiven, att det sker med beaktande av skyddet för enskilda människors integritet. Av dessa skäl bör ansvaret enligt min mening åligga en statlig myndighet.

Förslaget att uppgifterna att underlätta registerforskningen bör ligga på en myndighet har ett starkt stöd bland de myndigheter och experter som jag i enlighet med tilläggsdirektivet har samrått med. Representanter för VR och Göteborgs universitet har i en skrivelse till utredningen föreslagit ett tudelat ansvar mellan Göteborgs

universitet (SND) och en till SCB knuten, självständig myndighet. Jag anser emellertid att det är angeläget att det samlade ansvaret finns hos en myndighet. SND bör i huvudsak ha kvar de uppgifter som enheten har i dag.

Det är väsentligt att de principiellt viktiga beslut som den ansvariga myndigheten fattar förankras hos andra berörda myndigheter och organisationer. För att säkerställa detta föreslår jag att det till myndigheten knyts ett Forskningsdataråd med uppgift att främja användningen av myndigheternas registerdata i forskningen. En jämförelse kan göras med Geodatarådet3, som är knutet till Lantmäteriet. I Forskningsdatarådet bör ingå representanter för de stora dataägarna (SCB, Socialstyrelsen, landstingen genom SKL, m.fl.) och för det nationella forskningsintresset (Vetenskapsrådet, Forskningsrådet för Arbetsliv och Socialvetenskap, universitet, SND, m.fl.).

7.3.1. Vilka myndigheter är tänkbara?

Jag har övervägt om någon befintlig myndighet kan tänkas ges det nationella ansvaret. Endast två myndigheter kan anses ha en så bred ämnesmässig bas att de skulle ha potential att klara uppdraget, nämligen Vetenskapsrådet (VR) och Statistiska centralbyrån (SCB).

VR ska, som jag tidigare redovisat, enligt sin instruktion långsiktigt planera tillgången till infrastruktur för forskning. Utöver ansvaret för SUNET är VR dock inte skyldigt att bedriva operativ verksamhet och dess uttalade policy är att heller inte göra det. På samma sätt som SUNET i instruktionen pekas ut som ett konkret operativt ansvar skulle dock registerforskningen teoretiskt sett kunna vara ett sådant. Fördelen med VR som huvudman för registerforskningen är dess övergripande ansvar på myndighetsnivå för genomförandet av den statliga forskningspolitiken och de erfarenheter som byggts upp under DISC-åren. Den största nackdelen är att ett ökat operativt ansvar strider mot VR:s nuvarande inriktning.

SCB har ett omfattande ansvar för stora register i Sverige och ett samordningsansvar gentemot andra statistikansvariga myndigheter när det gäller den officiella statistiken. SCB åtnjuter också ett högt förtroende hos allmänheten när det gäller hanteringen av personuppgifter. En fördel med SCB som huvudman för registerforskningen är att myndigheten har hög kompetens på flera av de

3 http://www.lantmateriet.se/templates/LMV_Page.aspx?id=13989

områden som är viktiga för att klara de myndighetsuppgifter som det här är fråga om. Om ansvaret läggs på SCB måste det skrivas in i myndighetens instruktion. En nackdel med att lägga uppdraget på SCB är att det i viktiga avseenden skiljer sig från de uppgifter myndigheten i dag har.

Ett tredje alternativ är att bilda en ny myndighet. För att minska de administrativa kostnaderna skulle VR eller SCB i administrativt hänseende kunna fungera som värdmyndighet för den nya myndigheten. Fördelen med detta skulle vara att den nya myndigheten slipper bygga upp egna administrativa resurser. Man skulle också kunna tänka sig att myndigheten i viss mån skulle kunna repliera på i första hand SCB:s tekniska kompetens. Samtidigt kan förväntningar härom skapa ett konkurrensförhållande mellan SCB och den nya myndigheten, t.ex. när det gäller kompetent personal.

Jag har samrått med generaldirektörerna för VR och SCB om dessa lösningar. Bägge är av olika skäl negativa till att deras myndigheter ska få uppdraget om registerforskning, främst därför att uppdraget inte anses vara i linje med myndigheternas nuvarande verksamhet. Jag föreslår mot den bakgrunden att en ny myndighet inrättas för att ansvara för de övergripande registerforskningsfrågorna.

Den nya myndigheten bör få i uppgift att stödja och utveckla samordnad information, dokumentation och data för forskningsanvändning.

Sådan samordning bör huvudsakligen bygga på frivilliga överenskommelser med andra berörda myndigheter, men man kan överväga att ge den nya myndigheten rätt att vid behov föreskriva om vissa regler eller låta SCB i samråd med den nya myndigheten göra det. SCB har redan en sådan föreskriftsrätt.

Det är också angeläget att det i myndighetsinstruktionerna för dagens stora dataägande myndigheter skrivs in att de ska bistå forskningen med data och att de i detta syfte ska samverka med den nya myndigheten.

SND fullgör i dag uppgiften som datalager för avslutade och i vissa fall pågående forskargenererade surveymaterial. Organisationen stödjer surveyforskare med formatering, lagring och arkivering av forskningsmaterial, och dokumenterar dessa i en form som gör dem tillgängliga för andra forskare. SND gjorde under år 2010 365 utlämnanden, varav den dominerande delen (cirka 75 procent) härrörde från de allmänna opinionsundersökningar som genomförs av SOM-institutet (SOM = Samhälle, Opinion,

Medier) vid Göteborgs universitet. SND handhar i första hand avidentifierat material inom samhällsvetenskaperna och i viss mån även surveydata från hälsoområdet.

Jag föreslår att SND behåller denna uppgift och att organisationen dessutom får i uppgift att tillhandahålla en teknisk och administrativ modell för hur forskningsdata bör lagras och arkiveras vid universiteten. SND kan också bistå med fysisk lagring av data som inte tas om hand på annat håll i de fall detta medges med hänsyn till lagstiftningen. Datainspektionen har i beslut den 18 april 20124 förelagt SND och Göteborgs universitet att upphöra med de delar av sin verksamhet som innefattar att iordningställa personuppgifter för allmänna forskningssyften, vilket kan komma att begränsa organisationens möjlighet att erbjuda forskarstöd när det gäller datalagring. I uppgiften bör dock ingå att upprätta ett informationssystem för data och att samverka internationellt med andra samhällsvetenskapliga dataarkiv inom Europa och världen i övrigt.

SND:s verksamhet har flera kopplingar till de uppgifter som den nya myndigheten föreslås få. Det är därför angeläget med samverkan mellan SND och myndigheten, i första hand vad gäller information och dokumentationssystem.

SND fungerar som ett rikstäckande lager vid sidan av Riksarkivet för viktiga forskningsdata, men dess ställning som ett sådant är inte reglerad. Det är därför också angeläget att verksamheten institutionaliseras och ges en långsiktig finansiering. Den nya myndigheten bör därför överta VR:s finansiering av SND.

7.3.2. Myndighetens uppgifter

Ett viktigt syfte med tilläggsuppdraget är att föreslå organisatoriska och tekniska åtgärder som kan underlätta användningen av register i forskningen. Tre övegripande områden där förbättringar behövs har identifierats. Det behövs samordning av:

1. dokumentation och information,

2. den rättsliga prövningen av forskning och datautlämnande, samt

3. den praktiska datahanteringen inklusive samutnyttjandet av data

från olika registerhållare

4 Tillsyn enligt personuppgiftslagen (1998:204) – av Göteborgs universitet (Svensk nationell datatjänst). Dnr 811-2011.

Myndigheten bör därför ges den övergripande uppgiften att ansvara för en databasinfrastruktur för forskning med hjälp av personidentifierade myndighetsdata.

Uppgiften ska genomföras med beaktande och utnyttjande av de initiativ som redan tagits på området och som tidigare har beskrivits. I detta ingår att beakta behovet av att bibehålla en huvudsakligen decentraliserad datastruktur. Vidare ska behovet av att upprätthålla ett starkt integritetsskydd för forskningspersonerna beaktas. Möjligheten att inrymma huvuduppgiften inom gällande rätt diskuteras i kapitel 8.

Den nya myndigheten bör få ett antal uppgifter av vikt för att underlätta registerforskning:

1. Organisation a. Ansvara för kansli och samarbete mellan berörda myndigheter inom ett till myndigheten knutet Forskningsdataråd. b. Ta över ansvaret för finansieringen av SND från VR. c. Ta över ansvaret för finansieringen av MONA, FASIT och SESIM från SCB och Regeringskansliet.

2. Prövningsprocessen a. I samverkan med EPN och registermyndigheterna föreslå åtgärder för att samordna processen vid etikprövning och utlämnande av data för att därmed snabba upp processen. Möjligheterna till en samlad sekretessprövning kan övervägas om myndigheten av regeringen kan ges rätt att förvara forskningsdata. Detta kräver åtminstone delvis ny lagstiftning och ligger i denna del utanför ramen för det nu aktuella uppdraget. b. Vid behov erbjuda kompetensstöd till dataförvaltare vid beslut om utlämnande av data enligt OSL 24 kap. c. Bistå forskare vid ansökningar om att utnyttja registerdata. d. I samverkan med DI och EPN erbjuda utbildning för forskare i etik och lagstiftning vid behandling av personuppgifter.

3. Information och dokumentation a. Informera forskare om möjligheterna med registerforskning, hur man får kunskap om vilka data som finns och vilka krav som ställs för att få tillgång till data.

b. I samverkan med DI informera allmänhet och politiker om

innehållet i och nyttan av registerforskning samt översiktligt beskriva vilken sådan forskning som pågår. c. I samverkan med DI informera allmänhet och politiker om

rättigheter och skyldigheter när personuppgifter används i forskningen samt hur integriteten skyddas. d. Ingå överenskommelser med myndigheter som är dataägare

om enhetliga regler, anpassningar och standarder för dokumentationen av data för att underlätta forskningen. e. Upprätta ett metadatasystem över register och dokumentation

av provsamlingar, dvs. ett register över befintliga register. Systemet kan t.ex. innehålla förteckningar över och länkar till befolkningsregister/officiell statistik, andra register hos myndigheter, forskardatabaser på universitet och hos SND, regionala kvalitetsregister inom hälso- och sjukvården och biobanker (BBMRI). f. Samverka med SND och BBMRI i upprättandet av ett infor-

mationssystem för forskardata.

4. Datahantering a. Från SCB ta över de delar av MONA-systemet som innebär fjärråtkomst till iordningställda forskningsdatabaser. b. Ta över förvaring av MONA forskningsdatabaser samt tillhandahållande av program för analys av data. Eventuellt mot ersättning och på uppdrag från dataförvaltare eller Regeringskansliet tillhandahålla motsvarande service för andra användare än forskare. c. Samverka med Socialstyrelsen i utvecklingen av databashantering och ett system för fjärråtkomst för hälsodataregister. Systemet bör integreras med MONA. d. Samverka med andra myndigheter om anslutning av deras data till ett system för fjärråtkomst. e. Göra en kravspecifikation för ett federerat datasystem, beställa ett sådant, samt driva och administrera det sedan det tagits i drift.

f. Samverka med den nationella kvalitetsregisterorganisationen

och Socialstyrelsen för att underlätta forskningsanvändningen av hälso- och sjukvårdens kvalitetsregister. g. Samverka med BBMRI när det gäller knytningen av bioban-

kernas forskningsdata till registeruppgifter som inte kommer från biobanker i syfte att använda uppgifterna för forskning.

5. Analys a. Ta över drift och utveckling av mikrosimuleringsmodellerna FASIT från SCB och SESIM från Regeringskansliet och erbjuda dessa för forskning m.m., på samma villkor som i dag. b. Erbjuda en miljö för mikrosimulering med hjälp av individdata där forskning inom t.ex. nationalekonomi, sociologi och hälsovetenskap kan bedrivas.

8. Förslagets förutsättningar och konsekvenser

8.1. Vilka åtgärder ryms inom ramen för gällande rätt?

Tilläggsuppdraget innebär att överväga åtgärder som kan genomföras inom ramen för gällande rätt. De viktigaste restriktionerna har här att göra med integritetsskyddets utformning, men även frågor rörande upphovsrätt, offentlighet och arkivering har betydelse. I detta avsnitt behandlas skyddet för den personliga integriteten. VR publicerade år 2010 en rapport som behandlar de rättsliga förutsättningarna för att skapa databasinfrastrukturer för forskning.1 Rapporten går igenom ett flertal lagar och föreskrifter ur ett databasperspektiv, exempelvis personuppgiftslagen (1998:204), PUL, lagen om etikprövning av forskning som avser människor (2003:460) samt offentlighets- och sekretesslagen (2009:400), OSL.

En grundfråga för VR har varit de rättsliga förutsättningarna för att skapa stora generella databaser med personuppgifter som kan användas av flera forskargrupper för olika ändamål. VR konstaterar i rapporten att det med dagens lagstiftning inte är möjligt att på ett resurseffektivt och praktiskt genomförbart sätt skapa sådana generella databaser. Den metod som har valts för att skydda den personliga integriteten står i strid härmed. De krav som framställs i 9 § PUL om ändamålsspecifikation vid uppbyggnaden av databaser får enligt rapporten anses utgöra hinder för att skapa datasamlingar för generella forskningsändamål. Även om personuppgifter ska användas för vetenskapliga ändamål ställs det krav på att behandlingen måste vara särskild, uttrycklig, relevant och nödvändig. Härmed avses enligt förarbetena att ändamålen måste uppges redan när datainsamlingen påbörjas, och dessa får inte heller vara

1 Rättsliga förutsättningar för en databasinfrastruktur för forskning. Vetenskapsrådets rapportserie 11:2010.

alltför allmänt beskrivna. Denna tolkning bekräftas också av de av DI nyligen fattade besluten som tidigare har refererats. För att ändra dessa villkor krävs ny lagstiftning vilket ligger utanför ramen för det nu aktuella utredningsuppdraget. Behovet av en översyn med denna inriktning framhålls i 2008 års forskningsproposition (prop. 2008/09:50, s. 190 f.). Regeringen har också aviserat att en särskild utredning ska tillsättas för att se över denna problematik (se kapitel 1).

I Sverige finns emellertid också de befolkningsbaserade registren som har byggts upp för administrativa och statistiska ändamål. Som framgått ger dessa Sverige en i hög grad internationell särställning och de har under den senaste femtioårsperioden i ökad omfattning kommit att utnyttjas av forskningen.

Utlämnandet av data för forskningsändamål är för förvaltningsmyndigheterna en uppgift vid sidan av de ordinarie myndighetsuppgifterna. SCB har en central roll i det svenska statistiksystemet som statistikansvarig myndighet, statistikproducent och med ett samordnande ansvar för alla statistikansvariga myndigheter. Den praktiska organisationen av utlämnandet av data för forskning har därför ofta varit överskådlig. Den har kunnat skötas antingen genom direkt kontakt mellan forskare och SCB eller genom att i första hand SCB och Socialstyrelsen samarbetat för att stödja forskare. Data har samkörts och levererats till forskare som har lagt upp dem i sin lokala miljö. När det har funnits behov av att kombinera data, som forskare själva samlat in, med myndighetsdata, har detta skett genom att forskardata skickats in till myndigheterna varefter registeruppgifterna påförts, data avidentifierats och skickats tillbaka till forskaren.

Samkörning av data för forskningsändamål kan således göras helt i enlighet med gällande rätt. Även en infrastruktur för effektivare samordning, delning och överföring av data bör kunna skapas inom denna ram. Det är också möjligt att stödja forskare och registerhållare i den tillämpning av rättsreglerna som personuppgiftsbehandlingen innebär genom att skapa gemensamma stödfunktioner. Jag bedömer att en utveckling av tekniska system för gemensam fjärråtkomst av data är möjlig inom gällande rätt så länge inte systemet medger direktåtkomst till myndighetens sekretessskyddade information.2 Det existerande MONA-systemet har underlättat åtkomsten av data från SCB, och motsvarande system bör såsom jag har föreslagit införas också vid vissa andra

2 Se t.ex. E-delegationens rapport Direktåtkomst och utlämnande på medium för automatiserad behandling.

myndigheter, i första hand Socialstyrelsen. Lagring av data utanför myndigheterna har tillåtits när det gäller data iordningställda för forskningsändamål. Det kan behövas ett förtydligande av regelverket när det gäller den nya myndighetens rätt att fullgöra denna service gentemot forskarsamhället.

Det är möjligt att inom gällande rätt åstadkomma frivilliga överenskommelser mellan de stora registerhållarna om att verka för myndighetsövergripande system och att utveckla beslutsstöd, utbildning och handledning av forskare. Syftet med ett Forskningsdataråd är att stimulera en sådan samverkan. Att iordningställa system så att de passar för forskning ligger normalt inte inom de dataförvaltande myndigheternas informationsplikt och/eller åtagande att iordningställa allmänna handlingar för utlämnande. Den nya myndigheten bör därför ha möjlighet att genom ekonomiska bidrag träffa överenskommelser med dataförvaltande myndigheter om anpassningen av dessas data i syfte att underlätta utvecklingen av en myndighetsgemensam infrastruktur.

Jag har föreslagit att den nya myndigheten ges den generella uppgiften att ansvara för en databasinfrastruktur för forskning. Att iordningställa de data som förvaras vid den nya myndigheten på motsvarande sätt som MONA vid SCB eller i särskilt iordningställda analysdatabaser liknande LISA vid SCB eller MiDAS vid Försäkringskassan bör vara möjligt inom gällande rätt.

Det lagliga hinder som kan föreligga gäller myndighetens rätt att få ut data från andra myndigheter. Enligt 6 kap. 5 § OSL, som har företräde före förvaltningslagens allmänna bestämmelser om stöd mellan myndigheter, ska en myndighet på begäran av en annan myndighet lämna uppgifter som den förfogar över i den mån hinder inte möter på grund av sekretessbestämmelse eller av hänsyn till arbetets behöriga gång. De uppgifter det är fråga om här är oftast skyddade av sekretess. Det behöver därför utredas om det behövs en ändring av bestämmelserna för att lämna ut personuppgifter till den nya myndigheten i syfte att samordna hanteringen av forskningsdata. I förekommande fall behöver man ta ställning till vilka ändringar som skulle krävas för att möjliggöra detta.

Jag noterar att regeringen i pressmeddelande den 26 april 2012 meddelat att man uppdragit åt en utredare att föreslå åtgärder för förenklat uppgiftslämnande för företagen och därvid ta ställning till vissa frågor som angränsar till detta. Uppdraget gäller att föreslå hur ett effektivt informationsutbyte mellan myndigheter faktiskt och tekniskt kan utformas, samt att analysera sekretessfrågor och

integritetsfrågor som uppkommer i samband med förslagen och föreslå de författningsändringar som bedöms nödvändiga.

8.2. Integritetsskyddet – avvägningar och konsekvenser

När individdata används i forskningen är det av central betydelse att den individuella integriteten kan skyddas på ett effektivt sätt.

Skyddet av personuppgifter grundläggs i internationella konventioner. Europakonventionens artikel 8 om skydd för privalivet har ratificerats av Sverige och införlivats i regeringsformen (2 kap. 19 §). Europarådet har också antagit den europeiska konventionen om skydd för enskilda vid automatisk databehandling av personuppgifter (CETS 108), den s.k. dataskyddskonventionen, till vilken Sverige anslutit sig. Inom EU regleras persondataskyddet i första hand genom det europeiska dataskyddsdirektivet (Direktiv 95/46/EG), som i Sverige implementerats genom personuppgiftslagen (1998:204), PUL. I Sverige regleras sekretesskyddet för personuppgifter också genom tryckfrihetsförordningens (1949:105), TF, föreskrifter om allmänna handlingar. Insamlingen av personuppgifter regleras av ett stort antal lagar och förordningar.3 Användningen av personuppgifter i forskning regleras i första hand av personuppgiftslagen, etikprövningslagen (2003:460) och offentlighets- och sekretesslagen (2009:400).

Såväl de europeiska som de svenska reglerna är för närvarande under översyn. Den 25 januari 2012 publicerades ett förslag från EU-kommissionen om att ersätta 1995 års dataskyddsdirektiv med en för medlemsländerna direkt gällande förordning (”regulation”). De motiv som framförs för detta är

1. att anpassa dataskyddsregleringen till den snabba utveckling

som har skett av Internetbaserat informationsutbyte.

2. att förstärka enhetligheten i integritetsskyddets utformning

mellan EU:s medlemsländer.

3. att förstärka individens kontroll över information om den egna

personen.

3 Se Informationshanteringsutredningens direktiv, Ju 2011:11.

Ett förslag till en ny biobankslag som reglerar forskningens användning av biologiska prover föreligger också4. Hela det komplex av rättsregler som reglerar registren ses över inom den nyligen tillsatta Informationshanteringsutredningen5.

Uppgifterna för den nya myndighet jag föreslår utgår från såväl dagens principer för integritetsskyddet som de förändringar som nu föreslås. Det innebär bl.a. ett fortsatt starkt inflytande för EPN, som kan lämna tillstånd till forskning utan att direkt kontakt krävs med de personer från vilka data används. Detta system är en förutsättning för registerforskning där många tusen personer kan ingå i undersökningspopulationen.

Ett stärkt integritetsskydd är påkallat på grund av de tekniska möjligheter som numera finns för informationsöverföring. Den föreslagna nya myndigheten och utveckling av gemensamma system för dataöverföring ger möjligheter att kontrollera hur uppgifter om den enskilde sprids. Likaledes innebär ett sådant system ett minskat behov av att duplicera uppgifter, vilket ytterligare stärker integritetsskyddet. Det överensstämmer med de ambitioner som ligger bakom SCB:s MONA-system. Samtidigt som systemet kan innebära en effektivare överföring av data erbjuder det en potential för utveckling av säkrare lagring, auktorisering och dataöverföring.

8.3. Organisatoriska konsekvenser

Förslaget innebär att myndigheten bör ta över organisatoriskt ansvar för

1. hela eller delar av MONA och mikrosimuleringssystemet FASIT

från SCB,

2. Svensk Nationell Datatjänst från Göteborgs universitet, samt

3. mikrosimuleringsmodellen SESIM från Regeringskansliet.

I övrigt förutsätts förslaget inte leda till några förändringar av de arbetsuppgifter som i dag utförs av dessa organ.

4SOU 2010:81. 5 Ju 2011:11.

8.4. Ekonomiska konsekvenser

Vissa av de verksamheter som den nya myndigheten föreslås få ansvar för finansieras i dag av SCB, Regeringskansliet, Göteborgs universitet och VR. Detta ekonomiska ansvar föreslås bli överfört till den nya myndigheten.

Utöver detta tillkommer kostnader för ny personal vid myndigheten, Forskningsdatarådet, utveckling av forskningsanpassade system vid datamyndigheterna, information till forskare och allmänhet samt för att utveckla en federerad datastruktur.

Staten, SKL och VR har satsat betydande resurser på utveckling av hälso- och sjukvårdens kvalitetsregister och på samordning av forskningsanvändningen av biologiska prover. Det förutsätts att dessa satsningar kan inrymma kostnaderna för samordning med andra system och några ytterligare resurser för detta har därför inte tagits upp i nedanstående kostnadskalkyl.

För SND:s del uppgick 2011 års kostnader till cirka 13 miljoner kronor. Enligt gällande överenskommelse mellan VR och Göteborgs universitet finansierade VR 8 miljoner kronor och Göteborgs universitet resterande del, dvs. cirka 5 miljoner kronor. Den framtida verksamheten är för närvarande föremål för förhandling mellan parterna. Den beräknade kostnadsnivån för innevarande år är enligt SND:s årsredovisning cirka 18 miljoner kronor. I ovanstående kalkyl har detta belopp upptagits.

Ökningen av MONA-posten från för närvarande cirka 14 miljoner kronor till 25 miljoner kronor motiveras av att hälsodata förut-

sätts bli inlemmade i systemet med en kraftig ökning av antalet användare som följd, samt övrigt utvecklingsarbete i systemet.

Annan forskarservice avser den service till forskare som i dag finansieras av forskarna själva genom avgifter till SCB och andra registerhållare. Faktureringen från SCB kan för innevarande år uppskattas till cirka 7 miljoner kronor och från övriga myndigheter till cirka 3 miljoner kronor. I syfte att stimulera registerforskningen finns skäl att anslagsfinansiera denna service. Det finns skäl att i det läget räkna med att efterfrågan på servicen kommer att öka.

Den ökade kostnaden för mikrosimulering motiveras av att myndigheten utöver att överta kostnader för det existerande systemet inom FASIT och SESIM också bör ha utrymme för en ökad användning och utveckling av modellerna i forskningen.

De helt nya kostnadsposterna består av driften av den nya myndighetens kansli och ny specialistkompetent personal inom juridik och teknisk utveckling, stöd till Forskningsdatarådets verksamhet samt informationsinsatser.

Dessutom har en initial kostnad för utvecklingen av ett federerat system för data tagits upp. Denna kostnad kan antas öka när det blir dags att investera i teknik och implementera systemet. Sammanlagt uppskattas den initiala årskostnaden för myndigheten till cirka 98 miljoner kronor, varav cirka 51 miljoner kronor motsvaras av kostnadsposter i dag hos berörda myndigheter. Kostnadsökningen för den föreslagna satsningen att underlätta registerbaserad forskning kan således initialt uppskattas till knappt 50 miljoner kronor.

Kommittédirektiv

Översyn av Statistiska centralbyrån och statistiksystemet

Dir. 2011:32

Beslut vid regeringssammanträde den 31 mars 2011

Sammanfattning

En särskild utredare ska se över Statistiska centralbyrån (SCB) och systemet för den officiella statistiken och analysera för- och nackdelar med ett centraliserat respektive decentraliserat statistiksystem. Utredaren ska särskilt granska statistik-kvaliteten och tillgängligheten till statistiken, inbegripet prissättning och dokumentation.

I utredarens uppdrag ingår också att analysera vad det innebär för den samlade statistikproduktionen att statliga myndigheter som regel inte bör sälja varor och tjänster på marknaden. Det gäller dels konsekvenserna för SCB och systemet för den officiella statistiken, dels effekterna på de marknader där myndigheterna är verksamma. Utredaren ska dessutom analysera konsekvenserna för SCB av lagen (2010:566) om vidareutnyttjande av handlingar från den offentliga förvaltningen.

Med utgångspunkt i den genomförda översynen och analysen ska utredaren föreslå bl.a.

  • hur kvaliteten i den officiella statistiken ska säkerställas och tillgängligheten förbättras,
  • hur systemet för den officiella statistiken ska utformas,
  • vilka mål, uppgifter, resurser och prioriteringar som ska gälla för SCB,
  • vilka författningsändringar som behövs till följd av förslagen.

Utredaren ska redovisa uppdraget senast den 10 december 2012.

Det svenska statistiksystemet och det europeiska

SCB firade 2009 150 år som statlig myndighet. Verksamheten dominerades till en början av befolkningsstatistik. Efter hand tillkom jordbruksstatistik, kommunal finansstatistik, sparbanksstatistik och fattigvårdsstatistik. I början av 1960-talet påbörjades en centralisering av den statliga statistiken till SCB och några år senare etablerades verksamhet i Örebro.

Det är 20 år sedan det genomfördes en heltäckande statistikutredning som resulterade i att ansvaret och motsvarande medel för delar av den officiella statistiken överfördes från SCB till andra statliga myndigheter.

Mer avgränsade utredningar har dock genomförts därefter. Statistikreformen utvärderades 1999 (SOU 1999:96). Författningarna på statistikens område sågs över samma år (Ds 1999:75). En översyn av den ekonomiska statistiken genomfördes 2002 (SOU 2002:118). En fördjupad prövning av inriktning och omfattning av officiell statistik inom SCB:s ansvarsområde gjordes 2002. En arbetsgrupp tillsatt av Finansdepartementet granskade 2003 SCB:s underlag för fördjupad prövning.

Det svenska statistiksystemet är decentraliserat sedan statistikreformen i början av 1990-talet (prop. 1992/93:101, bet. 1991/93:FiU7, rskr. 1992/93:122, prop. 1993/94:100, bil. 8, bet. 1993/94:FiU15, rskr. 1993/94:269). Det innebär att SCB ansvarar för sektorsövergripande statistik såsom arbetsmarknadsstatistik, befolkningsstatistik, ekonomisk statistik, välfärdsstatistik och viss utbildningsstatistik medan 25 sektorsansvariga myndigheter ansvarar för den officiella statistiken inom sina områden. Därtill kommer att Riksbanken ansvarar för betalningsbalansstatistik och finansmarknadsstatistik.

SCB ansvarar också för att samordna och stödja det svenska systemet för officiell statistik, exempelvis nomenklaturarbete, nationell statistiksamordning, internationellt statistiksamarbete, information och statistikservice samt vissa centrala databaser.

SCB ansvarar vidare för långsiktiga prognoser och analyser om befolkningsutveckling, utbildning och arbetsmarknad.

Utvärderingen av statistikreformen visade att verksamheten med den officiella statistiken efter reformen i huvudsak fungerat bra, men att samordningen av och överblicken över statistiksystemet försämrats.

Det europeiska statistiksystemet är ett partnerskap mellan Europeiska unionens statistikkontor (Eurostat), de nationella statistikbyråerna och andra nationella statistikproducerande myndigheter för utveckling, framställning och spridning av europeisk statistik. Medlemsstaterna samlar in, bearbetar och överlämnar uppgifterna till Eurostat som sammanställer statistiken för EUändamål. Den europeiska statistiken styrs av femårsprogram där huvudområden och mål fastställs. Det nuvarande programmet omfattar perioden 2008–2012. Femårsprogrammen kompletteras med detaljerade årliga program.

Det svenska statistikregelverket och EU-rätten

Statistiken regleras av såväl svenska författningar som EU-rätt. I lagen (2001:99) om den officiella statistiken finns bestämmelser om officiell statistik och viss annan statistik som tas fram hos en statistikansvarig myndighet.

Personuppgiftslagen (1998:204) gäller vid framställning av statistik i den mån det inte finns avvikande bestämmelser i lagen och i förordningen (2001:100) om den officiella statistiken. I personuppgiftslagen finns det bl.a. bestämmelser om skydd mot kränkning av en enskilds personliga integritet genom behandling av personuppgifter.

I lagen om den officiella statistiken sägs att officiell statistik ska finnas för allmän information, utredningsverksamhet och forskning. Vidare anges vilka uppgifter som näringsidkare, kommuner, stiftelser m.fl. är skyldiga att lämna för den officiella statistiken. I 5 § anges att den officiella statistiken ska framställas och offentliggöras med beaktande av behovet av skydd för fysiska och juridiska personers intressen. Enligt 6 § gäller att uppgifter i den officiella statistiken inte får sammanföras med andra uppgifter i syfte att ta reda på en enskilds identitet. I 19 § finns vidare bestämmelser om gallring och arkivering.

I förordningen om den officiella statistiken anges vad som är officiell statistik och vilka myndigheter som ansvarar för den.

I offentlighets- och sekretesslagen (2009:400), förkortad OSL, finns det bestämmelser om statistiksekretess. I 24 kap. 8 § anges att sekretess gäller i sådan särskild verksamhet hos en myndighet som avser framställning av statistik för uppgift som avser en enskilds

personliga eller ekonomiska förhållanden och som kan hänföras till den enskilde.

I Europaparlamentets och rådets förordning (EG) nr 223/2009 om europeisk statistik, finns det bestämmelser om utveckling, framställning och spridning av europeisk statistik. Här finns också bestämmelser om statistisk konfidentialitet.

Därutöver finns det ett stort antal EU-författningar som reglerar definitioner, tidsramar, frekvenser, överföring av uppgifter till Eurostat m.m. för framställning av bl.a. ekonomisk statistik, jordbruksstatistik, företagsstatistik, befolkningsstatistik och välfärdsstatistik.

Efter en uppmaning av rådet 2004 har de nationella statistikinstituten tagit fram en uppförandekod för europeisk statistik. Uppförandekoden är ett instrument för självreglering med normer för oberoende, integritet och ansvar och omfattar medlemsstaternas statistikmyndigheter och Eurostat. Europeiska rådgivande organet för statistikstyrning rapporterar årligen till Europaparlamentet och rådet om hur medlemsstaterna och Eurostat följer koden. Mot bakgrund av revisionen av statistiska data i Grekland hösten 2009 har Ekofinrådet föreslagit att uppförandekoden stärks genom att vissa minimistandarder införs i en rättsakt.

Uppdraget att se över Statistiska centralbyrån och statistiksystemet

Kvaliteten i den officiella statistiken måste säkerställas

Att säkerställa god kvalitet i den officiella statistiken är grundläggande för att skapa tillförlitlighet och trovärdighet i statistiken. Det gäller alla myndigheter som ansvarar för och producerar officiell statistik. SCB ansvarar för en stor del av den officiella statistiken och är den dominerande statistikproducenten.

Ett övergripande mål för SCB är att producera statistik av god kvalitet. För det krävs, förutom att säkerställa kvaliteten i själva produktionsprocessen, tillgång till data och god kvalitet i indata, dvs. god kvalitet i det statistiska materialet. Urvalsstorleken i de statistiska undersökningarna är en viktig faktor för att kunna uppnå god kvalitet i indata. Det ska dock vägas mot målet om minskad börda för uppgiftslämnare. I detta sammanhang bör också nämnas

att svarsfrekvensen i de statistiska undersökningarna generellt försämras sakta, såväl i Sverige som internationellt.

Under 2008 och 2009 upptäcktes flera allvarliga kvalitetsbrister i statistikprodukter som är centrala för den ekonomiska politiken.

Riksrevisionen redovisade i februari 2010 en revisions-rapport, som ett led i den årliga revisionen av SCB (Revisionsrapport 2010-02-18: Granskning av IT-miljön för statistikproduktion av KPI och NR samt processen för intern styrning och kontroll). Riksrevisionen granskade IT-miljön för statistikproduktion av konsumentprisindex (KPI) och nationalräkenskaper (NR) samt förberedelserna för att kunna följa förordningen (2007:603) om intern styrning och kontroll. Riksrevisionen har tidigare under 2008 vid två tillfällen skriftligen framfört iakttagelser om brister i SCB:s interna styrning och kontroll för framtagandet av KPI. Enligt Riksrevisionen visar granskningen på stora brister i ledning, styrning och uppföljning av statistikproduktionens IT-miljö för KPI och NR. Även om granskningen i första hand har avsett ITmiljöerna för produktion av KPI och NR, hade Riksrevisionen anledning att förmoda att liknande brister finns i IT-miljöer för andra statistikprodukter.

Regeringen uppdrog den 25 mars 2010 åt SCB att löpande informera regeringen dels om myndighetens pågående arbete med att säkerställa kvaliteten i statistikproduktionen, särskilt i statistikproduktionens IT-miljö, dels om åtgärder för att säkerställa den interna styrningen och kontrollen.

Det är nödvändigt att säkerställa kvaliteten i statistikproduktionen så att trovärdigheten till den officiella statistiken inte urholkas. Mot den bakgrunden behöver det göras en bedömning av statistikkvaliteten vid SCB och andra myndigheter som producerar officiell statistik.

Förbättringar av den interna styrningen och kontrollen vid dessa myndigheter kan vara ett led i att öka statistikens kvalitet. I detta sammanhang bör det även göras en avvägning mellan krav på hög kvalitet och hur snabbt statistiken måste tillgängliggöras. Internationella jämförande studier kan ge lärdomar av framgångsrik kvalitetssäkring och goda exempel i omvärlden.

Kvalitetskraven i lagen om den officiella statistiken är allmänt beskrivna. Enligt 3 § ska statistiken vara objektiv och allmänt tillgänglig. Förordningen om europeisk statistik har en betydligt mer utförlig beskrivning av statistikens kvalitet. I artikel 12 i nämnda förordning beskrivs sju kvalitetskriterier: relevans, noggrannhet,

aktualitet, punktlighet, tillgänglighet och tydlighet, jämförbarhet samt samstämmighet. Det bör övervägas om kvalitetskraven i lagen om den officiella statistiken bör preciseras och hur kraven ska följas upp.

Tillgängligheten till den officiella statistiken måste förbättras

Att förbättra tillgängligheten till den officiella statistiken är en utmaning för alla myndigheter som ansvarar för och producerar officiell statistik.

Statistiken kan anses vara tillgänglig om man kan hitta och få tillgång till statistiken, inom rimlig tid, utan avgift eller till rimlig kostnad, enkelt kan tolka statistiken samt använda den för egna bearbetningar och analyser. Förbättrad tillgänglighet till statistiken var en av hörnstenarna i statistikreformen. Tillgängligheten har sedan reformen förbättrats avsevärt på flera områden. Bland annat är Sveriges statistiska databaser numera avgiftsfritt tillgängliga genom SCB:s webbplats. Tillgängligheten måste dock förbättras ytterligare.

Förbättrad tillgänglighet borde kunna leda till ökade möjligheter att tillgodose statistikanvändarnas behov av uppföljning inom olika politikområden. Det bör exempelvis analyseras i vilken mån det är möjligt att tillgodose nya behov av aktuell och mer detaljerad statistik inom välfärdspolitiken och miljöpolitiken. Förbättrad tillgänglighet innebär också att man bör försöka underlätta forskningens behov av att kunna bedriva registerbaserad forskning på ett mer effektivt sätt än i dag.

Strategiskt viktiga områden för förbättrad tillgänglighet är dokumentation, prissättning och statistiksekretess. Andra områden är säker teknik och bra presentation.

Sammanfattningsvis bör utredarens förslag till förbättrad tillgänglighet till den officiella statistiken ha som mål att göra det lätt att söka och komma åt all officiell statistik, att underlätta även för icke-specialister att tolka och använda officiell statistik, att göra det möjligt för kvalificerade statistikanvändare, inte minst forskare vid universitet och högskolor, att använda den officiella statistikens datamaterial på egen hand, att förbättra dokumentationen, att förenkla och förtydliga statistiksekretessen (även när det är fråga om annan statistik än officiell statistik), att inte inskränka tillgängligheten mer än nödvändigt för att säkra statistiksekretessen

samt att ge tillgång till den officiella statistiken genom bastjänster i kombination med valfria tilläggstjänster. Ett system för tillsyn av tillgängligheten bör övervägas.

Dokumentation

God dokumentation är grundläggande för att förbättra tillgängligheten. För att kunna söka efter statistik måste statistikanvändarna få en överblick över vilken statistik som finns tillgänglig och vad den omfattar. För att kunna tolka statistiken behövs ytterligare kunskap. För mer djupgående analyser krävs det dessutom kunskap om de underliggande datamaterialen och processerna.

Vissa hävdar att enbart statistikproducenten har tillräcklig kunskap för att rätt kunna tolka och analysera statistiken. Andra hävdar motsatsen, att statistiken ska vara så väl dokumenterad att i stort sett vem som helst kan använda den på egen hand. Det är en prioriterad uppgift för SCB och andra statistikansvariga myndigheter att, inom ramen för befintliga anslagsmedel, genomföra fullständiga dokumentationer och kvalitets-deklarationer. Mot den bakgrunden behöver det utredas hur dokumentationen av statistiken kan förbättras.

Prissättning

Rationell, transparent och enhetlig prissättning är ett annat strategiskt område för att förbättra tillgängligheten.

Officiell statistik är ett bra exempel på en kollektiv nyttighet. Kostnaden för att producera den officiella statistiken är praktiskt taget densamma, oavsett hur många som konsumerar den. När den väl producerats för någon konsument är marginalkostnaden för att ställa den till ytterligare konsumenters förfogande allt mindre, ibland nära noll. Det är rationellt att finansiera officiell statistik genom anslagsmedel. Det är dock inte optimalt att låta den i alla delar vara helt avgiftsfri.

De flesta kostnaderna för att producera och tillgängliggöra en viss statistikprodukt är helt oberoende av hur många som använder statistikprodukten. Det gäller t.ex. kostnaderna för att konstruera ett produktionssystem, samla in, granska och rätta data, genomföra bearbetningar och att konstruera ett system för tillgängliggörande.

Det finns dock vissa kostnader som ökar med antalet användare. Det gäller t.ex. kostnader för att ge betydligt fler användare tillgång till en databas med given servicenivå, skräddarsy särskilda varianter av statistikprodukten för vissa användare, eller utföra vidarebearbetningar och analyser av statistiken för en viss användare.

Det ekonomiska målet för statlig avgiftsfinansierad verksamhet är, om inget annat mål beslutats, full kostnadstäckning enligt 5 § avgiftsförordningen (1992:191). Förordningen gäller för alla myndigheter under regeringen. En myndighet får bara ta betalt för sina tjänster om det finns ett uttryckligt stöd för det. För SCB:s del finns det sådant stöd i 24 § förordningen (2007:762) med instruktion för Statistiska centralbyrån. Enligt SCB:s regleringsbrev gäller att myndigheten själv bestämmer avgifternas storlek och att inkomsterna disponeras av myndigheten. Enligt 7 § avgiftsförordningen ska avgifterna beslutas efter samråd med Ekonomistyrningsverket (ESV).

Riksrevisionen granskade 2004 SCB:s uppdragsverksamhet (RiR 2004:8). Riksrevisionens övergripande slutsatser är att förutsättningarna för insyn i SCB:s uppdragsverksamhet är begränsade. Mot bakgrund av Riksrevisionens rapport beslutade regeringen att skärpa återrapporteringskraven för den avgiftsfinansierade verksamheten i regleringsbrevet från och med budgetåret 2005.

ESV har i en skrivelse till SCB i oktober 2008 rekommenderat att SCB överväger en ny prissättningsmodell.

Beställare av statistik har under lång tid kritiserat SCB:s prissättning. Kritiken gäller bl.a. höga priser och bristande transparens i prissättningen.

För- och nackdelar med olika prissättningsmodeller bör belysas utifrån kostnads- och tillgänglighetsperspektiv. De ekonomiska konsekvenserna av olika alternativ bör tydliggöras. Det bör övervägas att införa ett undantag från det ekonomiska målet om full kostnadstäckning i avgiftsförordningen när det gäller officiell statistik. Marginalkostnadsprissättning för officiell statistik skulle kunna innebära att de fasta kostnaderna för att producera och tillgängliggöra en basversion av den officiella statistiken och bakomliggande datamaterial, inklusive kostnaderna för nödvändig infrastruktur, ska vara helt anslagsfinansierade och inte till någon del debiteras statistikanvändaren. De rörliga kostnaderna för att tillgängliggöra och vidareförädla basmaterialen (mikrodata, makrodata och metadata) som ingår i den officiella statistiken skulle kunna debiteras användarna genom avgifter. Det bör också analyseras om

marginalkostnadsprissättning riskerar att komma i konflikt med konkurrenslagstiftningen. De ekonomiska konsekvenserna av marginalkostnadsprissättning ska belysas.

Statistiksekretess

Statistiksekretessen är av central betydelse för statistikens trovärdighet. Syftet med statistiksekretessen är att säkerställa förutsättningarna för statistikansvariga myndigheter att skydda uppgiftslämnare och därigenom kunna framställa statistik av god kvalitet. Om uppgiftslämnarna misstänker att de uppgifter som lämnas för statistik kan komma att spridas eller användas för andra ändamål än de som uppgifterna samlades in för, finns det risk att uppgiftslämnarna lämnar felaktiga uppgifter, snedvridna svar eller helt avstår från att lämna uppgifter.

Den svenska lagstiftningen och EU-lagstiftningen ger ett mycket gott skydd för uppgiftslämnarna. Regleringen kring statistiksekretessen är dock komplex och svårtillgänglig. Ett förvirrande förhållande är att ordet statistik betyder en sak i offentlighets- och sekretesslagen och annan i vardagligt språkbruk. Som nämnts tidigare gäller enligt 24 kap. 8 § första stycket första meningen OSL absolut sekretess i sådan särskild verksamhet hos en myndighet som gäller framställning av statistik för uppgift som avser en enskilds personliga eller ekonomiska förhållanden och som kan hänföras till den enskilde. Denna bestämmelse omfattar endast en viss form av statistik, nämligen allmänt utredande statistik utan anknytning till något särskilt ärende, dvs. framför allt officiell statistik. Sådan statistik som en myndighet framställer för att använda som underlag för t.ex. ett beslut i ett ärende hos myndigheten benämns i OSL "annan jämförbar undersökning". Med undantag för undersökningar som utförs av Riksrevisionen eller riksdagsförvaltningen, omfattas sådana undersökningar av statistiksekretess endast om regeringen föreskriver om det (24 kap. 8 § första stycket andra meningen OSL). Regeringen har med stöd av denna bestämmelse meddelat föreskrifter om sekretess i 7 § offentlighets- och sekretessförordningen (2009:619), förkortad OSF.

Konsekvensen av denna reglering är bl.a. att en undersökning som SCB utför på uppdrag av t.ex. en statlig utredning eller en annan statlig myndighet ska anses utgöra "statistik" i den mening som avses i OSL, medan samma undersökning skulle ha betecknats

"annan jämförbar undersökning" om den hade utförts av utredningen själv. Vidare försenas ofta statliga utredningar och statliga myndigheter med utredande uppgifter, t.ex. Statskontoret, i sitt utredningsarbete, eftersom de uppgifter om enskildas personliga eller ekonomiska förhållanden som de avser att begära in i syfte att framställa statistik inte kan skyddas av sekretess förrän regeringen har gjort en ändring i 7 § OSF.

Mot denna bakgrund bör 24 kap. 8 § OSL ses över. Ordet statistik bör ta sikte på metoden och inte ges en begränsad innebörd beroende på i vilket sammanhang statistiken framställs. Eventuella begränsningar av bestämmelsens tillämpningsområde bör göras på annat sätt än genom att använda olika ord för samma arbetsmetod. Det bör också övervägas om inte det behov av sekretess som andra myndigheter än statistikansvariga myndigheter samt Riksrevisionen och riksdagsförvaltningen har för sådana uppgifter om enskildas personliga och ekonomiska förhållanden som begärs in för framställning av statistik, bör tillgodoses genom en sekretessbestämmelse direkt i OSL. Detta skulle kunna vara bättre än att en ändring ska behöva göras i OSF varje gång en myndighet behöver utföra en statistisk undersökning. I detta sammanhang bör även den sekretessbrytande regeln i 24 kap. 8 § första stycket tredje meningen OSL ses över. Enligt den bestämmelsen kan uppgifter som omfattas av s.k. statistiksekretess endast lämnas ut i avidentifierad form när det är fråga om utlämnande för andra ändamål än forsknings- och statistikändamål (i den begränsade betydelsen ordet statistik har enligt OSL). Vid en översyn av bestämmelsen i övrigt kan den sekretessbrytande regeln behöva omformuleras för att få samma sakliga innebörd som i dag. Vid översynen bör även beaktas att statistik används vid olika typer av verksamhetsuppföljningar. Vid sådana uppföljningar torde den sekretess som gäller i den aktuella verksamheten vara tillräcklig för de uppgifter som hämtats från verksamheten. Om utredaren föreslår en utvidgning av bestämmelsens tillämpningsområde till att omfatta utförande av statistikundersökningar och statistikverksamhet hos alla myndigheter bör därför utredaren överväga om statistik som framställs i samband med verksamhetsuppföljningar redan har ett tillräckligt sekretesskydd och därför bör undantas från bestämmelsens tillämpningsområde.

Den officiella statistiken behöver avgränsas och preciseras

Definitionen av officiell statistik i lagen om den officiella statistiken är mycket omfångsrik. Enligt lagen ska officiell statistik finnas för allmän information, utredningsverksamhet och forskning. Statistikförordningen specificerar den officiella statistiken i 22 ämnesområden som i sin tur är indelade i statistikområden. Även dessa ämnesområden är relativt allmänt hållna. Förordningen anger också vilken myndighet som är ansvarig för respektive statistikområde. Statistikansvariga myndigheter beslutar om statistikens innehåll och omfattning inom sitt statistikområde.

Det offentliga åtagandet på statistikområdet bör definieras. Det bör övervägas att avgränsa den officiella statistiken och tydligare än i dag fastställa vilka samhällsområden som ska beskrivas med hjälp av officiell statistik. Ett skäl för detta är att det årligen framförs omfattande krav och önskemål på ny och förbättrad inhemsk statistik samtidigt som EU utvidgar lagstiftningen inom statistikområdet. Ett annat skäl för omprioriteringar är att det fortfarande finns brister inom centrala statistikområden. Vidare bör det övervägas om det finns skäl till att förändra regelverket så, att officiell statistik inte enbart är traditionella summerade sammanställningar utan också observationsregister och redovisningar på lägre aggregeringsnivåer som ligger till grund för sådana summeringar. Statistiksekretessen måste naturligtvis beaktas i detta sammanhang.

Uppgiftsskyldigheten behöver förtydligas

Uppgiftsskyldigheten är en viktig del av statistiklagstiftningen. Uppgiftsskyldigheten beslutas normalt inte på EU-nivå utan faller enligt den s.k. subsidiaritetsprincipen på den nationella lagstiftningen. Skälet till att uppgiftsskyldigheten finns i lagen om den officiella statistiken är att regeringsformens bestämmelser kräver reglering i lag för att en uppgiftsplikt ska konstitueras (8 kap. 3 §). Det krävs också att den är preciserad till sitt innehåll. Den måste vara så exakt att den som blir uppgiftsskyldig ska kunna bedöma dess innehåll och omfattning.

Uppgiftsskyldigheten i lagen om den officiella statistiken gäller näringsidkare, kommuner och olika organisationer. Enskilda personer i egenskap av privatpersoner omfattas inte av uppgiftsskyldigheten här. Det enda fall på statistikområdet där privatpersoner varit

skyldiga att lämna uppgifter är då folk- och bostadsräkningar genomförts. Sista gången en sådan genomfördes var 1990.

Enligt 7 § lagen om den officiella statistiken ska näringsidkare lämna uppgifter om

1. namn och person- eller organisationsnummer för den som

bedriver verksamheten,

2. produktion av varor och tillhandahållande av tjänster,

3. förbrukning av varor och anlitande av tjänster,

4. antalet anställda, deras sysselsättning, löner och yrken samt

vakanser,

5. lagerhållning,

6. investeringar,

7. beställningar, köp, försäljningar och leveranser av varor och

tjänster,

8. priser för varor och tjänster,

9. intäkter och kostnader, 10. import och export, 11. energiåtgång, 12. tillgångar och skulder, 13. sparande samt kapital-, kredit- och valutaförhållanden, 14. omfattning av upplåtelse och nyttjanderätt, 15. miljöskyddskostnader.

Kommuner och landsting ska lämna uppgifter motsvarande de som begärs från näringsidkare enligt punkterna 1-7 ovan. Kommuner ska för detta ändamål dessutom lämna uppgifter från de årliga boksluten.

De föreskrifter som meddelas för de statistiska undersökningarna av respektive myndighet tas i regel in i myndighetens egen författningssamling. Innehållet i föreskrifterna är normalt först och främst en uppräkning av vilka uppgifter som ska lämnas. Detta görs vanligtvis genom att frågeformuläret läggs med som en bilaga till föreskrifterna.

Uppgiftsskyldigheten i lagen om den officiella statistiken ska ses över. Utredaren ska analysera om förteckningen över de uppgifter som näringsidkare och andra är skyldiga att lämna för den officiella statistiken är ändamålsenlig när det gäller avvägningen mellan behovet av uppgifter för den officiella statistiken och målsättningen att minska bördan för uppgiftslämnarna. I detta sammanhang ska behovet av och förutsättningarna för att samla in och

behandla ekonomiska uppgifter för den officiella statistiken från kommuner och landsting analyseras. I detta sammanhang bör uppgiftsskyldigheten för kommuner, kommunalförbund och landsting ses över. Förslaget om ett samlat system för automatiserad datafångst av uppgifter till grund för kommunstatistiken, från 2008 års översyn av kommunalstatistik (SOU 2009:25), bör analyseras. Det bör också analyseras om det förekommer fall där en myndighet å ena sidan behöver framställa statistik för att uppfylla EU-rättsliga förpliktelser och å andra sidan inte har något eget behov av eller någon rätt att begära in uppgifterna för att framställa officiell statistik och inte kan få tillgång till uppgifterna på annat sätt. Om så är fallet bör det övervägas att införa en lagstadgad skyldighet för juridiska personer att lämna uppgifter i sådana situationer.

Statistiksystemet behöver ses över

Statistiksystemet har under 1960-talet gått från att vara ett decentraliserat system till ett centraliserat system för att på 1990talet återgå till att vara ett decentraliserat system.

Argument för en centraliserad statistikorganisation har varit knappa resurser och svårdelbara resurser, t.ex. datorkraft och metodkompetens. Andra argument har varit stordriftsfördelar, professionalism, samordning, standardisering, statistiksekretess och EUmedlemskap.

Argument för en decentraliserad statistikorganisation har varit bättre anpassning av statistiken till användarnas behov och en mer optimal prioritering genom att statistiken vägs mot andra behov inom ett sakområde i stället för, mot annan statistik. Andra argument har varit ökade inslag av konkurrens till förmån för nytänkande och effektivitet.

Mot denna bakgrund ska för- och nackdelar med ett centraliserat respektive decentraliserat statistiksystem analyseras.

Målkonflikterna behöver hanteras

SCB har tre olika roller i det statistiska systemet: en ansvarsroll, en produktionsroll och en förvaltningsroll. SCB har ansvar för den sektorsövergripande officiella statistiken, dvs. stora delar av den officiella statistiken. När det gäller statistikproduktion har SCB en

än mer dominerande ställning. SCB producerar dels den officiella statistik som myndigheten ansvarar för, dels merparten av den officiella statistik som andra statistikansvariga myndigheter ansvarar för. Förvaltningsuppgifterna innebär samordning och stöd samt uppgifter i övrigt som är gemensamma för statistiksystemet. SCB:s olika roller i det statistiska systemet kan innebära målkonflikter, exempelvis när SCB ska samordna myndigheterna i systemet och samtidigt producera officiell statistik på uppdrag av samma myndigheter. Mot denna bakgrund behöver det utredas hur de beskrivna målkonflikterna ska hanteras.

EU-samarbetet bör få större genomslag i det svenska statistiksystemet

EU-samarbetet på statistikområdet skiljer sig från annat internationellt statistiksamarbete såtillvida att det ytterst handlar om beredning av förslag till tvingande lagstiftning. Lagstiftningen har till syfte att harmonisera statistiken för att möjliggöra jämförelser mellan medlemsländerna. Dessa producerar statistiken medan Eurostat sammanställer och publicerar den gemensamma statistiken. Regelverket är omfattande och består av ca 320 rättsakter, varav ca 40 procent reglerar ekonomisk statistik och jordbruksstatistik. Genom utvidgningen av EU:s politik har harmoniseringen av statistiken utvidgats till nästan alla politikområden. Utvecklingsarbetet inom många statistikområden sker i dag i stor utsträckning snarare inom Eurostats ca 160 arbetsgrupper, där medlemsländerna är representerade, än på nationell nivå.

Europeiska kommissionen presenterade i augusti 2009 ett meddelande till Europaparlamentet och rådet om produktionsmetoden för EU-statistik: en vision för det kommande årtiondet (KOM (2009) 404). Syftet med en förändrad produktionsmetod är att åstadkomma effektivitetsvinster och minska uppgiftslämnarbördan.

Till följd av revisionen av statistiska data i Grekland hösten 2009 beslutade rådet sommaren 2010 skärpningar av förordningen med avseende på kvaliteten på statistiken i samband med alltför stora underskott, se rådets förordning (EG) nr 679/2010 om ändring av förordning (EG) nr 479/2009 med avseende på kvaliteten på statistiken i samband med förfarandet vid alltför stora underskott. Ekofinrådet har därefter föreslagit att uppförandekoden för europeisk statistik ska stärkas.

Händelserna i Grekland visar på nödvändigheten av god kvalitet i EU-statistiken och nära samarbete mellan Eurostat och de nationella statistikmyndigheterna.

Vidare har harmoniseringen av ekonomisk statistik stor betydelse för finansieringen av EU-budgeten. Merparten av EUbudgeten finansieras genom nationella bidrag baserade framför allt på BNI-statistik, vilket ytterligare understryker vikten av EUsamarbetet på statistikområdet. SCB har här en central roll.

Mot denna bakgrund bör det övervägas om EU-medlemskapet bör få ett ännu större genomslag i det svenska statistiksystemet i allmänhet och i SCB:s verksamhet, prioriteringar och arbetsformer i synnerhet.

Myndigheters säljverksamheter inom statistikområdet behöver analyseras

Förvaltningskommittén (SOU 2008:118) föreslog att det införs en huvudregel som innebär att statliga myndigheter inte får sälja varor och tjänster på en konkurrensutsatt marknad eller en potentiell konkurrensutsatt marknad. Regeringen har i propositionen Offentlig förvaltning för demokrati, delaktighet och tillväxt (prop. 2009/10:175, bet. 2009/10:FiU38, rskr. 2009/10:315) gjort bedömningen att statliga myndigheter som regel inte bör sälja varor och tjänster på marknaden. Mot denna bakgrund behöver det analyseras hur beslutet om myndigheters säljverksamheter påverkar statistikområdet.

Konsekvenserna av lagen om vidareutnyttjande av handlingar från den offentliga förvaltningen behöver utredas

Genom Europaparlamentets och rådets direktiv 2003/98/EG om vidareutnyttjande av information från den offentliga sektorn (PSIdirektivet) har regler införts för att skapa ökade förutsättningar för informationsmarknaden inom EU och ge allmänheten och näringslivet bättre möjligheter att utnyttja och kommersiellt använda den information som finns inom den offentliga sektorn.

Genom lagen (2010:566) om vidareutnyttjande av handlingar från den offentliga förvaltningen (PSI-lagen) genomförs PSI-

direktivet i svensk rätt (prop. 2009/10:175, bet. 2009/10:FiU38, rskr. 2009/10:315). Lagen trädde i kraft den 1 juli 2010.

SCB kan beröras av lagen på flera sätt. Inom ramen för sina offentliga uppgifter tillhandahåller myndigheten information såväl fritt som mot avgift. Myndigheten bedriver också affärsverksamhet som innefattar vidareutnyttjande av de egna informationsresurserna. Mot den bakgrunden behöver det utredas vilka konsekvenser den nya lagen får för myndighetens verksamhet.

Sammanfattning av uppdraget

Utredaren ska se över SCB och systemet för den officiella statistiken och i detta sammanhang analysera för- och nackdelar med ett centraliserat respektive decentraliserat statistiksystem. Utredaren ska särskilt granska statistikkvaliteten och tillgängligheten till statistiken, inbegripet dokumentation, prissättning och statistiksekretess.

I utredarens uppdrag ingår också att analysera vad det innebär för den samlade statistikproduktionen att statliga myndigheter som regel inte bör sälja varor och tjänster på marknaden. Det gäller dels konsekvenserna för SCB och systemet för den officiella statistiken, dels effekterna på de marknader där myndigheterna är verksamma. Utredaren ska också analysera konsekvenserna för SCB av PSIlagen.

Med utgångspunkt i den genomförda översynen och analysen ska utredaren föreslå

  • åtgärder som säkerställer kvaliteten i den officiella statistiken inklusive förslag till förbättringar av den interna styrningen och kontrollen,
  • åtgärder som minskar uppgiftslämnarnas kostnader,
  • åtgärder som förbättrar tillgängligheten till statistiken inklusive ett system för tillsyn av tillgängligheten,
  • åtgärder som förbättrar dokumentationen av statistiken,
  • en prissättningsmodell, för- och nackdelar och ekonomiska konsekvenser av denna modell samt andra tänkbara modeller,
  • de ändringar som behövs i lagen om den officiella statistiken särskilt när det gäller dels det offentliga åtagandet på statistikområdet, dels avgränsning och precisering av begreppet officiell statistik och dels uppgiftsskyldigheten,
  • hur systemet för den officiella statistiken ska utformas,
  • de ändringar som behövs i förordningen om den officiella statistiken särskilt när det gäller vad som är officiell statistik och vilka myndigheter som ansvarar för den,
  • mål, uppgifter, resurser och prioriteringar för SCB,
  • effektiviseringar i SCB:s verksamhet,
  • hur målkonflikterna inom SCB ska hanteras,
  • en ny förordning med instruktion för SCB,
  • hur EU-medlemskapet ska få ett ännu större genomslag i det svenska statistiksystemet i allmänhet och i SCB:s verksamhet, prioriteringar och arbetsformer i synnerhet,
  • ändringar i svenska författningar till följd av Europaparlamentets och rådets förordning om europeisk statistik,
  • hur uppförandekoden för europeisk statistik kan införlivas i det nationella statistikregelverket,
  • hur beslutet om myndigheters säljverksamheter ska tillämpas på statistikområdet,
  • eventuella förändringar för SCB till följd av PSI-lagen,
  • hur SCB:s samverkan med universitet och högskolor och andra myndigheter kan stärkas så att kompetensen vid myndigheten säkerställs,
  • eventuella övriga författningsändringar som bedöms nödvändiga till följd av förslagen.

Utredaren ska också analysera och lämna förslag på hur sekretesskyddet för personuppgifter som begärts in i samband med såväl statistikansvariga som andra myndigheters framställning av statistik bör regleras. Här ingår att överväga om inte det behov av sekretess som andra myndigheter än statistikansvariga myndigheter har bör tillgodoses genom en sekretessbestämmelse direkt i OSL i stället för att en ändring ska behöva göras i OSF varje gång en myndighet behöver utföra en statistisk undersökning.

Konsekvensbeskrivningar

Förslagens konsekvenser ska redovisas enligt 14–15a §§ kommittéförordningen (1998:1474). Utredaren ska belysa de ekonomiska konsekvenserna och lämna förslag till finansiering. Utredaren ska även bedöma och redovisa förslagens konsekvenser av betydelse för miljön.

Uppdragets genomförande

Utredaren ska bedriva arbetet i kontakt med statistikanvändare, statistikansvariga myndigheter, Riksbanken, berörda utredningar och Näringslivets regelnämnd.

Utredaren ska hålla berörda centrala arbetstagarorganisationer informerade om arbetet och ge dem tillfälle att framföra synpunkter.

Utredaren ska redovisa uppdraget senast den 10 december 2012.

(Finansdepartementet)

Kommittédirektiv

Tilläggsdirektiv till Statistikutredningen 2012 (Fi 2011:05)

Dir. 2012:15

Beslut vid regeringssammanträde den 8 mars 2012

Utvidgning av uppdraget

Regeringen beslutade den 31 mars 2011 kommittédirektiv om en översyn av Statistiska centralbyrån (SCB) och systemet för den officiella statistiken (dir. 2011:32) för att analysera för- och nackdelar med ett centraliserat respektive decentraliserat statistiksystem. Utredaren ska särskilt granska statistikkvaliteten och tillgängligheten till statistiken, inbegripet prissättning och dokumentation.

Regeringen ger nu utredaren i uppdrag att också föreslå organisatoriska och tekniska åtgärder som kan underlätta registerbaserad forskning. Vid utformningen av förslagen ska utredaren väga behovet av att förbättra förutsättningarna för registerbaserad forskning mot behovet av skydd för individens personliga integritet.

Uppdraget ska fortfarande redovisas senast den 10 december 2012. Ett delbetänkande med förslag på organisatoriska och tekniska åtgärder för registerbaserad forskning ska dock redovisas senast den 1 maj 2012.

Uppdraget att föreslå åtgärder som kan underlätta registerbaserad forskning

Det finns i dag en mängd olika register i Sverige som skulle kunna utnyttjas på ett mer effektivt och samordnat sätt för att fullt ut ta till vara deras potential för att ta fram ny kunskap. Många av dessa register innehåller personuppgifter, dvs. information som direkt eller indirekt kan hänföras till en fysisk person som är i livet.

Personuppgifter som bevaras på detta sätt är på många sätt unika och spårbara under lång tid, vilket gör dem till en viktig källa för forskning. I propositionen Ett lyft för forskning och innovation (prop. 2008/09:50) framhöll regeringen att den svenska registerhållningen över hela befolkningen och systemet med personnummer ger unika förutsättningar för att studera angelägna, tvärvetenskapliga frågor kring sambanden mellan samhällsförhållanden, ekonomi och hälsa och att dessa registerbaserade data i dagsläget är underutnyttjade.

Forskning som baseras på register som innehåller personuppgifter måste följa den lagstiftning som finns för behandling av personuppgifter. De mest grundläggande lagarna är personuppgiftslagen (1998:204), offentlighets- och sekretesslagen (2009:400) och lagen (2003:460) om etikprövning av forskning som avser människor (etikprövningslagen).

Den nuvarande författningsregleringen av register och deras användning för forskning är mycket omfattande, vilket gör den svåröverskådlig. Det finns t.ex. omkring 200 registerförfattningar som innehåller särreglering av vissa register. Det finns även ett antal andra strukturella aspekter som försvårar forskares möjligheter att få tillgång till och överblick över uppgifter i register. För att det ska vara möjligt att sambearbeta register och göra statistiska analyser måste t.ex. registren struktureras så att det är möjligt att sambearbeta dem. Det underlättar om struktur, termer och begrepp samt dokumentation av olika register blir mer enhetliga.

Ökad tillgänglighet till myndigheters registeruppgifter för forskningsändamål

I de ursprungliga direktiven anges att utredaren ska föreslå åtgärder som förbättrar tillgängligheten till statistiken. Enligt direktiven innebär förbättrad tillgänglighet bl.a. att underlätta forskningens behov av att kunna bedriva registerbaserad forskning på ett mer effektivt sätt än i dag. För att underlätta sådan forskning, även när det gäller annat material än sådant som ingår i den officiella statistiken, behöver förutsättningarna för forskningens behov särskilt analyseras och tillgängligheten till registeruppgifter hos alla registerförande myndigheter ökas. Det finns ett behov av samverkan mellan registerhållande myndigheter och av att förbättra

möjligheterna till forskning med bibehållet eller stärkt integritetsskydd för den enskilde.

Det saknas i dag en infrastruktur som gör att mikrodata hos olika myndigheter kan användas på ett effektivt sätt. Det finns inte heller någon myndighet som har ansvaret för att driva frågorna om hur man ska kunna underlätta användningen av registeruppgifter för forskningsändamål.

Utredaren ska därför

  • identifiera vilka de viktigaste datakällorna för forskning är och vilka centrala och regionala myndigheter som ansvarar för dessa,
  • särskilt analysera och beskriva vilka hinder som finns för tillgänglighet till myndigheters registeruppgifter för forskningsändamål,
  • föreslå åtgärder inom ramen för gällande rätt för att öka tillgängligheten till myndigheters registeruppgifter för forskningsändamål och underlätta för registeransvariga myndigheter att lämna ut uppgifter för forskning,
  • föreslå åtgärder för att införa en mer enhetlig och tydlig struktur för dokumentation av innehållet i myndigheters register som kan användas i forskning och för uppgifternas lagringsform hos registeransvariga myndigheter, däribland mikrosimuleringsmodeller,
  • föreslå organisatoriska och tekniska åtgärder som kan underlätta skapandet av register och användningen av registeruppgifter för forskningsändamål, och
  • vid utformningen av förslagen väga behovet av att förbättra förutsättningarna för registerbaserad forskning mot behovet av skydd för individens personliga integritet, samt redovisa vilka avvägningar som gjorts.

Konsekvensbeskrivningar

Utredaren ska redovisa konsekvenserna av sina förslag när det gäller eventuella ekonomiska följder för registeransvariga myndigheter, universitet och högskolor samt andra berörda myndigheter och organisationer där forskningen utförs. Utredaren ska även redovisa förslagens konsekvenser när det gäller skyddet för enskilda människors integritet.

Samråd och redovisning av tilläggsuppdraget

Utredaren ska, förutom med SCB, samråda med Vetenskapsrådet, Socialstyrelsen, Centrala etikprövnings-nämnden, de regionala etikprövningsnämnderna, Datainspektionen samt andra berörda myndigheter. Vidare ska utredaren samråda med Sveriges Kommuner och Landsting samt kommittéer och utredare som arbetar med register- och statistikfrågor eller andra närliggande frågeställningar. Utredaren bör uppmärksamma Socialstyrelsens uppdrag om nationellt samordningsansvar för en ändamålsenlig och strukturerad dokumentation i hälso- och sjukvården och socialtjänsten samt Socialstyrelsens uppdrag att inrätta och utveckla en registerservice för forskare som vill använda nationella kvalitetsregister.

Utredaren ska särskilt samråda med Informationshanteringsutredningen (JU 2011:11) och Utredningen om förbättrad tillgång till personuppgifter inom och mellan hälso- och sjukvården och socialtjänsten (S 2011:13).

Utredaren ska redovisa uppdraget om organisatoriska och tekniska åtgärder för registerbaseradforskning i ett del-betänkande senast den 1 maj 2012.

(Finansdepartementet)

Under denna rubrik redovisas enligt tilläggsdirektivet några för forskningen intressanta befolkningsbaserade register med personuppgifter vid de statliga förvaltningsmyndigheterna. Det bör noteras att med undantag för Socialstyrelsen förvaras och tillhandahålls många av myndigheternas register helt eller delvis vid SCB, vilket noteras för respektive sakmyndighet i tabellen. Se också Bilaga 4 rörande MONA datalager som beskriver fjärråtkomst till register för forskning.

Följande text finns på BBMRI.se:

BBMRI.se och Nationellt biobanksråd (NBR) samarbetar kring att etablera ett register innehållande övergripande information om forskningsprovsamlingar i Sverige och Norden. Syftet med registret är att synliggöra information om forskningsprovsamlingar (ospecifika eller för specifika forskningsprojekt) som förvaras i biobanker och som teoretiskt sett skulle kunna bli tillgängliga i samarbetsprojekt. Att registrera sin forskningsprovsamling innebär inte att man förbinder sig att tillgängliggöra prov och/eller information. Det är endast ett tillfälle att synliggöra provsamlingen för forskare inom Sverige.

För mer information om studierna, besök BBBMRI.se. Nedan redovisas en förteckning av de provsamlingar som finns beskrivna på BBMRI.SE i april 2012.

Denna tabell omfattar den förteckning över de nationella kvalitetsregistren som finns på SKL:s webbplats i april 2012. De är 99 stycken. (Källa: www.skl.se)