Skip to main content

Hantering av forskningsdata: Att dela och arkivera data

Att återanvända data

Att kunna återanvända och dra nytta av redan befintliga dataset är ett skäl för att öppna och dela data. Forskningsdata är värdefulla resurser som ofta kräver mycket tid och resurser för att skapa. Det är därför värt att överväga att återanvända befintliga forskningsdata som tidigare studier har genererat och som finns offentligt arkiverat. Men att återanvända data handlar inte bara om att spara tid och resurser. Det ger också ökade möjligheter till att upprepa/reproducera och verifiera data, vilket i sin tur ökar forskningens tillförlitlighet.

En optimal användning och återanvändning av arkiverade data blir möjlig endast när tillgänglighet och återanvändbarhet av forskningsdata har säkerställts. Då forskningsdata hanteras korrekt och öppet publicerade data förses med lämpliga licenser underlättas och möjliggörs delad användning. I samband med forskningsdata hänvisas ofta till FAIR-principen, en akronym som kommer från  orden Findable, Accessible, Interoperable och Reusable. Forskningsdata som publiceras enligt FAIR-principerna innebär alltså att data ska vara möliga att hitta, komma åt, flytta eller kombinera och återanvända, något som gör data verkligen öppna och återanvändbara. FAIR-principerna ger vägledning om hur du gör dina data verkligen öppna och återanvändbara, se Principer för FAIR data i rutan nedan. Se även Att öppna data (rutan till höger) om hur du öppnar och publicerar dina data.

Tjänster för att söka efter dataset:

Vid återanvändning av data bör goda rutiner för att citera forkningsdata följas. Att publicera forskningsdata kan skapa flera möjligheter för forskare till meritering t.ex. via citeringar eller registrerade nedladdningar. Det blir på så sätt möjligt att få erkännande för flera bidrag till forskningsprocessen än enbart den publicerade artikeln. Läs mera om att återanvända forskningsdata (OpenAIRE)

Principer för FAIR data

FAIR-principen beskriver centrala riktlinjer för god datahantering och öppen tillgång till forskningsdata. FAIR är en akronym som kommer från  orden Findable, Accessible, Interoperable och Reusable. Forskningsdata som publiceras enligt FAIR-principerna innebär alltså att data ska vara möliga att hitta, komma åt, flytta eller kombinera och återanvända. FAIR-principerna har antagits av flera forskningsfinansiärer (inkl. EU), förlag och dataarkiv.

För att forskningsdata ska vara sökbara (Findable) krävs att:

  • (meta)data förses med en unik och beständig identifierare
  • data beskrivs med utförliga och maskinläsbara metadata (defined by R1 below)
  • metdata innehåller identifieraren till de data som beskrivs
  • (meta)data registreras och indexeras i en sökbar webbtjänst

För att forskningsdata ska vara tillgängliga (Accessible) krävs att:

  • (meta)data kan nås via sin beständiga identifierare och kan läsas av och ges tillgång till via ett standardiserat kommunikationsprotokoll (som http eller ftp)
  • kommunikationsprotokollet är öppet, kostnadsfritt och universellt implementerbart
  • det är möjligt att skapa olika användarroller och mekanismer för verifiering av användare och kontroll av åtkomst till data. Tillgången till forskningsdata bör vara så öppen som möjligt och så begränsad som nödvändigt, om data är känsliga.
  • metadata är tillgängliga även om data inte längre är tillgängligt
För att forskningsdatat ska vara interoperabla (Interoperable) krävs att:
  • (meta)data redovisas med semantiska beskrivningar som är standardiserade, dokumenterade och tillgängliga
  • vokabulärer, terminologier och ontologier som används för att beskriva (meta)data är vedertagna, kontrollerade och beskrivna på ett tillgängligt sätt
  • relationer mellan olika data och metadata beskrivs så att det är möjligt att förstå hur data hör samman /ett sätt som möjliggör att sammanhang kan förstås.
 För att forskningsdata ska vara återanvändbara (Reusable) krävs att:
  • meta(data) innehåller olika slag av kontextuella beskrivningar/Uppgifter som gör  det möjligt att förstå och avgöra om data lämpar sig för syftet med återanvändningen //som till exempel vetenskapligt syfte, i vilket sammanhang data samlades in samt vilken utrustning och programvara som användes
  • villkor för hur data får användas anges på ett tydligt sätt
  • (meta)datas ursprung (proviniens) beskrivs i detalj
  • (meta)dataata är strukturerade och dokumenterade enligt tillämpliga standarder och vedertagna format - kolla

Läs mera:

Att öppna data

Öppen forskningsdata ökar synligheten och genomslaget för forskning, skapar nya forskningsmöjligheter och underlättar tvärvetenskapligt samarbete. Öppna data gör det också lättare att kontrollera kvaliteten på forskningsdata, vilket ökar forskningens transparens och tillförlitlighet. Genom öppenhet demokratiseras och stärks forskningen.

Att publicera forskningsdata kan skapa flera möjligheter för forskare till meritering t.ex. via citeringar eller registrerade nedladdningar. Det blir på så sätt möjligt att få erkännande för flera delar av forskningsprocessen än enbart den publicerade artikeln.

Forskningsdata och publicerade forskningsresultat producerade på Hanken borde publiceras öppet och göras allmänt tillgängliga. Det ska vara möjligt att hitta och referera till datat. Vid återanvändning av data gäller normal referenspraxis.

Tänk på följande frågor när du du funderar på att publicera data öppet.

1. Vilken del av data kan öppnas och publiceras?

  • Data som innehåller personlig information kan endast publiceras anonymiserade. Pseudonymiserade data är fortfarande personuppgifter och därför kan de inte öppnas utan explicit samtycke för ändamålet. Se Anonymisation and Personal Data (Finlands samhällsvetenskapliga dataarkiv FSD).
  • Personlig information kan delas via en licens, om det ursprungliga ändamålet för databehandling tillåter detta. Om du planerar att dela data som innehåller personlig information, kontakta Hankens Dataskyddsombud dpo@hanken.fi.
  • Observera att metadata för data som innehåller personlig information kan öppnas, även om själva data inte kan vara öppna.

2. Var publiceras data öppet?

  • Välj ett lämpligt arkiv för att dela och öppna dina data redan i början av projektet. Kontrollera att dina data uppfyller arkivets krav.
  • Välj arkiv som använder beständiga identifierare (DOI, URN).
  • Kontrollera rekommendationerna från förlag, vetenskapliga samfund och finansiärer inom ditt eget område. Var har du eller dina kollegor publicerat data?
  • Specifika arkiv enligt datatyp finns på re3data.org.
  • Allmänna arkiv för datalagring är t.ex. Aila, IDA, Zenodo, Dryad och Figshare.
  • Om det inte är möjligt att öppna ditt forskningsdata, kan du kanske öppna dess metadata t.ex. i den finländska tjänsten Etsin eller på Zenodo.
  • Registrera dina dataset i Hankens forskningsdatabas Haris. Du kan registrera fristående dataset eller dataset som hör ihop med en publikation. Om en publikation har ett tillhörande dataset rekommenderar vi att du skapar två poster i Haris – en post för publikationen och en post för datasetet. Posterna kopplas sedan ihop med varandra under rubriken Relationer till annat innehåll i inmatningsformuläret. Tillgängligheten till datat sker genom att ange en länk till filens plats eller till en DOI. Det går alltså inte att ladda upp filer som innehåller själva datat i Haris. Frågor om att registrera dataset och övrig registrering i Haris riktas till haris@hanken.fi.

3. När är data tillgängligt? Finns det behov av att ange en embargoperiod?

4. Kommer en del av uppgifterna att förstöras? För mera information se Data disposal (Finlands samhällsvetenskapliga dataarkiv FSD).

5. Vilken licens använder du för att öppna och dela dina data? Avtal om ägande- och nyttjanderätt till data och andra immateriella rättigheter måste ingås innan forskningsverksamheten påbörjas.

För mera information se Five steps to decide what data to keep the Digital Curation Centre (DCC)

Långtidsbevaring av data

Låntidsbevaring innebär att data bevaras i mer än 25 år. När du skapar dina data måste du överväga hur länge data kommer att bevaras. Ta reda på om det finns disciplinspecifika krav för att bevara data,  eller om forskningsfinansiärer och förlag har särskilda krav. Att det finns en plan för att arkivera data är en del av forskningens kvalitet och öppenhet. Om dina data har ett långsiktigt värde ska du tänka på:

  • Vilken del av data arkiveras?
    Det rekommenderas att vissa  typer av personuppgifter förstörs när projektet är slut. GDPR kräver dock inte att all data förstörs. Enligt GDPR krävs att deltagarna är informerade om att data sparas och grunden för hur länge det sparas. Om du vill bevara känslig personlig information kontakta Hankens Dataskyddsombud dpo@hanken.fi.
     
  • Var arkiveras data?
    • Undervisnings- och kulturministeriet har inrättat en Fairdata-PAS-tjänst för finländska forskningsorganisationer för långsiktigt digitalt bevarande av de nationellt viktigaste forskningsdata. Fairdata-PAS är avsett för digital bevarande av forskningsdata under flera decennier, eller till och med århundraden. Se Helsingfors universitets riktlinjer för att bedöma datavärdet. Om du vill anmäla dig till kön för Fairdata-PAS, vänligen kontakta openresearch@hanken.fi.
    • Finländska forskningsorganisationer kan använda en Fairdata-PAS-tjänst för att långtidsbevara nationellt viktiga forskningsdata. Tjänsten är avsedd för digitalt bevarande under flera decennier och den är inrättad av Undervisnings- och kulturministeriet. Se riktlinjer för att bedöma datavärdet från Helsingfors universitet. Om du vill anmäla dig till kön för Fairdata-PAS kontakta openresearch@hanken.fi.
    • Kontakta openresearch@hanken.fi för att få hjälp och råd om olika typer av arkiveringstjänster.
       
  • Hur länge kommer data att bevaras?
     
  • Finns det några kostnader relaterade till arkivering? Vem ansvarar för eventuella kostnader?
     
  • Kommer en del av data att förstöras? Se Data disposal (Finlands samhällsvetenskapliga dataarkiv FSD)

För mera information, se Five steps to decide what data to keep Digital Curation Centre (DCC).