Skip to main content

Hantering av forskningsdata: Att dela och arkivera data

Att återanvända data

Att återanvända och dra nytta av befintliga datasätt är det grundläggande motivet för att öppna och dela data. Forskningsdata är värdefulla resurser som ofta kräver mycket tid och pengar att skapa. Det är därför värt att överväga att återanvända befintliga datasätt som tidigare studier har genererat och arkiverat offentligt. Ändå återanvändning av data inte bara om att spara tid och resurser. Det förbättrar också upprepbarhet och verifierbarhet av data och därmed tillförlitligheten hos vetenskapliga utgångar.

Samtidigt blir optimal användning och återanvändning av arkiverade data möjliga endast när tillgänglighet och återanvändbarhet av forskningsdata har säkerställts. Korrekt hanterade och öppet publicerade forskningsdata med lämpliga licenser möjliggör och underlättar delad användning. FAIR-principer i avsnittet nedan ger vägledning om hur du gör dina data verkligen öppna och återanvändbara. Se även Att öppna data till höger om hur du öppnar och publicerar dina data.

Tjänster för att söka efter datasätt inkluderar:

  • OpenAIRE explore är en sökportal för datasätt från ett brett utbud av internationella förvar.
  • Fairedata Etsin är en forskningsdatasökare, som också låter dig hitta forskningsdatasätt från alla vetenskapsområden.

Aila vid Finlands samhällsvetenskapliga dataarkiv (FSD) ger tillgång till arkiverade data kostnadsfritt. Efter registreringen kan du enkelt söka efter och ladda ner relevant data enkelt och snabbt.

Vid återanvändning av data bör goda rutiner för attributen till författarskap och datacitering följas. Läs mer om hur återanvända forskningsdata av OpenAIRE.

FAIR-dataprinciper

FAIR is an acronym that data is Findable, Accessible, Inter-operable, and Re-useable. These are all essential elements in making data truly open.

To be Findable:

F1. (meta)data are assigned a globally unique and persistent identifier
F2. data are described with rich metadata (defined by R1 below)
F3. metadata clearly and explicitly include the identifier of the data it describes
F4. (meta)data are registered or indexed in a searchable resource

To be Accessible:

A1. (meta)data are retrievable by their identifier using a standardised communications protocol
A1.1 the protocol is open, free, and universally implementable
A1.2 the protocol allows for an authentication and authorisation procedure, where necessary
A2. metadata are accessible, even when the data are no longer available

To be Interoperable:

I1. (meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation
I2. (meta)data use vocabularies that follow FAIR principles
I3. (meta)data include qualified references to other (meta)data

To be Reusable:

R1. meta(data) are richly described with a plurality of accurate and relevant attributes
R1.1. (meta)data are released with a clear and accessible data usage license
R1.2. (meta)data are associated with detailed provenance
R1.3. (meta)data meet domain-relevant community standards

See fairdata.fi och Guidelines on FAIR Data Management in Horizon 2020.

Att öppna data

Forskningsdatas öppenhet ökar synligheten och effekterna av din forskning, påskyndar antagandet av dina forskningsresultat och skapandet av innovationer och underlättar disciplinärt och tvärvetenskapligt samarbete, allt inom vetenskapssamhället och i den bredare sociala cirkeln. Öppna data förbättrar vetenskapens transparens och tillförlitlighet, stärker och demokratiserar vetenskapen.

Forskningsdata och publicerade forskningsresultat producerade på Hanken borde publiceras öppet och göras allmänt tillgängliga. Det bör vara möjligt att hitta och referera till datat  och vid återanvändning gäller normal referenspraxis.

Tänk på följande frågor när du du funderar på att publicera data öppet:

1. Vilken del av data öppnas och publiceras?

  • Data med personlig information endast kan publiceras anonymiserade. Pseudonymerade data är fortfarande personuppgifter, och därför kan de inte öppnas utan explicit samtycke för detta ändamål. Se Anonymisation and Personal Data av Finlands samhällsvetenskapliga dataarkiv (FSD).
  • Personlig information kan delas via en licens, om det ursprungliga behandlingsändamålet tillåter det. Om du planerar att dela data som innehåller personlig information, kontakta Hankens Dataskyddsombud dpo@hanken.fi.
  • Observera att metadata för data som innehar personlig information fortfarande bör kunna öppnas, även om själva data inte kan vara öppna.

2. Var publiceras data öppet?

  • Välj lämpligt arkiv för att dela och öppna dina data redan i början av projektet. Kontrollera att dina data uppfyller arkivets krav.
  • Välj arkiv som använder beständiga identifierare (DOI, URN).
  • Kontrollera rekommendationerna från förlag, vetenskapliga samfund och finansiärer inom ditt eget område. Var har du eller dina kollegor publicerat data?
  • Specifika arkiv enligt datatyp finns på re3data.org.
  • Allmänna arkiv: t.ex., Aila, IDA, Zenodo, Dryad och Figshare.
  • Om du inte kan öppna själva data, öppna dess metadata, till exempel, på Zenodo eller nationella Etsin.
  • Registrera dina data i Hankens forskningsdatabas Haris. Du kan registrera fristående dataset eller dataset som hör ihop med en publikation. Om en publikation har ett tillhörande dataset rekommenderar vi att du skapar två poster i Haris – en post för publikationen och en post för datasetet. Posterna kan därefter kopplas ihop med varandra under rubriken Relationer till annat innehåll i inmatningsformuläret. Tillgängligheten till datat sker genom att ange en länk till filens plats eller en DOI. Det går alltså inte att ladda upp filer i formuläret för dataset. Frågor om att registrera dataset och övrig registrering i Haris riktas till haris@hanken.fi.

3. När data finnas tillgängliga? Vill ange någon embargoperiod?

4. Kommer en del av uppgifterna att förstöras? Mer information, se Data disposal av Finlands samhällsvetenskapliga dataarkiv (FSD).

5. Vilken licens använder du för att öppna och dela dina data? Avtal om dataägande och andra immateriella rättigheter måste ingås innan någon faktisk forskningsverksamhet påbörjas.

Mer information, se Five steps to decide what data to keep by the Digital Curation Centre (DCC).

Långsiktigt digitalt bevarande av data

Långvarigt digitalt bevarande innebär att data bevaras i mer än 25 år. När du skapar dina data måste du överväga hur länge data kommer att bevaras. Kom också ihåg att kontrollera disciplinspecifika, finansieringsrelaterade och förläggarnas krav på databevarandestid. En dataarkiveringsplan är en del av forskningens kvalitet och öppenhet. Om dina data har ett långsiktigt värde ska du tänka på:

  • Vilken del av data arkiveras?

Det rekommenderas att särskilda kategorier av personuppgifter förstörs när projektet är slut. GDPR kräver dock inte att all data förstörs. Det kräver att deltagarna är informerade om att data sparas  och grunden för hur länge det sparas. Om du vill bevara känslig personlig information, kontakta Hankens Dataskyddsombud dpo@hanken.fi.

  • Var arkiveras data ?
    • UKM har inrättat en Fairdata-PAS-tjänst för finska forskningsorganisationer för långsiktigt digitalt bevarande av de nationellt viktigaste forskningsdata. Fairdata-PAS är avsett för digital bevarande av forskningsdata under flera decennier, eller till och med århundraden.  Här hittar du riktlinjer från Helsingfors universitet för att bedöma datavärdet. Om du vill anmäla dig till kön för Fairdata-PAS, vänligen kontakta openresearch@hanken.fi.
    • Du kan också kontakta openresearch@hanken.fi om du behöver andra typer av arkiveringstjänster.
  • Hur länge kommer data att bevaras?
  • Finns det några kostnader relaterade till arkivering? Vem tar hand om dem?
  • Kommer en del av data att förstöras? Se Data disposal av Finlands samhällsvetenskapliga dataarkiv (FSD).

Mer information, se Five steps to decide what data to keep av Digital Curation Centre (DCC).