Skip to main content
It looks like you're using Internet Explorer 11 or older. This website works best with modern browsers such as the latest versions of Chrome, Firefox, Safari, and Edge. If you continue with this browser, you may see unexpected results.

Hantering av forskningsdata

Att publicera och dela data

Öppen forskningsdata ökar synligheten och genomslaget för forskning, skapar nya forskningsmöjligheter och underlättar tvärvetenskapligt samarbete. Öppna data gör det också lättare att kontrollera kvaliteten på forskningsdata, vilket ökar forskningens transparens och tillförlitlighet. Genom öppenhet demokratiseras och stärks forskningen.

Att publicera forskningsdata kan skapa flera möjligheter för forskare till meritering t.ex. via citeringar eller registrerade nedladdningar. Det blir på så sätt möjligt att få erkännande för flera delar av forskningsprocessen än enbart den publicerade artikeln.

Forskningsdata och publicerade forskningsresultat producerade på Hanken borde publiceras öppet och göras allmänt tillgängliga. Det ska vara möjligt att hitta och referera till datat. Vid återanvändning av data gäller normal referenspraxis.

Tänk på följande frågor när du du funderar på att publicera data öppet:

1. Vilken del av data öppnas och publiceras?

  • Om du inte kan öppna data, öppna och publicera metadata av din forskningsdata. Observera att metadata för data som innehåller personlig information kan öppnas, även om själva data inte kan vara öppna.
  • Data som innehåller personlig information kan endast publiceras anonymiserade. Pseudonymiserade data är fortfarande personuppgifter och därför kan de inte öppnas utan explicit samtycke för ändamålet. Se Anonymisation and Personal Data av Finlands samhällsvetenskapliga dataarkiv (FSD).
  • Forskningsdeltagares samtycke krävs för öppnandet av materialet, från vilket forskningsdeltagarna är direkt identifierbara. I vissa fall kan materialet delas för det ursprungligen avsedda syftet. Om du planerar att dela data som innehåller personlig information, kontakta Hankens Dataskyddsombud dpo@hanken.fi.

2. Var publiceras data? Välj lämpliga arkiv för att dela och öppna dina data redan i början av projektet.

  • Kriterier för att välja ett arkiv inkluderar:
    • Välj ett arkiv som använder persistenta identifierare (DOI, URN) för metadata (och, om tillämpligt, underliggande data). Läs The use of Persistent Identifiers for Research Datasets: Recommendation by the Finnish Scientific Community for Open Research.
    • Ett arkiv som publicerar maskinläsbar metadata och använder en känd metadatastandard.
    • Ett arkiv som ofta används av dina kollegor. Kolla också rekommendationerna från förlag, vetenskapliga samfund och finansiärer inom ditt eget område.
    • Ett arkiv som låter dig välja användningsvillkoren enligt vilka data kan återanvändas, och anger dem tydligt som en del av metadata.

3. När är data tillgängligt? Finns det behov av att ange en embargoperiod?

5. Vilken licens använder du för att öppna och dela dina data? Licensiering är nödvändig för publicering av data. Det rekommenderas att använda  Creative Commons (CC)-licenser för öppen forskningsdata. Se Juridiska frågor.

4. Kommer en del av uppgifterna att förstöras? För mera information se Data disposal av Finlands samhällsvetenskapliga dataarkiv (FSD) och Five steps to decide what data to keep av Digital Curation Centre (DCC).

 

Kom ihåg att registrera dina dataset i Hankens forskningsdatabas Haris. Du kan registrera fristående dataset eller dataset som hör ihop med en publikation. Om en publikation har ett tillhörande dataset rekommenderar vi att du skapar två poster i Haris – en post för publikationen och en post för datasetet. Posterna kopplas sedan ihop med varandra under rubriken Relationer till annat innehåll i inmatningsformuläret. 

Informationen du har registrerat i Haris om dina dataset överförs till Etsin (också en del av Fairdata services) och finns tillgänglig i Finlands nationella forskningsdatabasportal/Finnish National Information Hub/Tutkimustietovaranto research.fi/forskning.fi/tiedejatutkimus.fi, samt på Haris publika portal.

  • Kom ihåg att mata in PIDs (persisitent idenifiers. t.ex. DOI och URN) för din metadata och data i arkivet där du har lagrat eller publicerat din data. Det går alltså inte att ladda upp filer som innehåller själva datat i Haris. 

Frågor om att registrera (meta)data och övrig registrering i Haris riktas till haris@hanken.fi.

Principer för FAIR data

FAIR-dataprinciperna, formulerade Force11, beskriver centrala riktlinjer för god datahantering och öppen tillgång till forskningsdata. FAIR är en akronym som kommer från orden Findable, Accessible, Interoperable och Reusable. Forskningsdata som publiceras enligt FAIR-principerna innebär alltså att data ska vara möliga att hitta, komma åt, flytta eller kombinera och återanvända. 

För att forskningsdata ska vara sökbara (Findable) krävs att:

  • F1. (meta)data förses med en unik och beständig identifierare
  • F2. data beskrivs med utförliga och maskinläsbara metadata (defined by R1 below)
  • F3. metdata innehåller identifieraren till de data som beskrivs
  • F4. (meta)data registreras och indexeras i en sökbar webbtjänst

För att forskningsdata ska vara tillgängliga (Accessible) krävs att:

  • A1. (meta)data kan nås via sin beständiga identifierare och kan läsas av och ges tillgång till via ett standardiserat kommunikationsprotokoll (som http eller ftp)
  • A1.1. kommunikationsprotokollet är öppet, kostnadsfritt och universellt implementerbart
  • A1.2. det är möjligt att skapa olika användarroller och mekanismer för verifiering av användare och kontroll av åtkomst till data. Tillgången till forskningsdata bör vara så öppen som möjligt och så begränsad som nödvändigt, om data är känsliga.
  • A2. metadata är tillgängliga även om data inte längre är tillgängligt
För att forskningsdatat ska vara interoperabla (Interoperable) krävs att:
  • I1. (meta)data redovisas med semantiska beskrivningar som är standardiserade, dokumenterade och tillgängliga
  • I2. vokabulärer, terminologier och ontologier som används för att beskriva (meta)data är vedertagna, kontrollerade och beskrivna på ett tillgängligt sätt
  • I3. relationer mellan olika data och metadata beskrivs så att det är möjligt att förstå hur data hör samman /ett sätt som möjliggör att sammanhang kan förstås.
 För att forskningsdata ska vara återanvändbara (Reusable) krävs att:
  • R1. meta(data) innehåller olika slag av kontextuella beskrivningar/Uppgifter som gör  det möjligt att förstå och avgöra om data lämpar sig för syftet med återanvändningen //som till exempel vetenskapligt syfte, i vilket sammanhang data samlades in samt vilken utrustning och programvara som användes
  • R1.1. villkor för hur data får användas anges på ett tydligt sätt
  • R1.2. (meta)datas ursprung (proviniens) beskrivs i detalj
  • R1.3. (meta)dataata är strukturerade och dokumenterade enligt tillämpliga standarder och vedertagna format

FAIR-dataprinciperna kan formuleras som Findable+Accessible+Interoperatable=Reusable. Att göra data återanvändbara och återanvända och dra nytta av befintliga dataset är de grundläggande motiven för öppna data.

FAIR är inte lika med öppen eller fri. Data kan vara stängda och betalas men ändå perfekt FAIR, medan data som är öppna och gratis ofta inte är FAIR och därmed betraktas som icke kostnadseffektiva och återanvändbara.

Följ följande steg för att säkerställa att dina (meta)data är FAIR:

  • Spara dina data i ett öppet filformat som Rich Text Format (.rtf) eller .csv. Dessa är mer interoperabla och mindre utsatta för förlust och inkurans än ägande-format.
  • Arkivera dina data i ett etablerat digitalt arkiv i slutet av projektet. Kom ihåg att välja ett arkiv som ger en persistent identifierare (PID), t.ex. DOI eller URN.
  • Skapa beskrivande metadata för data. De flesta av FAIR-dataprinciperna gäller metadata. Det är avgörande att beskriva och dokumentera dina forskningsdata för att göra dem riktigt öppna och återanvändbara. Se Datadokumentation och metadata i följande avsnitt.
  • Licensiera dina data med en licens som tydligt anger villkoren och begränsningarna för återanvändning.

Läs mera:

Fairdata-tjänster

Fairdata services erbjuds av Undervisnings- och kulturministeriet och produceras av CSC - IT Center for Science Ltd för datahantering, datalagring, metadata produktion, spridning och distribution av dataset samt digital bevarande av forskningsdata. Tjänsterna inkluderar:

  • IDA, Research Data Storage – Säker lagring av forskningsdata.
  • Qvain, Research Metadata Tool – Ett metadataverktyg för beskrivning och publicering av dataset.
  • Etsin, Research Dataset Finder – Upptäck, få tillgång till och ladda ner forskningsdata från alla vetenskapsområden.
  • Digital Preservation Service for Research Data –  Pålitlig bevarande av digital information i årtionden eller till och med århundraden.

Läs  How to make the research dataset FAIR? och lär dig mer om Fairdata services.

Metadata och datadokumentation

Datadokumentation betyder att beskriva data, är data om data och ger information om vem, vad, när, var, varför, hur av dina data. Att investera tid i att dokumentera data gör det enkelt att förstå data för både andra och dig själv och minskar risken för falsk förklaring av data. Datadokumentation kan vara en readme-fil (läsbar för människor) och metadata (läsbara för datorer):

  • Readme-filer är textdokument (t.ex. i formatet .txt) som ger information om datafiler för att säkerställa att de tolkas korrekt. En readme-fil förklarar vilka data ett forskningsprojekt har, hur data skapades, var data kommer från, hur man kan tolka dem, vad förkortningarna betyder, vilken programvara som behövs för att använda data, hur data har modifierats, och kan innehålla information om titeln, skaparen, finansieraren, relevanta datum för datainsamling och publicering, lokalisering, metodik, ämne, filformat, filnamnsystem och mappstruktur, dataversion, licens och arkivet.

Skriv en readme-fil om dina data och datafiler. Lägg readme-filen på den mest uppenbara platsen i datafilmapparna för att säkerställa att den kan märkas och ses omedelbart.

  • Metadata är tekniska data som beskriver en forskningsdataset. När data görs FAIR spelar metadata nyckelrollen. Systematiskt beskrivna forskningsdata är nyckeln till att göra dina data begripliga, sökbara och återanvändbara.

Metadata bör vara maskinläsbara och maskinåtgärder; alltså, data behöver beskrivas riktigt och systematiskt på det sätt som maskinen kan tolka och navigera i alla metadata och länkade data över olika webbplatser, och hämta och överföra de rätta data för en person som gör semantiska sökningar. Det finns standardmetoder tillgängliga för datadokumentation som kallas metadatastandarder, som bör användas om de är lämpliga för datan. Fairdata Qvain metadata tool gör beskrivning och publicering av forskningsdata smidig och enkel för forskare utan att kräva tekniska färdigheter.

Det rekommenderas starkt att använda Fairdata Qvain metadata tool för att beskriva och publicera dina (meta)data. Qvain är en del av Fairdata services för att stödja din forskningsdata bli FAIR. Data som beskrivs och publiceras av Qvain metadata tool överförs automatiskt till det finska metadatalageret Metax, som är integrerat med både Etsin (forskningsdatasökare) och Finlands nationella forskningsinformationscentrum/Finnish National Information Hub/Tutkimustietovaranto (en tjänst som också beställts av Undervisnings- och kulturministeriet och CSC).

Qvain

Andra viktiga frågor inkluderar dataformat, konventioner om filnamn, versionskontroll och mappstruktur. Se Dataformat och organisering.

Kom ihåg att du ska registrera både dina publikationer och dataset i Haris - Hankens forskningsdatabas. Informationen som du har registrerat i Haris om dina dataset överförs till Etsin och Finlands nationella forskningsinformationscentrum/Finnish National Information Hub/Tutkimustietovaranto, såväl som visas på Haris publika portal.

Mer information, se:

Långtidsbevaring av data

Låntidsbevaring innebär att data bevaras i mer än 25 år. När du skapar dina data behöver du överväga hur länge data kommer att bevaras. Ta reda på om det finns disciplinspecifika krav för att bevara data, eller om forskningsfinansiärer och förlag har särskilda krav.

Finlands Undervisnings- och kulturministeriet har inrättat  Fairdata-PAS-tjänsten (Digital Preservation Service for Research Data) för finländska forskningsorganisationer för låntidsbevaring av de nationellt viktigaste forskningsdata.

Se e Digital Preservation (Fairdata-PAS): Guidelines for UH Evaluators av Helsingfors universitet.

Om du vill anmäla dig till kö för Fairdata-PAS, kontakta openresearch@hanken.fi.