Skip to Main Content

Hantering av forskningsdata

Att publicera (meta)data i enlighet med FAIR-principerna

Forskningsdata och publicerade forskningsresultat som producerades på Hanken publiceras öppna och tillgängliga för delad återanvändning. Det står i Hankens Riktlinjer för öppen vetenskap och forskning (2021, s.5) att "Hanken strävar efter att säkerställa att de forskningsdata som produceras av högskolans forskare är möjliga att hitta och citera, samtidigt som graden av öppenhet och delning av data är etiskt och juridiskt försvarbar".

Öppenhet och återanvändning av forskningsdata ökar synligheten och genomslagskraften av din forskning, förbättrar datans verifierbarhet och forskningens reproducerbarhet och bidrar till att uppnå de globala hållbarhetsmålen i många aspekter t.ex. genom att spara tid och resurser i dataproduktion. Lämplig datahantering och noggrant organiserade och beskrivna (meta)data som publiceras för datahämtning och återanvändning erkänns och övervägs som en del av en forskares akademiska meriter. Se Fördelar med öppen data och dataåteranvändning nedan.

FAIR-dataprinciperna (sökbara, tillgängliga, interoperabla och återanvändbara; findable, accessible, interoperable, and reusable) är en uppsättning vägledande principer för att säkerställa att dina digitala forskningsdata är verkligen öppna och återanvändbara. Se FAIR-principerna nedan.

FAIR-principerna handlar främst om metadata som förekommer i nästan alla FAIR-principer. Metadata är data om data och beskriver sammanhanget, innehållet, strukturen, sammanställningen och hanteringen av dina forskningsdata. Det är genom metadata som dataset blir synliga, tillgängliga och bedömda för eventuell nedladdning och återanvändning. Att skapa väl avvägda och detaljerade metadata är nyckeln till att göra data öppna, begripliga och återanvändbara. Se Metadata och datadokumentation nedan.

Tänk på följande frågor när du öppnar och publicerar din forsknings (meta)data i linje med FAIR-principerna:

1. Hur beskriver och publicerar du metadata för dina forskningsdata?

  • Du kan logga in på Qvain med ditt HAKA-konto, klicka på CREATE DATASET och fyll i blanketten. Se Qvain User Guide.
  • Det är genom metadata som dataset blir synliga, tillgängliga och bedömda för eventuell nedladdning och återanvändning. Att skapa väl avvägda och detaljerade metadata är nyckeln till att göra data öppna, begripliga och återanvändbara.
  • Öppen/FAIR data kan öka synligheten och genomslagskraften av din forskning, underlättar samarbete såväl inom forskningsområdet som tvärvetenskapligt, förbättra datasverifierbarheten och forskningsreproducerbarheten, minska kostnaderna för dubbelarbete i dataproduktion, förbättra kunskapsdelningen och bidra till att uppnå flera SDG. Öppenhet och återanvändning av forskningsdata erkänns som en del av en forskares akademiska meriter. Se Fördelar med öppen data och dataåteranvändningnedan.
  • Observera att även om du inte kan publicera och arkivera dina forskningsdata, eftersom dina data innehåller t.ex. personlig information, känsliga personuppgifter eller konfidentiella data, kan du fortfarande publicera metadata för dina forskningsdata. Metadata för forskningsdata som innehåller personuppgifter eller konfidentiella uppgifterna kan publiceras, även om de faktiska uppgifterna inte kan publiceras. Du kan publicera en allmän beskrivning av din forskning och forskningsdata, och lämna dina kontaktuppgifter så att andra kan hitta din forskning och begära ytterligare information om din forskning och forskningsdata.
  • Creative Commons-licensen CC BY 4.0 rekommenderas för publicerade (meta)data när så är möjligt.

2. Var öppnas och publiceras data?

Forskningsdata arkiveras och öppnas i ett nationellt eller internationellt arkiv, t.ex.  ZenodoIDA eller Aila, när så är möjligt. 

3. Vilken del av data öppnas och publiceras?

  • Anonymiserade data publiceras och arkiveras i ett datalager för gemensamt bruk närhelst det är möjligt.
  • Enligt Dataskyddslag (1050/2018, § 4 (4)) och GDPR (art. 6 (1)(e)), om behandling av forskningsmaterial som innehåller personuppgifter samt av personuppgifter som ingår i deras metadata behövs för arkivändamål och behandlingen står i proportion till det mål av allmänt intresse som eftersträvas och den registrerades rättigheter, är det lagligt. Pseudonymiserade uppgifter är fortfarande personuppgifter. Begränsad tillgång kan användas som en åtgärd för att arkivera pseudonymiserade uppgifter. Forskningsdeltagarna behöver informeras om dina öppen dataplaner i dataskyddsmeddelandet. Se Anonymisera data före publicering och arkivering.

4. När är data tillgängliga? Finns det behov av att ange en embargoperiod?

5. Vilken licens använder du för att öppna och publicera dina (meta)data? Licensiering är nödvändig för publiceringen av data. Det rekommenderas att använda Creative Commons CC BY 4.0-licensen för öppen data när så är möjligt. Se Immateriella rättigheter i datahantering.

6. Kommer en del av uppgifterna att raderas? Se Dataradering och (meta)datapublicering.

7. Andra viktiga frågor vid publiceringen av forskningsdata inkluderar användning av öppna, standardiserade, utbytbara och icke proprietära (ej egenutvecklade) dataformat, lämplig och konsekvent namngivning, välorganiserade mappstrukturer och tydlig versionskontroll. Se Dataformat och organisering.

 

8. Kom ihåg att registrera dina dataset i Hankens forskningsdatabas Haris. Mata in PIDs (persisitent idenifiers. t.ex. DOI och URN) för dina metadata (t.ex. från Qvain) och för dina dataset i arkivet där du har lagrat eller publicerat dina dataset.

Du kan registrera fristående dataset eller dataset som hör ihop med en publikation. Om en publikation har ett tillhörande dataset rekommenderar vi att du skapar två poster i Haris – en post för publikationen och en post för datasetet. Posterna kopplas sedan ihop med varandra under rubriken Relationer till annat innehåll i inmatningsformuläret. 

Informationen du har registrerat i Haris om dina dataset visas på Haris publika portal.

Mer information, se Registrera dina dataset i LibGuiden om Haris.

 

Frågor om att registrera (meta)data och övrig registrering i Haris riktas till openresearch@hanken.fi eller haris@hanken.fi.

FAIR-principerna

FAIR-dataprinciperna, formulerade Force11, beskriver centrala riktlinjer för god datahantering och öppen tillgång till forskningsdata. FAIR är en akronym som kommer från orden Findable, Accessible, Interoperable och Reusable. Forskningsdata som publiceras enligt FAIR-principerna innebär alltså att data ska vara möliga att hitta, komma åt, flytta eller kombinera och återanvända. 

För att forskningsdata ska vara sökbara (Findable) krävs att:

  • F1. (meta)data förses med en unik och beständig identifierare
  • F2. data beskrivs med utförliga och maskinläsbara metadata (defined by R1 below)
  • F3. metdata innehåller identifieraren till de data som beskrivs
  • F4. (meta)data registreras och indexeras i en sökbar webbtjänst

För att forskningsdata ska vara tillgängliga (Accessible) krävs att:

  • A1. (meta)data kan nås via sin beständiga identifierare och kan läsas av och ges tillgång till via ett standardiserat kommunikationsprotokoll (som http eller ftp)
  • A1.1. kommunikationsprotokollet är öppet, kostnadsfritt och universellt implementerbart
  • A1.2. det är möjligt att skapa olika användarroller och mekanismer för verifiering av användare och kontroll av åtkomst till data. Tillgången till forskningsdata bör vara så öppen som möjligt och så begränsad som nödvändigt, om data är känsliga.
  • A2. metadata är tillgängliga även om data inte längre är tillgängligt
För att forskningsdatat ska vara interoperabla (Interoperable) krävs att:
  • I1. (meta)data redovisas med semantiska beskrivningar som är standardiserade, dokumenterade och tillgängliga
  • I2. vokabulärer, terminologier och ontologier som används för att beskriva (meta)data är vedertagna, kontrollerade och beskrivna på ett tillgängligt sätt
  • I3. relationer mellan olika data och metadata beskrivs så att det är möjligt att förstå hur data hör samman /ett sätt som möjliggör att sammanhang kan förstås.
 För att forskningsdata ska vara återanvändbara (Reusable) krävs att:
  • R1. meta(data) innehåller olika slag av kontextuella beskrivningar/Uppgifter som gör  det möjligt att förstå och avgöra om data lämpar sig för syftet med återanvändningen //som till exempel vetenskapligt syfte, i vilket sammanhang data samlades in samt vilken utrustning och programvara som användes
  • R1.1. villkor för hur (meta)data får användas anges på ett tydligt sätt
  • R1.2. (meta)datas ursprung (proviniens) beskrivs i detalj
  • R1.3. (meta)data är strukturerade och dokumenterade enligt tillämpliga standarder och vedertagna format

                  FAIR data principles and metadata

FAIR-dataprinciperna kan formuleras som Findable+Accessible+Interoperatable=Reusable. Att göra data återanvändbara och återanvända och dra nytta av befintliga dataset är de grundläggande motiven för öppna data. En FAIR+R (FAIR+reproducible) metod argumenteras också för (Se Christophe Bontemps and Valérie Orozco. 2021. “Toward a FAIR Reproducible Research”, in Abdelaati Daouia and Anne Ruiz-Gazen (eds.) Advances in Contemporary Statistics and Econometrics. Springer International Publishing.)

FAIR är inte lika med öppen eller fri. Data kan vara stängda och betalas men ändå perfekt FAIR, medan data som är öppna och gratis ofta inte är FAIR och därmed betraktas som icke kostnadseffektiva och återanvändbara.

FAIR-dataprinciperna handlar främst om metadata som förekommer i nästan alla FAIR-principer. Det är genom metadata som dataset blir synliga, tillgängliga och bedömda för eventuell nedladdning och återanvändning. Att skapa väl avvägda och detaljerade metadata är nyckeln till att göra data öppna, begripliga och återanvändbara.

Följ följande steg för att säkerställa att dina (meta)data är FAIR:

  • Spara dina data i ett öppet filformat som Rich Text Format (.rtf) eller .csv. Dessa är mer interoperabla och mindre utsatta för förlust och inkurans än ägande-format.
  • Arkivera dina data i ett etablerat digitalt arkiv i slutet av projektet. Kom ihåg att välja ett arkiv som ger en persistent identifierare (PID), t.ex. DOI eller URN.
  • Skapa beskrivande metadata för data. De flesta av FAIR-dataprinciperna gäller metadata. Det är avgörande att beskriva och dokumentera dina forskningsdata för att göra dem riktigt öppna och återanvändbara. Se Datadokumentation och metadata i följande avsnitt.
  • Licensiera dina data med en licens som tydligt anger villkoren och begränsningarna för återanvändning.

Läs mera:

Det rekommenderas att använda Fairdata services som erbjuds av Undervisnings- och kulturministeriet och produceras av CSC - IT Center for Science Ltd för datahantering, datalagring, metadata produktion, spridning och distribution av dataset samt digital bevarande av forskningsdata. Tjänsterna inkluderar:

  • IDA, forskningsdatalagring och arkiv – säker lagring och arkivering av forskningsdata.
  • Qvain, forskningsmetadataverktyg – ett metadataverktyg för beskrivning och publicering av dataset.
  • Etsin, forskningsdatasets sökare för datahämtning  – upptäck, få tillgång till och ladda ner forskningsdata från alla vetenskapsområden.
  • PAS, digital preservation service for research data – pålitligt bevarande av digital information i decennier eller till och med sekel framåt.

Läs How to make the research dataset FAIR? och lär dig mer om Fairdata services.

Metadata och datadokumentation

Datadokumentation betyder att beskriva data, är data om data och ger information om vem, vad, när, var, varför, hur av dina data. Att investera tid i att dokumentera data gör det enkelt att förstå data för både andra och dig själv och minskar risken för falsk förklaring av data. Datadokumentation kan vara en readme-fil (läsbar för människor) och metadata (läsbara för datorer):

  • Readme-filer är textdokument (t.ex. i formatet .txt) som ger information om datafiler för att säkerställa att de tolkas korrekt. En readme-fil förklarar vilka data ett forskningsprojekt har, hur data skapades, var data kommer från, hur man kan tolka dem, vad förkortningarna betyder, vilken programvara som behövs för att använda data, hur data har modifierats, och kan innehålla information om titeln, skaparen, finansieraren, relevanta datum för datainsamling och publicering, lokalisering, metodik, ämne, filformat, filnamnsystem och mappstruktur, dataversion, licens och arkivet.

Skriv en readme-fil om dina data och datafiler. Lägg readme-filen på den mest uppenbara platsen i datafilmapparna för att säkerställa att den kan märkas och ses omedelbart.

  • Metadata är tekniska data som beskriver en forskningsdataset. När data görs FAIR spelar metadata nyckelrollen. Systematiskt beskrivna forskningsdata är nyckeln till att göra dina data begripliga, sökbara och återanvändbara.

Metadata bör vara maskinläsbara och maskinåtgärder; alltså, data behöver beskrivas riktigt och systematiskt på det sätt som maskinen kan tolka och navigera i alla metadata och länkade data över olika webbplatser, och hämta och överföra de rätta data för en person som gör semantiska sökningar. Det finns standardmetoder tillgängliga för datadokumentation som kallas metadatastandarder, som bör användas om de är lämpliga för datan. Fairdata Qvain-metadataverktyget gör beskrivning och publicering av forskningsdata smidig och enkel för forskare utan att kräva tekniska färdigheter.

Det rekommenderas starkt att använda Fairdata Qvain-metadataverktyget för att beskriva och publicera dina (meta)data. Qvain är en del av Fairdata services för att stödja din forskningsdata bli FAIR. Data som beskrivs och publiceras av Qvain-metadataverktyget överförs automatiskt till det finska metadatalageret Metax, som är integrerat med både Etsin (forskningsdatasökare) och Finlands nationella forskningsinformationscentrum/Finnish National Information Hub/Tutkimustietovaranto (en tjänst som också beställts av Undervisnings- och kulturministeriet och CSC).

Du kan logga in på Qvain med ditt HAKA-konto, klicka på CREATE DATASET och fyll i blanketten. Se Qvain User Guide.

                  Qvain

Om du inte kan publicera och arkivera dina forskningsdata, eftersom dina data innehåller t.ex. personlig information, känsliga personuppgifter eller konfidentiella data, kan du fortfarande publicera metadata för dina forskningsdata. Metadata för forskningsdata som innehåller personuppgifter eller konfidentiella uppgifterna kan publiceras, även om de faktiska uppgifterna inte kan publiceras.

Mer information, se:

Långtidsbevaring av data

Långvarig bevarande innebär att data bevaras i flera decennier eller århundraden. Du kan kategorisera dina dataset i enlighet med den planerade förvaringsperioden:

  • 1) Data som förstörs när projektet har avslutats.
  • 2) Data som arkiveras under en verifieringsperiod, som kan variera enligt vetenskapsområde, t.ex. 5–15 år.
  • 3) Data som arkiveras för eventuell återanvändning, i t.ex. 25 år.
  • 4) Data av långvarigt värde som arkiveras i en kuraterad tjänst för framtida generationer i tiotals eller hundratals år.

Låntidsbevaring avser den fjärde kategorin. Data alltså bevaras i mer än 25 år. När du skapar dina data behöver du överväga hur länge data kommer att bevaras. Ta reda på om det finns disciplinspecifika krav för att bevara data, eller om forskningsfinansiärer och förlag har särskilda krav.

Finlands Undervisnings- och kulturministeriet har inrättat  Fairdata-PAS-tjänsten (Digital Preservation Service for Research Data, DPS for Research Data) för finländska forskningsorganisationer för låntidsbevaring av de nationellt viktigaste forskningsdata. Tjänsten är avsedd för digitalt bevarande av forskningsdata som har betydande värde för organisationen eller på nationell nivå, både nu och särskilt i framtiden.

Se Digital Preservation (Fairdata-PAS): Guidelines for UH Evaluators av Helsingfors universitet.

Om du vill anmäla dig till kö för Fairdata-PAS, kontakta openresearch@hanken.fi.

Fördelar med öppen data och dataåteranvändning

Att göra forskningsdata öppna och återanvändbara och att återanvända och dra nytta av befintliga dataset är en grundläggande anledning för öppen data. FAIR-dataprinciperna kan formuleras som Findable+Accessible+Interoperatable=Reusable. Öppenhet och återanvändning av forskningsdata: 

  • Ökar synligheten och genomslagskraften av din forskning. Att publicera forskningsdata kan skapa flera möjligheter för forskare till meritering t.ex. via citeringar eller registrerade nedladdningar. Det blir på så sätt möjligt att få erkännande för flera delar av forskningsprocessen än enbart den publicerade artikeln.
  • Erkänns som en del av en forskares akademiska meriter. Insatser som är relaterade till främjande av god datahantering och ändamålsenligt öppnande av forskningsdata är en del av det vetenskapliga arbetet och värderas och övervägs som meriter i forskningsutvärderingskriterier vid rekrytering och karriärutveckling (Policy och åtgärdsprogram om öppen tillgång till forskningsdata, 2021, s. 11; Hankens Riktlinjer för öppen vetenskap och forskning, 2021, s. 8).
  • Påskyndar tillämpningen av dina forskningsresultat och innovationsprocesser,
  • Underlättar samarbete såväl inom forskningsområdet som tvärvetenskapligt, både inom det vetenskapliga samfundet och i samhället i stort,
  • Förbättrar kunskapsdelningen och ökar vetenskapens transparens och tillförlitlighet, vilket både stärker och demokratiserar vetenskapen.
  • Bidrar till att uppnå SDGs i många aspekter.
  • Att återanvända publicerade data från tidigare studier sparar inte bara tid och resurser i dataproduktion, 
  • utan också förbättrar datans repeterbarhet och verifierbarhet, forskningens reproducerbarhet, och de forskningsresultatens tillförlitlighet.

Mer information om fördelarna med öppna data, se:

Vid återanvändning av data gäller normal referenspraxis. Se Att återanvända och citera data.