Što su istraživački podaci?
Istraživački podaci su svi tijekom istraživanja prikupljeni, zabilježeni ili generirani kvalitativni i kvantitativni podaci u svrhu kako bi se došlo do novih, originalnih rezultata istraživanja.
Dijeljenje istraživačkih podataka pridonosi ponovljivosti (eng. reproducibility) i transparentnosti znanstvenih istraživanja, povećava utjecaj znanstveno-istraživačkog rada i citiranost, potiče napredak u znanosti, te dopsinosi bržoj primjeni unanosti u gospodarstvu i razvoju društva u cjelini.
Iz Politilke otvorene znanosti UNIRI:
Preporučuje se da se za svaku istraživačku aktivnost izradi Plan upravljanja istraživačkim podacima (eng. Researsch Data Management Plan) te da se u svakom slučaju istraživački podaci digitalno povežu s odgovarajućim publikacijama.
Prednosti otvorenih istraživačkih podataka:
- Podaci ostaju pohranjeni za buduća istraživanja i edukaciju (validacija rezultata istraživanja, sekundarne analize, postavljanje novih hipoteza)
- Povećavanje utjecaja znanstveno-istraživačkoga rada i citiranosti (veća vidljivost i mogućnost suradnje na drugim istraživačkim projektima)
- Ispunjavanje zahtjeva financijera istraživanja (financijeri znanstvenih istraživanja sve češće zastupaju stav kako bi publikacije i istraživački podaci u istraživanjima financiranim javnim novcem trebali biti objavljeni i dostupni znanstvenoj zajednici i javnosti)
- Izbjegavanje dupliciranja financijskih troškova, vremena i truda (smanjenje troškova)
- Omogućavanje njihovog korištenja u obrazovne svrhe za podučavanje studenata
- Poticanje napretka u znanosti, doprinos bržoj primjeni znanosti u gospodarstvu te razvoju društva u cjelini.
Za objavu istraživačkih podataka, setove podataka je potrebno usuglasiti sa FAIR principima, koji predstavljaju temelj otvorene znanosti u cjelini. Akronim FAIR stoji za Findable, Accessible, Interoperable i Reusable Data, odnosno podatke koji su pohranjeni kako bi bili pretraživi i dostupni te dobro opisani da se osigura interoperabilnost i mogućnost ponovnog korištenja.
Navedeni principi osigurat će lakše pronalaženje istraživačkih podataka, nesmetan pristup podacima i metapodacima, korištenje uobičajenih standarda i formata kako bi se osigurala mogućnost razmjene podataka među raznim sustavima te pripremu podataka kako bi bili razumljivi i iskoristivi za ponovnu upotrebu.
Osim dobrog metapodatkovnog opisa, mogućnost ponovnog korištenja ovisi i o licenciji koja se dodijeli podacima, jer FAIR principi ne podrazumijevaju nužno i otvorenost podataka radi primjerice privatnosti ispitanika.
Plan upravljanja istraživačkim podacima (PUP; eng. Data Management Plan – DMP) je važan dokument u kojem se definira koji podaci će se prikupljati i/ili stavarati, dokumentirati, tko će im moći pristupiti, gdje će se pohraniti te akko će se dijeliti i dugoročno čuvati. Lokalne, nacionalne i međunarodne politike već zahtijevaju izradu plana upravljanja istraživačkim podacima za projekte financirane javnim sredstvima.
Kao takvi, istraživački podaci trebali bi biti:
- Pretraživi – mogu se lako pronaći i identificirati (npr. DOI)
- Dostupni- licencije pod kojima se nalaze, jesu li pod embargom i sl.
- Korisni izvan izvorne svrhe za koju su prikupljeni – moraju biti dobro odabrani, opremljeni dokumentacijom koja je dostatana za njihovo ponovno korištenje
- Interoperabilni
Zenodo je sveobuhvatan digitalni repozitorij koji je nastao u okviru Open AIRE projekta financiran i iniciran od Europske komisije. Zenodo je pokrenut 2013. godine, kao pionir u otvorenoj znanosti, infrastrukturi otvorenog pristupa i otvorenim podacima.
re3data.org je najpotpuniji registar repozitorija istraživačkih podataka koji okuplja više od 2000 repozitorija iz svih znanstvenih područja. Koristan je istraživačima, knjižničarima i financijerima ; za traženje objavljenih setova podataka, kao i pomoć pri odabiru repozitorija za pohranu istraživačkih podataka.
Research Data Alliance je globalna organizacija usmjerena na razvoj društvenih i tehničkih uvjeta za otvoreno dijeljenje i ponovnu upotrebu podataka te poticanje inovacije temeljene na podacima.
Životni ciklus istraživačkih podataka
U okviru planiranja istraživanja potrebno je planirati i upravljanje istraživačkim podacima što uvelike olakšava izrada dokumenta Plan upravljanja istraživačkim podacima (engl. Data Managment Plan, DMP).
Argos – online alat za izradu DMP-a
Data Management Skillbuilding Hub – baza podataka koja pruža preporuke za rad s podacima te pokriva svaki stadij životnog ciklusa podataka
DMPonline – online alat za izradu DMP-a.
- Imenovanje istraživačkih podataka – kako bi proces upravljanja istraživačkim podacima bio učinkovitiji, važno je stvoriti konvenciju imenovanja istraživačkih podataka te odgovarajuću strukturu mapa prije nego što istraživanje krene. Konvencija imenovanja istraživačkih podataka je način dodjeljivanja imena datotekama i mapama vezanim za istraživačke podatke.
- Verzioniranje ili kontrola verzija istraživačkih podataka – proces upravljanja promjenama datoteke tijekom istraživanja ili projekta. Kako bi se razumjele promjene, poželjno je i dokumentiranje povijesti promjena — tko, kada i zašto je napravio promjene.
- Odabir formata za trajnu pohranu podataka – Važno je odabrati otvorene i dobro dokumentirane formate koji jesu ili mogu biti podržani od više proizvođača programa što olakšava eventualnu migraciju na nove formate u budućnosti.
- Dokumentacija i metapodaci – Dokumentiranje je proces opisivanja istraživačkih podataka kojim se tijekom istraživanja bilježi što su istraživački podaci, kako su prikupljeni, analizirani i verzionirani. Budući da dokumentacija daje kontekst istraživačkim podacima, od velike je važnosti javnosti i samom istraživačkom timu za njihovo razumijevanje, dijeljenje i ponovno korištenje. Metapodacima se opisuje skup istraživačkih podataka (podaci o podacima).
- Čuvanje podataka tijekom istraživanja – istraživačke podatke treba pravilno i pouzdano čuvati i pohraniti tijekom istraživanja kako ne bi došlo do gubitka podataka ili njihovoga neovlaštenog korištenja.
- Objava osobnih i osjetljivih podataka – Agencija za zaštitu osobnih podataka (AZOP) u Republici Hrvatskoj osobni podatak definira kao svaku informaciju koja se odnosi na fizičku osobu koja je identificirana ili se može identificirati.
- Informirana privola – Prije samog sudjelovanja u istraživanju ispitanicima se dostavlja informirana privola (engl. Informed Consent) koju potpisuju te na taj način daju istraživaču dozvolu za obradu i objavu podataka prikupljenih u svrhu istraživanja.
- Osobni identifikatori sudionika istraživanja – Postoje dvije vrste osobnih identifikatora, direktni i indirektni. Direktni identifikatori su sve informacije koje mogu izravno identificirati osobu te se isključuju iz skupa podataka prije javne objave. Indirektni identifikatori su sve one informacije i podaci koje u kombinaciji s drugim podacima mogu identificirati osobu.
- Anonimizacija i pseudonimizacija – Osjetljive i osobne podataka potrebno je anonimizirati kako bi se zaštitio identitet ispitanika. Postoje dvije vrste anonimizacije — anonimizacija i pseudonimizacija podataka — te se oba postupka mogu provesti na kvalitativnim i kvantitativnim podacima.
- Definiranje prava korištenja skupa podataka – Prije objave podataka važno je definirati kako će se skup istraživačkih podataka moći koristiti. To se uređuje licencijom koja predstavlja dozvolu kojom autor definira uvjete za ponovno korištenje djela, u ovom slučaju skupa istraživačkih podataka. Biranjem odgovarajuće licencije, autor zadržava autorsko pravo i omogućuje drugima da djelo koriste uz jasno definirane uvjete.
- Trajna pohrana – Nakon završetka istraživanja, podaci se mogu dugoročno pohraniti u repozitoriju autorove ustanove uspostavljenom na nacionalnoj infrastrukturi Dabar. Podršku za pohranu istraživačkih podataka može pružiti knjižničar ili urednik institucijskoga repozitorija, a podatke je moguće i samostalno pohraniti u repozitorij (samoarhiviranje) ako je ta opcija uključena. Osim u repozitoriju, istraživački podaci mogu se objaviti i kao dodatak radu u časopisu. Osim u institucijski repozitorij, podaci se mogu pohraniti u tematske ili disciplinske repozitorije kakav je, na primjer, Archaeology Data Service za znanstveno polje arheologije, te u repozitorije opće namjene poput Zenodoa.
- Citiranje istraživačkih podataka – ono omogućuje praćenje rada istraživača te omogućuje ponavljanje istraživanja u istim ili sličnim uvjetima. Olakšava pristup znanstvenim radovima te osigurava valjano pripisivanje autorstva. Osim toga, omogućuje dokazivost teza u istraživačkim radovima.
Da bi podaci bili razumljivi i ponovno upotrebljivi, kako tijekom tako i nakon istraživanja, potrebno je njima upravljati tijekom svih faza životnoga ciklusa.
Zašto je važno dijeliti istraživačke podatke?
Neka vaši podaci budu FAIR
Naučite upravljati istraživačkim podacima
Upute za objavu skupa podataka u repozitorij u Dabru
Upute su namijenjene istraživačima i urednicima repozitorija.
Istraživački podaci - što s njima?
Priručnik o upravljanju istraživačkim podacima.
23 smjernice: podrška za upravljanje istraživačkim podacima
Pregled besplatnih online izvora i alata za pomoć u pružanju podrške u upravljanju istraživačkim podacima
Istraživački podaci - što s njima?
Webinar - Smjernice i dobre prakse usmjerene na otvoreno dijeljenje i ponovnu upotrebu istraživačkih podataka.