I dati associati alle pubblicazioni scientifiche

Fino al 2016  solo i progetti che aderivano su base volontaria all’”Open research data pilot” erano tenuti al deposito dei dati della ricerca. Dal 2017, per tutti i bandi di H2020, devono essere resi accessibili anche  gli underlying data, cioè i dati necessari per validare i risultati presentati in pubblicazioni scientifiche, compresi i metadati a questi associati, salvo una motivata decisione contraria.

Perchè Open Data?

  • Creare nuova ricerca favorendo la collaborazione tra ambiti disciplinari diversi
  • Evitare la dispersione e duplicazione degli sforzi
  • Avere a disposizione una quantità di dati che nessun ricercatore potrebbe raccogliere da solo
  • Scoprire dati e risultati non previsti dai ricercatori in fase iniziale
  • Poter riprodurre e verificare i risultati di ricerche precedenti
  • Accelerare l’innovazione e la competitività
  • Condividere i dati della ricerca per promuovere lo sviluppo nei paesi svantaggiati
  • Evitare la perdita di dati prodotti dalla ricerca e dalla sperimentazione *

Cosa depositare?

  • dati risultanti da osservazioni o originati da simulazioni
  • dati sperimentali
  • appunti di laboratorio
  • slide
  • file di programmi
  • questionari, interviste e risposte a test
  • modelli, algoritmi, programmi software, video, audio, immagini, standard, protocolli

I dati devono essere FAIR...

  • Findable: i dati devono essere rintracciabili nella loro interezza (DOI...)
  • Accessible: depositare i dati e i metadati associati in repository che sostengono l’accesso aperto
  • Interoperable: assicurare l’interoperabilità dei dati e dei metadati utilizzando formati e protocolli di scambio possibilmente open source
  • Reusable: agevolare il riutilizzo dei dati scegliendo una licenza aperta

I dati dovrebbero essere depositati avvalendosi di licenze di tipo aperto (vedi le Creative Commons CC 0 o CC by) come richiesto nell’ambito di Horizon 2020.

Opting out

La Comunità Europea ha comunque previsto dei casi di opt out quando non sia possibile rendere pubblici i dati associati alle pubblicazioni scientifiche:

  • sfruttamento commerciale o industriale dei risultati della ricerca
  • problemi legati alla riservatezza/sicurezza del progetto
  • protezione dei dati personali o di dati sensibili
  • altre legittime ragioni

Dove depositare i dati della ricerca

I dati della ricerca devono essere depositati in archivi ad accesso aperto  come Zenodo, nato dalla collaborazione tra il CERN ed il progetto OpenAIRE.

Attualmente la maggior parte dei repository d’ateneo non è attrezzata per ospitare i dati associati alle pubblicazioni scientifiche.

Nell’aprile 2016  la Commissione europea ha lanciato una  nuova Iniziativa per il Cloud europeo per la scienza aperta che in futuro metterà a disposizione un ambiente virtuale per l'archiviazione, la gestione, l'analisi e il riutilizzo dei dati della ricerca. Il Cloud permetterà ai ricercatori di accedere ad un'enorme quantità di dati scientifici generati da attività di ricerca e di mettere in comune i risultati scientifici, migliorando l'accesso alla conoscenza e favorendo quindi l'innovazione. Questa infrastruttura favorirà l'erogazione di servizi innovativi, facilitando la collaborazione tra scienziati e industria (comprese le PMI) e il settore pubblico anche con l'obiettivo di conferire all'Europa un ruolo guida a livello globale nelle infrastrutture per i dati scientifici.

L’11 ottobre 2016 la Commissione europea ha pubblicato il Primo report della Commissione di un gruppo di esperti per la realizzazione del Cloud europeo per la scienza aperta ( HLEG EOSC). 

*un team di scienziati canadesi ha studiato la probabilità che un set di dati di ricerca continui ad essere reperibile negli anni successivi alla pubblicazione, per scoprire che tale probabilità diminuisce del 17% all’anno: Vines, T. H. et al., The Availability of Research Data Declines Rapidly with Article Age, Current Biology 24: 94–97, January 6, 2014