L'urgenza di essere F.A.I.R.

Scheda informativa

Solo nel 2018 sono stati raccolti migliaia di petabyte di dati. Ma troppo spesso i dati scientifici non vengono utilizzati per lo scopo previsto. Infatti, PLOS ha condotto uno studio che indica che solo circa 20% degli articoli pubblicati pubblicano i loro dati di supporto in un archivio di informazioni scientifiche. Ciò rende difficile per gli scienziati accedere ai dati e utilizzarli. Al contrario, i dati rimangono nelle unità o nei computer a prendere polvere digitale.

Se si pensa all'impegno che occorre per generare e raccogliere i dati, il fatto che vengano a malapena utilizzati e poi archiviati in modo improprio fa male. Perché gli scienziati non utilizzano i dati al massimo delle loro potenzialità? In questo articolo discuteremo gli ostacoli all'uso e al riutilizzo dei dati e spiegheremo perché il settore della R&S deve urgentemente eliminarli.

Non sottovalutate il ruolo dei dati

Il settore della R&S si basa sui dati; è uno dei principali produttori e consumatori di dati e si affida alla loro analisi per sviluppare prodotti e servizi innovativi. Ma quando si tratta di condividere questi dati, ci sono alcuni requisiti da considerare: sono facilmente reperibili con i comuni strumenti di ricerca? Altri ricercatori possono accedervi per esaminare facilmente i dati e i metadati associati? E sono in grado di utilizzare i dati in più modi, in modo da poterli confrontare, analizzare e integrare utilizzando termini e formati di uso comune? È riutilizzabile? In una parola, sono F.A.I.R. (findable, accessible, interoperable, re-useable)? Barend Mons, professore presso il Centro Medico dell'Università di Leiden nei Paesi Bassi, co-conduttore di GO FAVOREVOLE e del comitato sui dati del Consiglio scientifico internazionale, si esprime nel modo migliore: "È irresponsabile sostenere la ricerca ma non la gestione dei dati".

I dati sono la nostra risorsa più preziosa; ogni dato costituisce un pezzo del puzzle necessario per innovare. Pensate a tutte le scoperte interessanti e potenzialmente rivoluzionarie che passano inosservate solo perché i dati non sono stati trattati nel modo corretto. Prendiamo ad esempio l'industria farmaceutica. Scoprire un farmaco è difficile perché è impegnativo prevederne le proprietà, come l'efficacia e la tossicità nel corpo umano. Per poter massimizzare le possibilità di scoperta di un farmaco e riutilizzare le molecole per nuovi trattamenti, l'accesso a tutti i dati disponibili è fondamentale.

Inoltre, il riutilizzo dei dati è diventato più importante per sviluppare modelli predittivi e imparare dall'esperienza e dagli errori. Ciò è particolarmente importante in un momento in cui nessuna singola organizzazione può offrire il valore necessario in questo mondo digitale e connesso.

È difficile per i ricercatori condividere adeguatamente i propri dati

I nuovi modi di comunicare con gli strumenti digitali hanno abbattuto i confini tradizionali, dando vita a un maggior numero di partnership, e le aziende dovrebbero essere in grado di condividere le informazioni per prendere decisioni informate. È qui che sta la sfida: le organizzazioni non riescono a trovare i dati, ad accedervi facilmente o a interoperare. Quindi, i dati non possono essere riutilizzati.

Un rapporto del 2018 della Commissione europea ha stimato che i problemi di riutilizzo dei dati costano all'UE circa 10 miliardi di euro all'anno nel solo settore accademico e altri 16 miliardi di euro in termini di perdita di opportunità di innovazione. Se si include il costo del problema della riproducibilità, questi costi aumentano notevolmente.

Secondo PLOS, anche quando i ricercatori dichiarano che i loro dati sono "completamente disponibili su richiesta", chi vuole utilizzarli si scontra spesso con un muro, non riuscendo ad accedere alle serie di dati.

In effetti, solo un set di dati su dieci era accessibile e affidabile per l'uso, anche se richiesto direttamente all'autore. Lo studio ha rilevato che ciò può essere dovuto all'impossibilità di raggiungere il ricercatore, al fatto che non vuole condividere i propri dati, oppure al fatto che i dati sono andati persi o non sono disponibili. È necessario che le politiche di condivisione dei dati garantiscano che i dati non solo siano disponibili, ma anche affidabili e accessibili a lungo termine.

Se non siete F.A.I.R., state perdendo denaro

La collocazione dei dati in un archivio supporta i principi F.A.I.R.. I repository forniscono identificatori chiari e persistenti, raccolta e cura da parte di esperti, pagine di destinazione adeguate e qualsiasi supporto necessario per la citazione dei dati. Tutto ciò offre informazioni chiare e coerenti, facili da trovare, da accedere, da utilizzare in più modi - sia da parte di un ricercatore che di una macchina - e da riutilizzare. Con questo livello di dettaglio e di informazioni, è anche molto più facile fare collegamenti con altri studi correlati e trarre conclusioni informate.

Mons sottolinea anche che se i dati vengono raccolti, curati e trattati correttamente, i ricercatori avranno molto più tempo per condurre altre ricerche. Per come sono fatte le cose ora, i dottorandi passano 80% del loro tempo a correggere problemi di formattazione e piccoli errori, in modo che i dati siano adatti all'analisi. Si tratta di uno spreco di tempo e di talento. In termini monetari, 400 studenti di questo tipo equivarrebbero a 200 dipendenti a tempo pieno.

Questo problema va oltre la ricerca e si estende all'industria, incoraggiando le organizzazioni a formare partnership e ad abbattere i silos per fornire il valore richiesto. Quindi, cosa succede quando i dati di un'organizzazione non sono F.A.I.R? Attualmente, i database interni di molte organizzazioni farmaceutiche sono bloccati in silos e meno F.A.I.R. dei dati del settore pubblico. Ciò è dovuto al fatto che storicamente (e fino a poco tempo fa) i dati venivano generati per un progetto o uno studio specifico, senza considerare la possibilità di riutilizzarli. Dato che la modellazione predittiva e l'apprendimento da esperimenti passati dipendono dal riutilizzo dei dati, questo scenario è tutt'altro che ideale e deve cambiare con urgenza.

È qui che i principi guida del F.A.I.R. avranno il massimo impatto: all'inizio del percorso dei dati, quando questi vengono raccolti e archiviati. Non solo i dati F.A.I.R. avranno un impatto sui dati condivisi all'esterno dell'azienda, ma aiuteranno anche a prevenire i silos di dati interni, facilitando anche la vita degli scienziati. Più i dati sono F.A.I.R., migliore sarà la loro qualità e migliori saranno i risultati generati.

Adottare il F.A.I.R. non sarà facile, ma resta fondamentale

L'industria ha risposto rapidamente e ne ha avviato l'adozione. Grandi aziende come Janssen, Bayer, Novartis e Roche hanno intrapreso progetti F.A.I.R., impegnandosi per una buona gestione dei dati.

Ora, poiché la letteratura sul F.A.I.R. è piena di tecnicismi su standard, metadati e linee guida sulle migliori pratiche di gestione dei dati, potreste pensare: "Questo è un problema informatico". Ma no, la F.A.I.R. ha un impatto su tutti, dallo scienziato che lavora al banco al consumatore finale. Questa è una parte importante del trasformazione digitale che le aziende stanno implementando per rimanere competitive.

Tutti concordano sul fatto che i futuri leader di tutti i settori saranno i primi a sfruttare la potenza della scienza dei dati, dell'IA (Intelligenza Artificiale) e dell'intelligenza artificiale. Apprendimento automatico. Ma siete pronti? I vostri dati sono correttamente acquisiti, contestualizzati e curati? In altre parole, sono pronti per le macchine?

Ad esempio, il Journal of Biomedical Semantics ha pubblicato uno studio che presenta un modello di apprendimento automatico che utilizza la piattaforma Euretos AI e che è in grado di prevedere se un particolare farmaco sarà efficace nel trattamento di una specifica malattia. L'accesso alle risorse di dati pubblici consente a questo modello di prevedere con un'accuratezza di 78%, ovvero 12% in più rispetto ai precedenti modelli "all'avanguardia". Il vostro prossimo blockbuster potrebbe già essere nel vostro cassetto, se solo foste abbastanza organizzati da vederlo!

La creazione di dati F.A.I.R. offre al settore, e quindi al mondo intero, un'opportunità straordinaria. Cosa state aspettando? Prima iniziate, più sarete vicini a innovazioni che cambieranno la vita.

Non sapete da dove cominciare? Possiamo aiutarvi. 

Scarica la scheda informativa
Richiedi una demoCollegatevi con un esperto

Ulteriori schede informative

E-WorkBook Avanzamento

Migliorate la vostra produttività grazie all'acquisizione coerente dei dati, a potenti analisi e a rapide funzionalità di reporting.

L'urgenza di essere F.A.I.R.

Perché gli scienziati non utilizzano i dati al massimo del loro potenziale? In questo articolo discuteremo i fattori che ostacolano l'utilizzo dei dati...