Viri velikih podatkov v medicini

Viri velikih podatkov v medicini

Preprosta opredelitev velikih podatkov v medicini je "celota podatkov, povezanih z zdravstveno oskrbo in dobro počutje bolnikov" (Raghupathi 2014). Kaj točno so te vrste podatkov in od kod prihajajo?

V nadaljevanju je prikazan širok pregled vrst in virov velikih podatkov, zanimivih za ponudnike zdravstvenih storitev, raziskovalce, plačnike, oblikovalce politik in industrijo.

Te kategorije se ne izključujejo, ker lahko isti podatki izvirajo iz različnih virov.

Ta seznam ni izčrpen, saj se bo praktična uporaba velike analize podatkov zagotovo še naprej širila.

Klinični informacijski sistemi

To so tradicionalni viri kliničnih podatkov, ki so jih zdravstveni delavci navadili na ogled.

Zahteva podatke iz plačnikov

Javni plačniki (npr. Medicare) in zasebni plačniki imajo velike zbirke podatkov o škodah svojih upravičencev. Nekateri zdravstveni zavarovanci zdaj ponujajo tudi spodbude za izmenjavo zdravstvenih podatkov.

Raziskovalne študije

Raziskovalne podatkovne baze vsebujejo informacije o udeležencih študija, eksperimentalnih zdravljenjih in kliničnih izidih. Velike študije običajno sponzorirajo farmacevtske družbe ali vladne agencije. Uporaba prilagojenih zdravil je, da se posameznim bolnikom ujemajo z učinkovitimi zdravljenji, ki temeljijo na vzorcih v podatkih kliničnih preskušanj.

Ta pristop presega uporabo načel, ki temeljijo na dokazih, s katerimi ponudnik zdravstvenih storitev ugotovi, ali pacient deli udeležence v preskušanju široke značilnosti (npr. Starost, spol, raso, klinični status). Z veliko podatkovno analizo je mogoče izbrati zdravljenje, ki temelji na veliko bolj natančnih informacijah, kot je genetski profil pacientovega raka (glejte spodaj).

Klinični sistemi za podporo odločanju (CDSS) se hitro razvijajo in zdaj predstavljajo velik del umetne inteligence (AI) v medicini.

Uporabljajo podatke o bolnikih, ki pomagajo zdravnikom s svojim odločanjem in se pogosto povezujejo z EHR.

Genetske podatkovne baze

Repozitorij človeških genskih informacij se še naprej naglo kopiči. Ker je bil projekt Human Genome končan leta 2003, so se stroški človeškega zaporedja DNK zmanjšali za milijonkrat. Projekt osebnega gena (PGP), ki ga je leta 2005 ustanovila Harvardova medicinska šola, skuša zaporedje in objavo celotnih genomov 100.000 prostovoljcev z vsega sveta. Sama PGP je odličen primer velikega podatkovnega projekta zaradi velikega obsega in raznolikosti podatkov.

Osebni genom vsebuje približno 100 gigabajtov podatkov. Poleg zaporedja genomov PGP zbira tudi podatke iz EHR-jev, anket in mikrobioloških profilov.

Številna podjetja ponujajo genetsko zaporedje za neposredno zdravje, osebne lastnosti in farmakogenetiko na komercialni podlagi.

Te osebne podatke bi lahko podprli z veliko podatkovno analizo. Na primer, 23andMe je od 22. novembra 2013 prenehala ponuditi novim odjemalcem, ki so povezana z zdravjem, da se uskladijo z ameriško administracijo za zdravila in zdravila. Vendar pa je družba leta 2015 začela ponujati nekatere zdravstvene sestavine svojega genskega testa sline, tokrat z odobritvijo FDA.

Javni zapisi

Vlada vodi podrobne evidence dogodkov, povezanih z zdravjem, kot so priseljevanje, poroka, rojstvo in smrt. Popis ZDA je zbral velike količine informacij vsakih 10 let od leta 1790. Spletna stran s statističnimi podatki o popisih je od leta 2013 znašala 370 milijard celic, pri čemer je približno 11 milijard več dodanih letno.

Spletna iskanja

Podatki o spletnem iskanju, ki jih je zbral Google in drugi ponudniki spletnih iskanj, bi lahko zagotovili vpogled v realnem času v zvezi z zdravjem prebivalstva. Vendar pa se lahko vrednost velikih podatkov iz vzorcev spletnega iskanja izboljša z združevanjem s tradicionalnimi viri zdravstvenih podatkov.

Socialni mediji

Facebook, Twitter in druge platforme družbenih medijev ustvarjajo bogato paleto podatkov, ki omogočajo ogled lokacije, zdravja, čustev in družbenih interakcij uporabnikov. Uporaba velikih podatkov o socialnih medijih za javno zdravje je bila označena kot odkrivanje digitalnih bolezni ali digitalna epidemiologija. Na primer, Twitter je uporabil za analizo epidemij gripe med splošno populacijo.

Projekt Svetovnega blagostanja, ki se je začel na Univerzi v Pennsylvaniji, je še en primer preučevanja socialnih medijev, da bi bolje razumeli izkušnje in zdravje ljudi. Projekt združuje psihologe, statistike in računalnike, ki analizirajo jezik, ki se uporablja pri interakciji na spletu, na primer pri pisanju statusnih posodobitev na Facebooku in Twitteru. Znanstveniki opazujejo, kako se jezik uporabnikov nanaša na njihovo zdravje in srečo. Napredek pri procesiranju naravnega jezika in strojnega učenja pomaga pri njihovih prizadevanjih. Nedavna publikacija Univerze v Pennsylvaniji je proučila načine za napovedovanje duševnih bolezni s pomočjo analiz socialnih medijev. Zdi se, da se lahko s preučevanjem uporabe interneta zaznavajo simptomi depresije in drugi pogoji duševnega zdravja. Znanstveniki upajo, da bodo te metode v prihodnosti lahko bolje identificirale in pomagale ogroženim posameznikom.

Internet stvari (IoT)

Množični podatki o zdravstvenih informacijah se zbirajo in shranjujejo tudi na mobilnih in domačih napravah .

Finančne transakcije

Transakcije s kreditnimi karticami bolnikov so vključene v napovedne modele, ki jih uporablja sistem Carolinas HealthCare, da bi identificirali bolnike, ki so izpostavljeni visokemu tveganju, da bi bili ponovno sprejeti v bolnišnico. Zdravstveni delavec iz Charlotte uporablja velike podatke za razdelitev pacientov v različne skupine, na primer na podlagi bolezni in geografske lokacije.

Etične in zasebne posledice

Treba je poudariti, da lahko v nekaterih primerih pride do pomembnih etičnih in zasebnih posledic pri zbiranju in dostopu do podatkov v zdravstvenem varstvu. Novi viri velikih podatkov lahko izboljšajo naše razumevanje vpliva zdravja posameznikov in prebivalstva, vendar je treba različna tveganja skrbno pretehtati in spremljati. Zdaj je bilo tudi priznano, da se lahko podatki, ki so bili prej anonimni, ponovno identificirajo. Na primer, profesor Latanya Sweeney iz Harvardove podatkovne laboratorije za varstvo podatkov je pregledala 1.130 prostovoljcev, vključenih v projekt osebnega gena. Ona in njena ekipa sta lahko pravilno imenovali 42 odstotkov udeležencev na podlagi podatkov, ki so jih dali v skupno rabo (poštna številka, datum rojstva, spol). To znanje lahko poveča našo zavest o morebitnih tveganjih in nam pomaga izboljšati odločitve o izmenjavi podatkov.

> Viri:

> Conway M, O'Connor D. Družbeni mediji, veliki podatki in duševno zdravje: sedanji napredek in etični vplivi. Trenutno mnenje v psihologiji 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Veliki podatki, večji rezultati. Journal of The American Health Management Information Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Odkrivanje depresije in duševnih bolezni na socialnih medijih: integrativni pregled . Sedanje mnenje v vedah vedah 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Parabola o Google Glu: pasti v veliki analizi podatkov . Znanost 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Velika analiza podatkov v zdravstvu: obljubljajo in potenti al. Zdravstvene informacijske znanosti in sistemi 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Prepoznavanje udeležencev v projektu osebnega gena po imenu . Harvard University. Laboratorij za varstvo podatkov. Bela knjiga 1021-1. 24. aprila 2013.