Kilder til store data i medicin

by Kevin Hwang, MD, MPH; Anmeldt af Richard N. Fogoros, MD

En simpel definition af store data i medicin er "totaliteten af data relateret til patientens sundhedspleje og trivsel" (Raghupathi 2014). Men hvad er disse typer af data, og hvor kommer de fra?

Følgende er et bredt overblik over typer og kilder til store data af interesse for sundhedsudbydere, forskere, betalere, politikere og industri.

Disse kategorier udelukker ikke hinanden, fordi de samme data kan stamme fra en række forskellige kilder.

Denne liste er heller ikke udtømmende, fordi den praktiske anvendelse af stor dataanalyse vil fortsætte med at udvide.

Kliniske informationssystemer

Disse er traditionelle kilder til kliniske data, som sundhedsudbydere er vant til at se.

Elektroniske journaler (EHR'er) indsamler, opbevarer og viser oplysninger som demografi, tidligere medicinsk historie, aktive medicinske problemer, immuniseringer, allergier, medicin, vitale tegn, resultater fra laboratorie- og radiologiprøve, patologirapporter, fremskridt notater skabt af sundhedsvæsenet udbydere og administrative og finansielle dokumenter
Elektroniske lægejournaler (EMR'er) er ikke identiske med EHR'er og vedrører normalt data, der er lagret hos en bestemt læge.
Udveksling af sundhedsinformation tjener som knudepunkter mellem forskellige kliniske informationssystemer

Patientregistre, der opretholdes af sundhedsvæsenets organisationer på deres egne patienter, er ofte forbundet med EMR. Andre registre sporer immuniseringer, kræft, traumer og andre folkesundhedsproblemer på en bredere geografisk skala.

Patientportaler giver patienter adgang til personlige sundhedsoplysninger, der er lagret i en sundhedsorganisations EMR. Nogle patientportaler giver også brugere mulighed for at anmode om påfyldning af recept og udveksle sikre elektroniske meddelelser med sundhedsplejeholdet.

Kliniske datalager opsamler patientdata fra flere kliniske informationssystemer, såsom EHR'er og andre kilder, der er anført ovenfor

Kravdata fra betalere

Offentlige betalere (f.eks. Medicare) og private betalere har store repositorier af kravdata på deres modtagere. Nogle sygesikringsselskaber tilbyder nu også incitamenter til at dele dine sundhedsdata.

Forskningsstudier

Forskningsdatabaser indeholder oplysninger om undersøgelsesdeltagere, eksperimentelle behandlinger og kliniske resultater. Store undersøgelser sponsoreres normalt af lægemiddelvirksomheder eller offentlige myndigheder. En ansøgning om personlig medicin er at matche individuelle patienter med effektive behandlinger baseret på mønstre i kliniske forsøgsdata.

Denne tilgang går ud over anvendelse af evidensbaserede medicinprincipper, hvorved en sundhedsudbyder bestemmer, om en patient deler brede karakteristika (f.eks. Alder, køn, race, klinisk status) hos forsøgspartnere. Med stor dataanalyse er det muligt at vælge en behandling baseret på meget mere granulær information, som f.eks. Den genetiske profil for en patients kræft (se nedenfor).

Kliniske beslutningsstøttesystemer (CDSS) har også udviklet sig hurtigt og udgør nu en stor del af kunstig intelligens (AI) inden for medicin.

De bruger patientdata til at hjælpe klinikere med deres beslutningstagning og bliver ofte kombineret med EHR'er.

Genetiske databaser

Lageret af menneskelige genetiske oplysninger fortsætter med at akkumulere i et hurtigt tempo. Siden Human Genome Project blev afsluttet i 2003, er omkostningerne ved human DNA-sekventering reduceret med en million gange. Personal Genome Project (PGP), der blev lanceret i 2005 af Harvard Medical School, søger at rækkefølge og offentliggøre de fuldstændige genomer af 100.000 frivillige fra hele verden. PGP'en er et godt eksempel på stort dataprojekt på grund af den store mængde og mangfoldigheden af data.

Et personligt genom indeholder ca. 100 gigabyte data. Ud over sekventeringsgenererne samler PGP også data fra EHR'er, undersøgelser og mikrobiome profiler.

En række virksomheder tilbyder genetisk sekventering direkte til forbrugere til sundhed, personlige træk og farmakogenetik på kommerciel basis.

Disse personlige oplysninger kan underkastes stor dataanalyse. For eksempel stoppede 23andMe at tilbyde sundhedsrelaterede genetiske rapporter til nye kunder pr. 22. november 2013 for at overholde amerikanske Food and Drug Administration. Imidlertid begyndte virksomheden i 2015 at tilbyde visse sundhedskomponenter af deres genetiske spytprøve igen, denne gang med FDA's godkendelse.

Offentlige Records

Regeringen holder detaljerede oversigter over hændelser relateret til sundhed, såsom indvandring, ægteskab, fødsel og død. US-folketællingen har samlet enorme mængder information hvert tiende år siden 1790. Folketællings statistikwebsted havde 370 milliarder celler fra 2013, med ca. 11 milliarder mere tilføjet årligt.

Websøgninger

Websøgning oplysninger indsamlet af Google og andre websøgning udbydere kunne give real-time indsigt i forbindelse med befolkningens sundhed. Værdien af store data fra websøgemønstre kan dog forbedres ved at kombinere det med traditionelle kilder til sundhedsdata.

Sociale medier

Facebook, Twitter og andre sociale medier platforme genererer et stort udvalg af data døgnet rundt, hvilket giver en oversigt over brugerens placeringer, helbredstilstande, følelser og sociale interaktioner. Anvendelsen af sociale medier store data til folkesundhed er blevet omtalt som digital sygdomsdetektering eller digital epidemiologi. Twitter, for eksempel, er blevet brugt til at analysere influenzapidemier blandt befolkningen generelt.

Verdensvelvesprojektet, der startede ved University of Pennsylvania, er et andet eksempel på at studere sociale medier for at forstå folks oplevelse og sundhed bedre. Projektet samler psykologer, statistikere og edb-forskere, der analyserer sprog, der bruges, når de interagerer online, for eksempel når man skriver statusopdateringer på Facebook og Twitter. Forskere overholder hvordan brugernes sprog relaterer til deres sundhed og lykke. Fremskridt i naturlig sprogbehandling og maskinindlæring hjælper med deres bestræbelser. En nylig offentliggørelse fra University of Pennsylvania kiggede på måder at forudsige psykisk sygdom ved at analysere sociale medier. Det ser ud til, at symptomer på depression og andre psykiske sundhedstilstande kan påvises ved at studere vores brug af internettet. Forskere håber i fremtiden, at disse metoder vil være i stand til bedre at identificere og hjælpe risikopersoner.

The Things of Things (IoT)

Massive trofæer af sundhedsrelateret information indsamles og opbevares også på mobile enheder og hjemmeapparater .

Smartphones : Tusindvis af mHealth-apps indfanger information om brugerens fysiske aktivitet, ernæringsindtagelse, søvnmønstre, følelser og andre parametre. Native cellular apps (f.eks. GPS, email, teksting) kan også give spor om en persons sundhedstilstand.
Bærbare skærme og enheder: Skridttællere, accelerometre, briller, ure og chips indlejret under huden samler også sundhedsrelateret information og kan også sende dem til skyen.
Telemedicinske anordninger giver sundhedsudbydere mulighed for at overvåge patienters parametre såsom blodtryk, puls, respirationshastighed, iltning, temperatur, EKG-spor og vægt.

Finansielle transaktioner

Patienternes kreditkorttransaktioner indgår i de prædiktive modeller, der anvendes af Carolinas HealthCare System til at identificere patienter, der er i høj risiko for at blive genindleveret til hospitalet. Den Charlotte-baserede sundhedspleje udbyder bruger store data til at opdele patienter i forskellige grupper, for eksempel baseret på sygdom og geografisk placering.

Etiske og personlige konsekvenser

Det skal understreges, at der i nogle tilfælde kan være vigtige etiske og personlige konsekvenser ved indsamling og adgang til data i sundhedsvæsenet. Nye kilder til store data kan forbedre vores forståelse for, hvilke virkninger individer og befolkningens sundhed har, men forskellige risici skal nøje overvejes og overvåges. Det er nu også blevet anerkendt, at data, der tidligere blev anset for anonyme, kan genidentificeres. For eksempel har professor Latanya Sweeney fra Harvard's Data Privacy Lab gennemgået 1.130 frivillige involveret i Personal Genome Project. Hun og hendes hold kunne korrekt navngive 42 procent af deltagerne ud fra de informationer de delte (postnummer, fødselsdato, køn). Denne viden kan øge bevidstheden om potentielle risici og hjælpe os med at træffe bedre dataudvekslingsbeslutninger.

> Kilder:

> Conway M, O'Connor D. Sociale medier, store data og mental sundhed: nuværende fremskridt og etiske konsekvenser. Nuværende udtalelse i psykologi 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Store data, større resultater. Journal of American Health Information Management Association 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Påvisning af depression og psykisk sygdom på sociale medier: en integreret gennemgang . Nuværende udtalelse i Behavioral Sciences 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Lignelsen om Google-influenza: Fælder i stor dataanalyse . Science 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Stor dataanalyse i sundhedsvæsenet: løfte og potenti al. Sundhedsinformationsvidenskab og -systemer 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifikation af deltagere i det personlige genomprojekt ved navn . Harvard Universitet. Data Privacy Lab. Hvidbog 1021-1. 24. april 2013.