Sumber Data Besar dalam Kedokteran

by Kevin Hwang, MD, MPH; Diulas oleh Richard N. Fogoros, MD

Definisi sederhana data besar dalam kedokteran adalah "totalitas data yang berkaitan dengan perawatan kesehatan pasien dan kesejahteraan" (Raghupathi 2014). Tetapi apa sebenarnya jenis data ini, dan dari mana mereka berasal?

Berikut ini adalah gambaran umum tentang jenis dan sumber data besar yang menarik bagi penyedia layanan kesehatan, peneliti, pembayar, pembuat kebijakan, dan industri.

Kategori-kategori ini tidak saling eksklusif, karena data yang sama dapat berasal dari berbagai sumber.

Daftar ini juga tidak lengkap, karena aplikasi praktis dari analitik data besar pasti akan terus berkembang.

Sistem Informasi Klinis

Ini adalah sumber data klinis tradisional yang biasa dilihat oleh penyedia layanan kesehatan.

Catatan kesehatan elektronik (EHRs) mengumpulkan, menyimpan, dan menampilkan informasi seperti demografi, riwayat medis masa lalu, masalah medis aktif, imunisasi, alergi, obat-obatan, tanda-tanda vital, hasil dari tes laboratorium dan radiologi, laporan patologi, catatan kemajuan yang dibuat oleh perawatan kesehatan penyedia, dan dokumen administrasi dan keuangan
Rekam medis elektronik (EMR) tidak identik dengan EHR dan biasanya berhubungan dengan data yang disimpan dengan dokter tertentu.
Pertukaran informasi kesehatan berfungsi sebagai penghubung antara sistem informasi klinis yang berlainan

Pendaftar pasien, dikelola oleh organisasi perawatan kesehatan pada pasien mereka sendiri, sering dikaitkan dengan EHR. Pendaftar lain melacak imunisasi, kanker, trauma, dan masalah kesehatan masyarakat lainnya pada skala geografis yang lebih luas.

Portal pasien memungkinkan pasien mengakses informasi kesehatan pribadi yang disimpan dalam EHR organisasi perawatan kesehatan. Beberapa portal pasien juga memungkinkan pengguna untuk meminta isi ulang resep dan bertukar pesan elektronik aman dengan tim perawatan kesehatan.

Gudang data klinis mengumpulkan data tingkat pasien dari beberapa sistem informasi klinis, seperti EHR dan sumber lain yang tercantum di atas

Klaim Data Dari Payers

Pembayar publik (misalnya Medicare) dan pembayar swasta memiliki repositori besar data klaim pada penerima manfaat mereka. Beberapa perusahaan asuransi kesehatan kini juga menawarkan insentif untuk membagikan data kesehatan Anda.

Studi Penelitian

Database penelitian berisi informasi tentang peserta penelitian, perawatan eksperimental, dan hasil klinis. Studi besar biasanya disponsori oleh perusahaan farmasi atau lembaga pemerintah. Aplikasi obat yang dipersonalisasi adalah untuk mencocokkan pasien individu dengan perawatan yang efektif, berdasarkan pola dalam data uji klinis.

Pendekatan ini bergerak melampaui menerapkan prinsip kedokteran berbasis bukti, di mana penyedia layanan kesehatan menentukan apakah seorang pasien berbagi karakteristik yang luas (misalnya usia, jenis kelamin, ras, status klinis) dengan peserta uji coba. Dengan analitik data yang besar, adalah mungkin untuk memilih perawatan berdasarkan informasi yang lebih terperinci, seperti profil genetik kanker pasien (lihat di bawah).

Sistem pendukung keputusan klinis (CDSS) juga telah berkembang pesat dan sekarang merupakan bagian besar dari kecerdasan buatan (AI) dalam kedokteran.

Mereka menggunakan data pasien untuk membantu dokter dengan pengambilan keputusan mereka dan sering dikombinasikan dengan EHRs.

Database Genetik

Repositori informasi genetika manusia terus berakumulasi dengan cepat. Sejak Proyek Genom Manusia selesai pada tahun 2003, biaya sekuensing DNA manusia telah berkurang hingga satu juta kali lipat. Personal Genome Project (PGP), yang diluncurkan pada tahun 2005 oleh Harvard Medical School, berusaha mengurutkan dan mempublikasikan genom lengkap dari 100.000 sukarelawan dari seluruh dunia. PGP itu sendiri adalah contoh utama dari proyek data besar karena volume dan variasi data yang besar.

Genom pribadi mengandung sekitar 100 gigabyte data. Selain mengurutkan genom, PGP juga mengumpulkan data dari EHR, survei, dan profil mikrobiom.

Sejumlah perusahaan menawarkan sekuensing genetik langsung ke konsumen untuk kesehatan, sifat-sifat pribadi, dan farmakogenetika secara komersial.

Informasi pribadi ini dapat ditundukkan ke analitik data besar. Misalnya, 23andMe berhenti menawarkan laporan genetik yang berhubungan dengan kesehatan kepada pelanggan baru pada 22 November 2013, untuk mematuhi Administrasi Makanan dan Obat-Obatan AS. Namun, pada tahun 2015, perusahaan mulai menawarkan komponen kesehatan tertentu dari tes air liur genetik mereka lagi, kali ini dengan persetujuan FDA.

Catatan Publik

Pemerintah menyimpan catatan rinci tentang peristiwa yang berkaitan dengan kesehatan, seperti imigrasi, pernikahan, kelahiran, dan kematian. Sensus AS telah mengumpulkan sejumlah besar informasi setiap 10 tahun sejak 1790. Situs statistik Sensus memiliki 370 miliar sel pada 2013, dengan sekitar 11 miliar lebih ditambahkan setiap tahun.

Pencarian Web

Informasi pencarian web yang dikumpulkan oleh Google dan penyedia pencarian web lainnya dapat memberikan wawasan real-time yang berkaitan dengan kesehatan populasi. Namun, nilai data besar dari pola penelusuran web dapat ditingkatkan dengan menggabungkannya dengan sumber tradisional data kesehatan.

Media sosial

Facebook, Twitter, dan platform media sosial lainnya menghasilkan beragam data yang kaya sepanjang waktu, memberikan pandangan ke lokasi, perilaku kesehatan, emosi, dan interaksi sosial pengguna. Aplikasi media sosial big data untuk kesehatan masyarakat telah disebut sebagai deteksi penyakit digital atau epidemiologi digital. Twitter, misalnya, telah digunakan untuk menganalisis epidemi influenza di kalangan populasi umum.

Proyek Kesejahteraan Dunia yang dimulai di Universitas Pennsylvania adalah contoh lain dari mempelajari media sosial untuk memahami pengalaman dan kesehatan orang-orang dengan lebih baik. Proyek ini menyatukan para psikolog, ahli statistik, dan ilmuwan komputer yang menganalisis bahasa yang digunakan ketika berinteraksi secara online, misalnya, saat menulis pembaruan status di Facebook dan Twitter. Para ilmuwan mengamati bagaimana bahasa pengguna berhubungan dengan kesehatan dan kebahagiaan mereka. Kemajuan dalam pemrosesan bahasa alami dan pembelajaran mesin membantu upaya mereka. Publikasi terbaru dari University of Pennsylvania melihat cara memprediksi penyakit mental dengan menganalisis media sosial. Tampaknya gejala depresi dan kondisi mental-kesehatan lainnya dapat dideteksi dengan mempelajari penggunaan Internet kami. Para ilmuwan berharap di masa depan metode ini akan dapat mengidentifikasi dan membantu individu yang berisiko dengan lebih baik.

Internet of Things (IoT)

Kerangka besar informasi yang berhubungan dengan kesehatan juga dikumpulkan dan disimpan di perangkat seluler dan rumah .

Smartphone : Ribuan aplikasi mHealth menangkap informasi tentang aktivitas fisik pengguna, asupan nutrisi, pola tidur, emosi, dan parameter lainnya. Aplikasi ponsel asli (misalnya GPS, email, SMS) juga dapat memberikan petunjuk tentang status kesehatan seseorang.
Monitor dan perangkat yang dapat dipakai: Pedometer, akselerometer, kacamata, jam tangan, dan chip yang tertanam di bawah kulit juga mengumpulkan informasi yang berhubungan dengan kesehatan dan juga dapat mengirimnya ke cloud.
Perangkat telemedicine memungkinkan penyedia layanan kesehatan untuk memantau parameter pasien seperti tekanan darah, detak jantung, laju pernapasan, oksigenasi, suhu, penelusuran EKG, dan berat badan.

Transaksi keuangan

Transaksi kartu kredit pasien dimasukkan dalam model prediksi yang digunakan oleh Carolinas HealthCare System untuk mengidentifikasi pasien yang berisiko tinggi untuk diterima kembali ke rumah sakit. Penyedia perawatan kesehatan berbasis Charlotte menggunakan data besar untuk membagi pasien ke dalam berbagai kelompok, misalnya, berdasarkan penyakit dan lokasi geografis.

Implikasi Etis dan Privasi

Perlu disoroti bahwa, dalam beberapa kasus, mungkin ada implikasi etika dan privasi penting saat mengumpulkan dan mengakses data dalam perawatan kesehatan. Sumber data besar baru dapat meningkatkan pemahaman kita tentang apa dampak individu dan kesehatan penduduk, bagaimanapun, risiko yang berbeda perlu dipertimbangkan dan dipantau secara hati-hati. Kini telah diakui bahwa data yang sebelumnya dianggap anonim, dapat diidentifikasi kembali. Sebagai contoh, Profesor Latanya Sweeney dari Lab Privasi Data Harvard meninjau 1.130 sukarelawan yang terlibat dalam Proyek Genome Pribadi. Dia dan timnya dapat menyebutkan nama dengan tepat 42 persen dari peserta berdasarkan informasi yang mereka bagikan (kode pos, tanggal lahir, jenis kelamin). Pengetahuan ini dapat meningkatkan kesadaran kita tentang potensi risiko dan membantu kita membuat keputusan pembagian data yang lebih baik.

> Sumber:

> Conway M, O'Connor D. Media sosial, data besar, dan kesehatan mental: kemajuan saat ini dan implikasi etis. Opini Saat Ini dalam Psikologi 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Big data, hasil yang lebih besar. Jurnal Asosiasi Manajemen Informasi Kesehatan Amerika 2012; 83 (10): 38-43

> Guntuku S, Yaden D, Kern M, Ungar L, Eichstaedt J. Mendeteksi depresi dan penyakit mental di media sosial: tinjauan integratif . Opini Saat Ini dalam Ilmu Perilaku 2017; 18: 43-49.

> Lazer D, Kennedy R, King G, Vespignani A. Perumpamaan Google Flu: Perangkap dalam Analisis Data Besar . Sains 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Big data analytics dalam perawatan kesehatan: janji dan potensi al. Ilmu Pengetahuan dan Sistem Informasi Kesehatan 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Mengidentifikasi Para Peserta dalam Proyek Genome Pribadi berdasarkan Nama . Universitas Harvard. Lab Privasi Data. Buku Putih 1021-1. 24 April 2013.