Model Hierarki Bayesian

Gambar 1 Model Hierarki Bayesian

Pengertian Model Hierarki Bayesian

Jadi, model hirarki Bayesian adalah pendekatan statistik yang memungkinkan pemodelan data dengan struktur bertingkat (multilevel), dimana parameter pada setiap tingkat memiliki distribusi probabilitas sendiri (Gelman et al., 2013). Model ini menggabungkan informasi dari berbagai kelompok atau tingkat hierarki untuk menghasilkan estimasi yang lebih stabil dan akurat. Ciri-ciri utama dari model hierarki Bayesian ialah memiliki struktur yang bertingkat, dimana data memiliki kelompok atau klaster, seperti halnya siswa dalam sekolah atau pasien dalam rumah sakit (Bürkner, 2017). Selain itu, parameter dalam model ini bisa bervariasi antarkelompoknya dan estimasi parameter kelompok kecil ”ditarik” ke arah rata-rata global yang mengurangi overfitting.

Struktur Model Hierarki secara Umum

1. Tingkat Data (Likelihood)

  • Untuk memodelkan observasi individu
  • Rumus:
  • Contoh:

2. Tingkat Kelompok (Prior)

  • Untuk memodelkan variasi antarkelompok
  • Rumus:
  • Contoh:

3. Tingkat Hiperparameter (Hyperprior)

  • Untuk memodelkan ketidakpastian parameter populasi
  • Rumus:
  • Contoh:

Tujuan Model Hierarki Bayesian

Analisis model hierarki Bayesian dilakukan untuk menangani struktur data kompleks dengan cara yang lebih fleksibel dan informatif dibanding metode klasik. Adapun tujuannya seperti untuk memodelkan data bertingkat (multilevel) dengan mengakomodasikan ketergantungan dalam kelompok, misalnya pasien dalam rumah sakit yang sama mungkin memiliki karakteristik yang serupa; mengestimasikan variabilitas antarkelompok dengan mengukur seberapa besar perbedaan antarkelompok, contohnya seperti variasi survival time antarpasien; mengestimasi kelompok dengan sampel kecil ’ditarik’ mendekati rata-rata global guna mengurangi risiko overfitting (Shrinkage Effect/Partial Pooling) (Kruschke, 2014); mengkuantifikasikan ketidakpastian di semua tingkat; menggabungkan informasi prior dan data; dan menghindari masalah pada data tidak seimbang (Gelman & Hill, 2007).

Contoh Penerapan dan Struktur Model Hierarki Bayesian

Salah satu contohnya seperti ketika kita ingin memprediksi nilai ujian siswa dari beberapa sekolah, dimana setiap sekolah memiliki karakteristik unik, tetapi kita juga ingin mempelajari pola umum di seluruh sekolah. Adapun struktur datanya adalah sebagai berikut:

  • Tingkat 1 (Siswa): Nilai ujian individu untuk siswa ke-i di sekolah ke-j
  • Tingkat 2 (Sekolah): Setiap sekolah memiliki efek acak yang mempengaruhi nilai siswanya

Dari struktur data tersebut, maka diperoleh model hierarki:

a. Likelihood:

dimana

: Nilai ujian siswa ke-i di sekolah ke-j

: Efek sekolah ke-i di sekolah ke-j

: Varians dalam sekolah

Dapat dikatakan bahwa nilai siswa i di sekolah j mengikuti distribusi normal dengan rata-rata  dan varians .

b. Priors untuk efek sekolah:

dimana

: Rata-rata populasi global

: Deviasi standar antarsekolah

Maka rata-rata sekolah mengikuti distribusi normal dengan hiperparameter (global mean) dan (varians antarsekolah).

c. Hyperpriors:

Jadi, diketahui bahwa menggukur variabilitas antarsekolah, dimana jika maka semua sekolah dianggap identik. Ketika  mendekati , berarti sekolah tersebut memiliki sedikit siswa.

Model Bayesian untuk Data Multilevel

Model hierarki Bayesian sangat berguna untuk data multilevel karena menggabungkan informasi antarkelompok tanpa mengabaikan variasi dan dapat menangani ketidakseimbangan data, seperti jumlah berbeda dalam kelompok, serta ketidakpastian di semua tingkat dimodelkan secara eksplisit (Gelman & Hill, 2007). Contohnya seperti analisis pendapatan per kapita di berbagai provinsi atau efektivitas obat di beberapa rumah sakit.

Gambar 2 Ilustrasi Model Hierarki Bayesian

Misalnya kita menggunakan contoh waktu kambuhnya infeksi pada pasien ginjal yang awalnya dipublikasikan oleh McGilchrist dan Aisbett (1991), dimana datanya terdiri dari 78 entri dengan 7 variabel (Bürkner, 2017).

Syntax

Output

Interpretasi:

  1. Jenis kelamin menunjukkan efek yang signifikan secara statistik, dimana pasien perempuan memiliki waktu survival 2.42 unit lebih panjang dibanding laki-laki. Sedangkan usia jenis penyakit dan interaksi usia-jenis kelamin tidak berpengaruh secara signifikan karena CI yang mencakup nilai nol.
  2. Variabilitas antarpasien menunjukkan ketidakpastian estimasi dan hampir tidak ada variasi efek usia antarpasien (CI mencakup nol), sehingga hubungan usia-survival konsisten di semua pasien.
  3. Nilai menunjukkan bahwa tidak ada perbedaan signifikan antara model kompleks dan model sederhana

Referensi:

Bürkner, P.-C. (2017). brms: An R Package for Bayesian Multilevel Models Using Stan. Journal of Statistical Software80(1), 1–28.

Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., & Rubin, D. B. (2013). Bayesian Data Analysis (3rd ed.). CRC Press.

Gelman, A., & Hill, J. (2007). Data Analysis Using Regression and Multilevel/Hierarchical Models. Cambridge University Press.

Kruschke, J. K. (2014). Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan (2nd ed.). Academic Press.

Leave a Reply