

Gambar 1 Model Hierarki Bayesian
Pengertian Model Hierarki Bayesian
Jadi, model hirarki Bayesian adalah pendekatan statistik yang memungkinkan pemodelan data dengan struktur bertingkat (multilevel), dimana parameter pada setiap tingkat memiliki distribusi probabilitas sendiri (Gelman et al., 2013). Model ini menggabungkan informasi dari berbagai kelompok atau tingkat hierarki untuk menghasilkan estimasi yang lebih stabil dan akurat. Ciri-ciri utama dari model hierarki Bayesian ialah memiliki struktur yang bertingkat, dimana data memiliki kelompok atau klaster, seperti halnya siswa dalam sekolah atau pasien dalam rumah sakit (Bürkner, 2017). Selain itu, parameter dalam model ini bisa bervariasi antarkelompoknya dan estimasi parameter kelompok kecil ”ditarik” ke arah rata-rata global yang mengurangi overfitting.
Struktur Model Hierarki secara Umum
1. Tingkat Data (Likelihood)
- Untuk memodelkan observasi individu
- Rumus:

- Contoh:

2. Tingkat Kelompok (Prior)
- Untuk memodelkan variasi antarkelompok
- Rumus:

- Contoh:


3. Tingkat Hiperparameter (Hyperprior)
- Untuk memodelkan ketidakpastian parameter populasi
- Rumus:



- Contoh:



Tujuan Model Hierarki Bayesian
Analisis model hierarki Bayesian dilakukan untuk menangani struktur data kompleks dengan cara yang lebih fleksibel dan informatif dibanding metode klasik. Adapun tujuannya seperti untuk memodelkan data bertingkat (multilevel) dengan mengakomodasikan ketergantungan dalam kelompok, misalnya pasien dalam rumah sakit yang sama mungkin memiliki karakteristik yang serupa; mengestimasikan variabilitas antarkelompok dengan mengukur seberapa besar perbedaan antarkelompok, contohnya seperti variasi survival time antarpasien; mengestimasi kelompok dengan sampel kecil ’ditarik’ mendekati rata-rata global guna mengurangi risiko overfitting (Shrinkage Effect/Partial Pooling) (Kruschke, 2014); mengkuantifikasikan ketidakpastian di semua tingkat; menggabungkan informasi prior dan data; dan menghindari masalah pada data tidak seimbang (Gelman & Hill, 2007).
Contoh Penerapan dan Struktur Model Hierarki Bayesian
Salah satu contohnya seperti ketika kita ingin memprediksi nilai ujian siswa dari beberapa sekolah, dimana setiap sekolah memiliki karakteristik unik, tetapi kita juga ingin mempelajari pola umum di seluruh sekolah. Adapun struktur datanya adalah sebagai berikut:
- Tingkat 1 (Siswa): Nilai ujian individu
untuk siswa ke-i di sekolah ke-j - Tingkat 2 (Sekolah): Setiap sekolah memiliki efek acak
yang mempengaruhi nilai siswanya
Dari struktur data tersebut, maka diperoleh model hierarki:
a. Likelihood:

dimana
: Nilai ujian siswa ke-i di sekolah ke-j
: Efek sekolah ke-i di sekolah ke-j
: Varians dalam sekolah
Dapat dikatakan bahwa nilai siswa i di sekolah j mengikuti distribusi normal dengan rata-rata
dan varians
.
b. Priors untuk efek sekolah:

dimana
: Rata-rata populasi global
: Deviasi standar antarsekolah
Maka rata-rata sekolah
mengikuti distribusi normal dengan hiperparameter
(global mean) dan
(varians antarsekolah).
c. Hyperpriors:



Jadi, diketahui bahwa
menggukur variabilitas antarsekolah, dimana jika
maka semua sekolah dianggap identik. Ketika
mendekati
, berarti sekolah tersebut memiliki sedikit siswa.
Model Bayesian untuk Data Multilevel
Model hierarki Bayesian sangat berguna untuk data multilevel karena menggabungkan informasi antarkelompok tanpa mengabaikan variasi dan dapat menangani ketidakseimbangan data, seperti jumlah berbeda dalam kelompok, serta ketidakpastian di semua tingkat dimodelkan secara eksplisit (Gelman & Hill, 2007). Contohnya seperti analisis pendapatan per kapita di berbagai provinsi atau efektivitas obat di beberapa rumah sakit.

Gambar 2 Ilustrasi Model Hierarki Bayesian
Misalnya kita menggunakan contoh waktu kambuhnya infeksi pada pasien ginjal yang awalnya dipublikasikan oleh McGilchrist dan Aisbett (1991), dimana datanya terdiri dari 78 entri dengan 7 variabel (Bürkner, 2017).
Syntax

Output

Interpretasi:
- Jenis kelamin
menunjukkan efek yang signifikan secara statistik, dimana pasien perempuan memiliki waktu survival 2.42 unit lebih panjang dibanding laki-laki. Sedangkan usia
jenis penyakit
dan interaksi usia-jenis kelamin
tidak berpengaruh secara signifikan karena CI yang mencakup nilai nol. - Variabilitas antarpasien
menunjukkan ketidakpastian estimasi
dan hampir tidak ada variasi efek usia antarpasien (CI mencakup nol), sehingga hubungan usia-survival konsisten di semua pasien. - Nilai
menunjukkan bahwa tidak ada perbedaan signifikan antara model kompleks
dan model sederhana 
Referensi:
Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., & Rubin, D. B. (2013). Bayesian Data Analysis (3rd ed.). CRC Press.
Kruschke, J. K. (2014). Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan (2nd ed.). Academic Press.
