Bias WEIRD dalam Psikologi: Apa Artinya untuk Pengukuran Kognitif di Indonesia?

Anjar Kartaputra
May 19
7 min read

Kategori: Insight Riset | Psikometri & Pengukuran Kognitif Estimasi baca: 7–9 menit

Ditulis oleh Tim Indies Lab — Anvesana Research Institute

Bayangkan kalau seluruh studi tentang nutrisi manusia hanya dilakukan pada orang Norwegia. Hasilnya mungkin valid untuk Norwegia — tapi rekomendasi diet yang lahir dari sana belum tentu cocok untuk orang Indonesia. Sebagian besar literatur psikologi modern, kalau dilihat baik-baik, kondisinya tidak jauh dari analogi itu.

Apa Itu Bias WEIRD

Pada 2010, tiga peneliti dari University of British Columbia — Joseph Henrich, Steven Heine, dan Ara Norenzayan — menerbitkan paper yang langsung jadi salah satu rujukan paling sering disitasi di psikologi: The Weirdest People in the World?¹. Mereka mengajukan satu pertanyaan yang sebenarnya sederhana, tapi konsekuensinya besar — siapa sebenarnya orang yang dipelajari psikologi mainstream?

Jawaban yang mereka temukan jadi singkatan yang dikenal sampai hari ini: WEIRD — Western, Educated, Industrialized, Rich, Democratic. Sebagian besar partisipan studi psikologi top-tier datang dari kampus-kampus negara Barat, dengan mahasiswa undergraduate sebagai populasi sampel paling sering. Henrich dan tim menelusuri enam jurnal flagship dalam psikologi (termasuk Journal of Personality and Social Psychology dan Psychological Science), dan menemukan bahwa sekitar 96% partisipan studi berasal dari masyarakat WEIRD, padahal populasi WEIRD hanya mewakili sekitar 12% manusia di dunia¹. Artinya: hampir seluruh klaim universal yang dibuat psikologi modern dibangun dari sampel yang, secara global, justru paling tidak representatif.

Penting digarisbawahi — ini bukan tuduhan dari satu pihak ke pihak lain. Ini adalah temuan ilmiah yang sejak terbitnya terus diperluas, diperdalam, dan didiskusikan secara terbuka oleh komunitas psikologi global, termasuk oleh peneliti dari negara-negara WEIRD itu sendiri.

Sepuluh Tahun Kemudian: Apakah Petanya Bergeser?

Sepuluh tahun setelah paper aslinya, Coren Apicella, Ara Norenzayan, dan Joseph Henrich menerbitkan review di Evolution and Human Behavior (2020) yang mengevaluasi apa yang berubah². Kabarnya campur: ada kemajuan, tapi belum cukup. Beberapa subfield mulai melakukan studi cross-cultural lebih sistematis, sampel non-WEIRD pelan-pelan masuk, dan kesadaran komunitas meningkat. Tapi distribusi sampel inti psikologi mainstream masih tetap berat ke WEIRD — perubahannya jauh lebih lambat dari yang dibutuhkan².

Pola yang sama terlihat di subfield pengukuran kognitif secara spesifik. Studi bibliometrik yang dilakukan Tim Indies Lab Anvesana terhadap 1.083 artikel pengukuran kognitif yang terbit di jurnal internasional antara 2011–2025 menemukan bahwa Jerman sendirian menyumbang sekitar 36–37% dari seluruh artikel, dan negara-negara WEIRD secara kolektif mendominasi top 10⁵. Bidang ini tidak sedang berekspansi liar ke konteks budaya baru — ia justru terkonsentrasi di kantong-kantong WEIRD yang sudah lama dominan.

Kenapa Ini Penting untuk Pengukuran Kognitif

Bias WEIRD jadi masalah serius khususnya di pengukuran kognitif karena tiga alasan yang saling terkait.

Pertama, norma yang tidak transferable. Norma — yaitu skor rata-rata pada populasi rujukan yang dipakai untuk menafsirkan skor individu — dibangun dari sampel tertentu di waktu tertentu. Kalau norma sebuah tes inteligensi dibangun dari sampel mahasiswa Jerman atau Amerika, lalu tes itu dipakai untuk menafsirkan skor anak SMP di Sukabumi, pertanyaannya jadi: norma siapa yang kita pakai untuk menentukan "rata-rata"? Artinya untuk praktisi: skor yang sama bisa diinterpretasikan sangat berbeda tergantung norma rujukan — dan norma yang salah konteks bisa menghasilkan keputusan yang juga salah.
Kedua, konstruk yang mungkin berbeda makna. Konstruk psikologis — misalnya "kecerdasan", "self-esteem", atau "regulasi emosi" — adalah ide yang dibangun oleh peneliti untuk menjelaskan fenomena. Yang sering dilupakan: definisi konstruk itu sendiri sebagian ditentukan oleh konteks budaya tempat ia lahir. Riset lintas budaya yang dilakukan Richard Nisbett dan kolega menunjukkan bahwa cara orang dari konteks budaya berbeda memproses informasi, memberi perhatian, dan menyelesaikan masalah bisa berbeda secara sistematis³. "Kecerdasan" yang diukur di satu konteks belum tentu menangkap dimensi yang sama di konteks lain — bukan karena salah satu lebih pintar, tapi karena konstruknya sendiri berbentuk berbeda.
Ketiga, definisi "kecerdasan" yang dipengaruhi nilai budaya. Apa yang dianggap sebagai "berpikir baik" di satu masyarakat — kecepatan, individualitas analitis, abstraksi — belum tentu jadi penanda kompetensi kognitif di masyarakat lain yang mungkin lebih menekankan kebijaksanaan kontekstual, harmoni relasional, atau kemampuan membaca situasi sosial³. Ini bukan klaim relativis ekstrem. Ini sekadar pengakuan bahwa instrumen tidak pernah netral secara budaya — ia selalu membawa asumsi tentang "apa yang penting diukur".

Contoh Konkret — Sebuah Ilustrasi

Untuk menggambarkan masalahnya tanpa mengarang data, mari pakai contoh hipotetik yang realistis.

Bayangkan ada tes kemampuan kognitif yang divalidasi di sampel mahasiswa Eropa. Reliabilitas internalnya tinggi (α = 0.91 — artinya hasilnya stabil kalau diukur ulang). Validitas konstruk juga oke — analisis faktor menunjukkan struktur yang bersih. Secara statistik, tes ini bagus.

Lalu tes itu diterjemahkan ke Bahasa Indonesia dan dipakai di sekolah-sekolah Indonesia. Apa yang bisa terjadi? Beberapa kemungkinan, semua tanpa "menyalahkan" tes aslinya: item-item yang melibatkan konteks visual sehari-hari (misalnya gambar yang familiar di Eropa tapi asing di Indonesia) jadi item yang lebih sulit di sini bukan karena kognisi pesertanya lemah, tapi karena familiaritasnya berbeda. Item verbal yang mengandalkan idiom atau kategori semantik tertentu mungkin tidak punya padanan langsung. Bahkan format instruksi tes — yang di konteks asalnya mengasumsikan pengalaman tertentu dengan testing terstandar — mungkin perlu adaptasi sebelum pesertanya bisa berinteraksi dengan tesnya secara setara.

Hasilnya: tes yang sama-sama "valid secara statistik" di kedua tempat bisa mengukur hal yang berbeda secara konstruk — dan skornya tidak bisa dibandingkan satu-banding-satu antar konteks. Catatan: ilustrasi di atas adalah skenario hipotetik untuk menjelaskan mekanisme, bukan klaim faktual tentang tes spesifik.

Apa yang Perlu Berubah

Kabar baiknya: komunitas psikologi global sudah mengidentifikasi arah perbaikannya, dan banyak rekomendasinya sudah ada di tangan praktisi maupun peneliti Indonesia. Tiga hal yang menonjol.

Riset lintas budaya yang sistematis — bukan sekadar studi satu sampel di satu negara, tapi desain yang sengaja membandingkan beberapa konteks budaya. Apicella dan kolega menyebut ini sebagai pergerakan menuju "global laboratory" di mana riset psikologi tidak lagi menganggap satu populasi sebagai default, dan menganggap populasi lain sebagai "varian"². Posisi Indonesia di sini menarik: dengan keragaman etnis, bahasa, dan konteks geografis yang besar, Indonesia sendiri sebenarnya adalah laboratorium lintas budaya internal.
Adaptasi berbasis bukti, bukan sekadar translasi. Salah satu rujukan paling sering dipakai untuk adaptasi instrumen psikologi adalah guidelines dari International Test Commission (ITC), yang memberikan kerangka kerja sistematis untuk adaptasi lintas bahasa dan lintas budaya⁴. Beaton dan kolega juga memberikan protokol enam langkah yang banyak dipakai di health sciences dan psikologi — mencakup forward translation, expert panel review, backward translation, pre-testing, dan validasi psikometri pada populasi target⁶. Inti pesannya: menerjemahkan instrumen ke Bahasa Indonesia hanyalah langkah pertama dari proses yang jauh lebih panjang. Tanpa validasi konstruk pada populasi target — bukan sekadar reliabilitas — kita tidak benar-benar tahu apakah instrumen itu mengukur hal yang sama.
Pengembangan instrumen yang dibangun with praktisi lokal. Ini melengkapi dua poin di atas, bukan menggantikannya. Praktisi yang menggunakan instrumen di lapangan adalah orang pertama yang melihat di mana sebuah alat ukur "kehilangan jejak" — di mana item terasa janggal, di mana hasil tidak konsisten dengan observasi klinis, di mana respons peserta menunjukkan ada masalah pemahaman yang tidak tertangkap oleh skor saja. Kalau pengalaman lapangan ini diperlakukan sebagai data — bukan sekadar keluhan — proses adaptasi instrumen jadi jauh lebih akurat.

Konteks Indonesia

Buat psikolog dan biro asesmen yang setiap hari pakai instrumen di lapangan, beberapa pertanyaan ini mungkin sudah lama mengganggu: kenapa skor klien ini tidak konsisten dengan apa yang saya amati di sesi? Kenapa item ini terasa janggal kalau dibacakan ke peserta yang lebih senior? Apakah hasil ini bisa saya pakai untuk rekomendasi penempatan yang bobotnya signifikan?

Pertanyaan-pertanyaan itu, kalau dipikirkan baik-baik, adalah bibit dari riset adaptasi lintas budaya yang serius. Ia tidak menuntut kamu jadi peneliti penuh waktu — tapi pengamatanmu di lapangan adalah informasi yang justru sedang dicari oleh komunitas riset psikometri global.

Anvesana Research Institute bekerja di persimpangan ini — antara pertanyaan-pertanyaan yang muncul dari praktisi di lapangan dan rigor metodologis yang dibutuhkan untuk menjawabnya. Salah satu prinsip kerja kami sederhana: alat ukur bukan tujuan, ia adalah kendaraan. Yang lebih penting adalah pertanyaan tentang fenomena manusia yang kita coba pahami, dan apakah alat yang kita pakai bisa benar-benar menangkap fenomena itu di konteks Indonesia. Sebagian besar tantangan psikometri Indonesia hari ini bukan kekurangan tes — tapi kekurangan tes yang dibangun dengan dan untuk konteks Indonesia.

Penutup

Bias WEIRD bukan keluhan terhadap psikologi mainstream. Ia adalah pengakuan ilmiah yang membuka ruang baru — termasuk untuk komunitas riset psikologi Indonesia. Kalau kamu psikolog, peneliti, atau mahasiswa yang sedang menggunakan, mengadaptasi, atau membangun instrumen di Indonesia — pertanyaan yang bisa kamu ajukan minggu ini sederhana: norma siapa yang sedang saya pakai untuk menafsirkan skor klien saya, dan apakah norma itu benar-benar mewakili populasi yang sedang saya layani? Jawaban dari pertanyaan itu, dan keputusan yang lahir darinya, adalah salah satu cara paling konkret kita semua bisa ikut menggeser peta yang selama ini berat sebelah.

Referensi

Henrich, J., Heine, S. J., & Norenzayan, A. (2010). The weirdest people in the world? Behavioral and Brain Sciences, 33(2–3), 61–83. https://doi.org/10.1017/S0140525X0999152X
Apicella, C., Norenzayan, A., & Henrich, J. (2020). Beyond WEIRD: A review of the last decade and a look ahead to the global laboratory of the future. Evolution and Human Behavior, 41(5), 319–329. https://doi.org/10.1016/j.evolhumbehav.2020.07.015
Nisbett, R. E., Aronson, J., Blair, C., Dickens, W., Flynn, J., Halpern, D. F., & Turkheimer, E. (2012). Intelligence: New findings and theoretical developments. American Psychologist, 67(2), 130–159. https://doi.org/10.1037/a0026699
International Test Commission. (2017). ITC Guidelines for translating and adapting tests (2nd ed.). https://www.intestcom.org/page/16
Bagaskara, R. S., Fadhilah, A. R., & Azzahra, S. R. (2026). Global trends in cognitive measurement: A bibliometric analysis. Anvesana Research Institute. (Internal report — perlu di-cross-check status publikasi formal/preprint.)
Beaton, D. E., Bombardier, C., Guillemin, F., & Ferraz, M. B. (2000). Guidelines for the process of cross-cultural adaptation of self-report measures. Spine, 25(24), 3186–3191. https://doi.org/10.1097/00007632-200012150-00014

Tentang Kontributor

Artikel ini ditulis oleh Tim Indies Lab — Insights & Discovery Lab di Anvesana Research Institute. Indies Lab adalah unit yang bertugas menangkap, menganalisis, dan menerjemahkan fenomena psikologis menjadi pertanyaan riset yang bisa dijawab — sekaligus menjadi pintu masuk bagi data yang akan diolah menjadi instrumen, intervensi, dan rekomendasi kebijakan dalam ekosistem Anvesana.

Salah satu fokus kerja Indies Lab adalah memetakan lanskap riset psikometri global — termasuk diskusi tentang fairness pengukuran, dominasi WEIRD, dan posisi riset Indonesia di percakapan ilmiah internasional — agar agenda riset Anvesana selalu beririsan dengan kebutuhan praktisi dan kebutuhan pembangunan pengetahuan global.

Anvesana Research Institute adalah lembaga riset psikologi terapan independen berbasis di Yogyakarta yang berfokus pada tiga jalur kerja yang saling melengkapi: memahami fenomena psikologis manusia melalui riset (explanatory research), mengembangkan dan memvalidasi alat ukur psikometri (psychometric research), dan merancang serta menguji intervensi berbasis bukti (intervention research).