Tutorial SPSS


Pengenalan dasar-dasar statistik perbandingan
Oleh: Hurul Ain, S. T
(Yula)


Sampah yang masuk, sampah yang keluar
(Garbage in, garbage out)
Komputer adalah alat yang sangat luar biasa berguna untuk mempermudah dan mempercepat perhitungan dan analisa data. Namun seperti alat-alat yang lain, program analisa data based on computer bisa saja mengalami kesalahan penggunaan. Jika kita salah memasukan data atau menggunakan prosedur analisis yang kurang tepat, maka hasilnya pun tidak akan berarti apa-apa, tidak membantu, dan bahkan akan menyesatkan kita. Perhatikan peraturan pertama dari komputer: Sampah yang masuk, sampah pula yang yang keluar.
Meski terperinci dan lebih dari sekedar step by step, buku ini tetap saja tidak sepenuhnya dapat menggantikan kebutuhan Anda akan buku-buku statistik ataupun bimbingan orang yang lebih ahli. Ingat, jika kita salah dalam memilih prosedur analisis, hasilnya tidak akan berarti apa-apa.
Jika Anda mengalami kesulitan dalam penggunakan berbagai sorftware statistik dan matematik, Warna Data melayani konsultasi terbatas secara gratis. Namun jika Anda menginginkan konsultasi ataupun pelatihan yang lebih komprehensif, maka hal tersebut dapat kita lakukan dengan biaya yang sangat terjangkau.

Kapan Anda memerlukan perhitungan statistik?
Saat menganalisis data, tujuan Anda sebenarnya sangatlah sederhana: Anda ingin menarik kesimpulan yang mungkin dan kuat hanya berdasarkan dari sejumlah sampel yang terbatas. Untuk dapat melakukan ini, Anda harus dapat mengatasi 2 persoalan di bawah ini:
  • Jika kita melakukan suatu eksperimen, maka perbedaan yang terlihat pada pengamatan dapat saja timbul karena adanya variasi antar sampel (misal ada tikus yang kurus, sedang, gemuk, sangat gemuk/ekstrim), namun bisa saja perbedaan itu terjadi karena adanya kesalahan dalam eksperimen (misal salah pemberian dosis perlakuan, adanya kebocoran pada tabung instrumen, dsb). Hal seperti ini tentu saja menyulitkan kita untuk membedakan perbedaan yang sesungguhnya dari perbedaan yang terjadi karena variasi random dan eksperimental error.
  • Otak manusia cenderung memaksakan untuk membuat pola tertentu, bahkan jika data-data tersebut benar-benar diambil secara acak/random. Kecenderungan alami manusia (terutama dengan data yang mereka miliki sendiri) adalah menyimpulkan bahwa benar-benar ada perbedaan yang nyata, dan meminimalisir kontribusi dari adanya variasi alami antar sampel. Prinsip statistik mencegah kita dari membuat kesalahan semacam ini.
Analisis statistik akan sangat diperlukan pada saat kita mengalami kesulitan untuk menentukan apakah perbedaan yang terlihat benar-benar nyata, ataukah perbedaan tersebut hanya dikarenakan adanya variasi alami antar sampel (random variability) atau mungkin juga dikarenakan adanya ketidaktelitian saat melakukan eksperimen.
Namun dalam kenyataannya, para ilmuwan tidak dapat menghindari adanya variabilitas yang cukup besar. Meski demikian, mereka juga harus memperhatikan adanya perbedaan meski sangat kecil. Metode statistik sangat diperlukan untuk menarik kesimpulan yang valid dari data semacam itu.
Mungkin ada diantara Anda yang masih sulit untuk memahami penjelasan di atas. Kalau Anda termasuk orang yang belum paham, lupakan saja dan jangan dianggap beban karena kita akan membahasnya dengan lebih terperinci pada bab yang akan datang. 

Konsep Kunci: Mengambil sampel dari populasi
(Sampling from a population)
Ide dasar statistik adalah simpel: kita ingin melakukan perhitungan dengan sejumlah data yang telah kita kumpulkan sebagai sampel, untuk selanjutnya membuat kesimpulan yang lebih umum tentang populasi tempat kita mengambil sampel tersebut.Untuk melakukan ini, ahli statistik telah mengembangkan metode berdasarkan model yang sederhana:
Anggap data-data yang Anda miliki benar-benar diambil secara random dari suatu populasi. Analisa sampel tersebut, kemudian gunakan hasilnya untuk membuat inferensi (kesimpulan) tentang populasinya. Model ini adalah gambaran akurat untuk beberapa situasi. Sebagai contoh, pada kasus quality control, sampel harus benar-benar dipilih secara random dari sebuah populasi yang besar (produk yang sangat banyak). Namun pada kasus tertentu seperti pasien klinis, kita tidak perlu untuk mengambil sampel secara acak dari populasi yang besar (karena hal ini sangat sulit untuk dilakukan), dan biasanya akan dapat dimaklumi jika Anda mengambil kesimpulan dari pasien yang Anda temui dan pelajari untuk selanjutnya memberlakukan kesimpulan tersebut pada populasi yang lebih besar dengan kondisi pasien yang hampir sama.
Seperti telah dijelaskan di atas, pada eksperimen tertentu Anda tidak perlu benar-benar mengambil sampel dari populasi. Meski demikian, Anda masih diperbolehkan untuk membuat kesimpulan yang lebih umum hanya berdasarkan data yang Anda pelajari tersebut. Konsep sampel dan populasi pada kasus tersebut masih dapat berlaku jika Anda mendefinisikan sampel sebagai data yang telah Anda kumpulkan, dan populasi sebagai data yang akan Anda kumpulkan jika Anda mengulangi eksperimen tersebut sampai beberapa kali (tak terbatas).
Sebagai catatan, istilah sampel dalam statistik memiliki definisi yang spesifik, yang sangat berbeda dengan definisi yang umum. Mempelajari makna baru untuk kata-kata yang sering digunakan adalah bagian dari tantangan dalam belajar statistik.
Kebutuhan akan sampel yang independen Adalah tidak cukup bila sampel Anda diambil dari suatu populasi. Tes statistik juga mengasumsikan bahwa setiap subyek (atau setiap unit ekserimen) diambil secara independen satu dengan yang lainnya. Konsep independensi mungkin sulit untuk dibayangkan. Bayangkan tiga situasi di bawah ini:
ü Anda mengukur tekanan darah hewan. Anda memiliki lima hewan dalam setiap kelompoknya, dan mengukur tekanan darah sebanyak tiga kali pada setiap hewannya. Ini bukan berarti bahwa Anda memiliki 15 hasil pengukuran yang independen, karena pengukuran sebanyak tiga kali yang Anda lakukan pada satu hewan akan lebih dekat atau hampir sama satu sama lain jika dibandingkan dengan pengukuran yang berasal dari hewan yang lain. Pada kasus semacam ini Anda harus merata-rata tiga pengukuran dari setiap hewanya. Berarti sekarang Anda memiliki lima nilai rata-rata yang independen satu dengan yang lainnya.
ü Anda telah melakukan tiga kali eksperimen biokimia (sebut saja eksperimen A, B, dan C), dengan perincian setiap eksperimen Anda lakukan sebanyak tiga kali/rangkap tiga. Jadi, eksperimen A Anda lakukan sebanyak tiga kali, begitu juga dengan eksperimen B dan C. Hal ini bukan berarti bahwa Anda telah memiliki sembilan nilai yang independen, karena kesalahan (error) pada saat mempersiapkan reagen untuk satu jenis eksperimen dapat mempengaruhi semua hasil dari eksperimen rangkap tiga yang telah Anda lakukan tersebut. Jika Anda merata-rata nilai hasil eksperimen rangkap tiga tersebut pada setiap jenis eksperimennya, maka berarti Anda telah memiliki tiga nilai mean yang independen.
ü Anda melakukan sebuah studi klinis dengan merekrut sepuluh pasien dari sebuah rumah sakit yang berada dalam kota dan sepuluh lagi pasien yang berasal dari rumah sakit di pinggiran kota. Hal ini bukan berarti Anda memiliki 20 subyek yang independen dari satu populasi. Data-data dari sepuluh pasien dari rumah sakit dalam kota mungkin hampir sama satu sama lain jika dibandingkan dengan data-data pasien dari rumah sakit di pinggiran kota. Pada kasus semacam ini berarti Anda telah mengambil sampel dari dua populasi, dan harus memperhatikan kenyataan tersebut (bahwa Anda telah mengambil sampel dari dua populasi) dalam analisis Anda.
Data disebut independen satu sama lain jika semua faktor acak (radom factor) yang menyebabkan sebuah nilai data menjadi terlalu tinggi (besar) atau terlalu rendah (kecil) hanya akan berpengaruh pada satu nilai data tersebut. Jika sebuah faktor acak/random factor (yang tidak Anda perhitungkan dalam analisis data yang bersangkutan) dapat mempengaruhi lebih dari satu nilai data (meski tidak berpengaruh pada semua nilai data), kemudian dapat dikatakan bahwa data-data tersebut tidaklah independen.
Yang menjadi pertanyaan adalah, mengapa data-data yang kita gunakan sebagai sampel harus independen satu dengan yang lainnya? Kembali ke konsep awal bahwa data-data sampel haruslah acak. Acak disini sangat berhubungan dengan independensi. Artinya, setiap data mempunyai peluang yang sama untuk terpilih dan tidak terpengaruh dan mempengaruhi peluang data yang lain untuk terpilih sebagai sampel berikutnya. Anda akan lebih jelas mempelajari konsep acak independen dengan jalan membandingkannya dengan konsep data yang tidak independen. Kalau data tidak independen, itu berarti bahwa jika Anda ingin mengambil sepuluh data untuk Anda jadikan sampel, maka data pertama yang terpilih akan mensyaratakan data tertentu untuk dijadikan sampel data yang kedua, ketiga, dan seterusnya. Yang demikian ini tidak dapat dipertanggungjawabkan secara statistik. Mengapa? Karena hasil dari kita meneliti data-data sampel akan kita terapkan pada populasi. Artinya, kesimpulan hasil penelitian/perhitungan dari sampel tesebut akan sama, hampir sama, atau tidak berbeda jauh jika kita melakukan penelitian lagi dengan mengambil sampel secara acak dari populasi tersebut. 

Bagaimana Anda dapat menggunakan statistik untuk membuat inferensi/kesimpulan tentang populasi dari sampelnya?
Para ahli statistik telah membagi tiga pendekatan dasar untuk membuat kesimpulan tentang populasi dari beberapa sampel data:
Metode pertama adalah mengasumsikan bahwa populasi tersebut mengikuti sebuah distribusi, yang dikenal dengan distribusi Gaussian (jika divisualisasikan dengan kurva maka akan berbentuk seperti lonceng). Distribusi ini juga sering disebut dengan distribusi normal. Jika populasi Anda memiliki distribusi seperti itu, maka tes statistik membolehkan Anda membuat inferensi/kesimpulan tentang mean (dan property yang lain) dari populasi tersebut. Tes statistik yang paling sering digunakan mengasumsikan bahwa populasinya berdistribusi Gaussian/normal.
Metode kedua adalah membuat rangking atau mengurutkan nilai data dari yang paling rendah ke yang paling tinggi, kemudian membandingkan distribusi urutan tersebut. Prinsip ini adalah dasar dari tes nonparametrik, yang sering digunakan untuk menganalisa data dari distribusi non-Gaussian.
Metode ketiga dikenal dengan istilah resampling. Dengan metode ini, Anda membuat sebuah populasi, dengan berulang kali melakukan sampling nilai dari sampel Anda. Metode ini akan lebih mudah dipahami dengan sebuah contoh. Anggap Anda memiliki sampel yang terdiri dari lima nilai, dan Anda ingin mengetahui seberapa dekat mean sampel tersebut dari mean populasi yang sesungguhnya. Tulis setiap nilai sampel tersebut pada kartu (setiap nilai ditulis pada sebuah kartu), dan masukan kartu-kartu tersebut kedalam sebuah topi sulap (bisa saja tempat yang lain). Buatlah pseudo sampel (sampel semu) dengan jalan mengambil sebuah kartu dari dalam topi (tanpa melihat), di catat nilainya, lalu dikembalikan lagi. Lakukan sebanyak lima kali (N=5) dengan jalan seperti di atas. Anda mungkin mengambil nilai yang sama lebih dari satu kali. Ketika pekerjaan mengambil sampel dengan kartu terasa membosankan, gunakan saja program komputer. Distribusi mean dari sampel-sampel yang diperoleh dari program komputer akan memberikan Anda informasi tentang seberapa akurat Anda mengetahui mean dari seluruh populasi. Ide resampling ini mungkin sulit untuk dibayangkan. Untuk mempelajari pendekatan ini terhadap statistik, baca materi panduan yang tersedia di www.resample.com. SPSS tidak menyediakan prosedur tes yang berdasar pada resampling. Metode resampling sangat berkaitan erat dengan metode bootstrapping.

Batasan statistik
Model statistik adalah simpel: Ramalkan kemungkinan berdasarkan sampel yang Anda kumpulkan untuk situasi yang lebih umum, dengan menganggap bahwa sampel Anda diambil secara acak dari sebuah populasi yang besar. Masalahnya adalah, inferensi statistik hanya dapat diterapkan pada populasi dimana sampel Anda didapatkan. Namun pada kenyataannya, Anda tentunya ingin membuat kesimpulan yang dapat diterapkan bahkan di luar populasi tempat Anda mengambil sampel. Sebagai contoh, Anda melakukan sebuah percobaan di laboratorium sebanyak tiga kali. Semua eksperimen menggunakan persiapan sel yang sama, buffer yang sama, dan perlatan yang sama pula. Inferensi statistik membolehkan Anda untuk membuat kesimpulan tentang apa yang akan terjadi jika Anda mengulangi eksperimen tersebut beberapa kali (tak terbatas) dengan menggunakan persiapan sel yang sama, menggunakan buffer yang sama, dan peralatan yang sama pula dengan semua yang digunakan pada eksperimen yang pertama. Akan tetapi mungkin Anda ingin membuat kesimpulan yang lebih jauh tentang apa yang akan terjadi jika orang lain mengulangi eksperimen yang Anda lakukan dengan sumber sel yang berbeda, buffer yang baru dibuat, dan menggunakan instrumen/peralatan yang berbeda. Namun sialnya, perhitungan statistik tidak dapat membantu untuk membuat kesimpulan yang lebih jauh seperti ini. Anda mesti menggunakan pertimbangan ilmiah dan akal sehat untuk membuat inferensi diluar batasan statistik. Dengan begitu, logika statistik hanyalah merupakan bagian dari penafsiran data saja.

Distribusi Gaussian (distribusi normal)
Ketika banyak faktor acak independen berperilaku aditip untuk menciptakan variabilitas, data akan mengikuti distribusi yang berbentuk lonceng, yang kemudian disebut dengan distribusi Gaussian (distribusi normal), yang diilustrasikan dalam gambar di bawah ini. Panel sebelah kiri menunjukan distribusi dari sampel data yang besar. Setiap nilai ditunjukan sebagai titik (dot), yang puncaknya bergerak secara horizontal untuk menghindari overlap yang terlalu banyak. Ini disebut grafik kolom scatter. Distribusi frekwensi, atau histogram dari nilai-nilai tersebut ditunjukan pada panel yang tengah. Ini menunjukan distribusi yang sebenarnya dari nilai dalam contoh kusus ini. Panel yang kanan menunjukan distribusi Gaussian yang ideal.
Ditribusi Gaussian memiliki beberapa properti matematik yang spesial yang membentuk basis banyak tes statistik. Meskipun tidak ada data yang mengikuti ideal matematik secara persis, banyak data mengikuti distribusi yang hampir mendekati Gaussian.
Distribusi Gaussian juga sering disebut dengan distribusi Normal. Jangan bingung dengan kata “normal” dengan arti yang biasa. Distribusi Gaussian memainkan peran yang sentral dalam statistik karena hubungan matematik yang dikenal dengan teori limit pusat (Central Limit Theorem).
Untuk memahami teorema ini, ikuti eksperimen khayal ini:
1. Buat sebuah populasi denga distribusi yang telah diketahui (yang tidak harus Gaussian).
2. Secara acak ambil beberapa sampel dari populasi tersebut. Tabulasikan mean/rata dari sampel-sampel tersebut.
3. Gambar histogram distribusi frekwensi mean teresbut.
Teori limit pusat mengatakan bahwa jika sampel-sapel Anda cukup besar, distribusi mean-nya akan mengikuti distribusi Gaussian, bahkan meski populasinya bukanlah Gaussian. Karena kebanyakan tes statistik (seperti t test dan ANOVA) hanya berkepentingan dengan perbedaan antar mean, teori limit pusat memperbolehkan tes-tes tersebut bekerja dengan baik meski ketika populasinya bukanlah Gaussian. Agar ini menjadi valid, maka populasinya haruslah secara rasional cukup besar.
Seberapa besar? Ini tergantng pada seberapa jauh distribusi populasi tersebut berbeda dari distribusi Gaussian. Jika populasi tidak memiliki distribusi yang benar-benar aneh, ukuran sampel sekitar sepuluh atau sekitarnya pada umumnya cukup untuk Assuming the population doesn't have a
really weird distribution, a sample size of ten or so is generally enough to
menerapkan teori limit pusat. Untuk mempelajari lebih detil tentang mengapa distribusi Gaussian ideal sangat berguna, baca tentang Central Limit Theorem dalam beberapa teks statistik.

Interval keyakinan (Confidence intervals)
Confidence interval untuk mean
Mean atau rata-rata yang Anda hitung dari sampel tidak sepenuhnya sama persis dengan mean atau rata-rata dari populasinya. Besarnya perbedaan antar keduanya (mean sampel dan mean populasi) tergantung pada besarnya ukuran (jumlah) sampel dan simpangan baku (variability/standard deviation) dari sampel. Jika sampel Anda kecil (sedikit) dan sangat bervariasi, maka mean (rata-rata) sampel kemungkinan besar akan berbeda jauh dari mean (rata-rata) populasinya. Namun jika sampel Anda besar dan sedikit bervariasi (simpangan bakunya kecil), maka mean sampel kemungkinan besar akan sangat dekat dengan mean populasinya. Perhitungan statistik mengkombinasikan ukuran (jumlah) sampel dan simpangan baku (standard deviation) untuk menghasilkan interval keyakinan (confidence interval/CI) bagi mean populasi. Anda dapat menghitung interval untuk berapa saja tingkat keyakinan yang Anda inginkan, namun tingkat keyakinan sebesar 95% adalah yang sangat umum digunakan. Jika Anda menganggap bahwa sampel yang Anda miliki benar-benar secara acak Anda kumpulkan dari suatu populasi (yang mengikuti distribusi normal/Gaussian), maka Anda dapat yakin 95% bahwa confidence interval yang Anda hasilkan benar-benar mengandung mean populasi yang sesungguhnya, dan kemungkinan bahwa CI tersebut tidak mengandung mean populasi yang sesungguhnya hanyalah 5% saja. Namun karena Anda biasanya tidak tahu besarnya mean populasi yang sesungguhnya, maka Anda tidak akan pernah tahu kapan ini terjadi.
Confidence intervals untuk parameter lain
Para ahli statistik telah menurunkan metode di atas guna menghasilkan interval keyakinan (confidence intervals) untuk hampir semua situasi. Sebagai contoh, ketika membandingkan beberapa kelompok, Anda dapat menghitung tingkat keyakinan (CI) 95% bagi perbedaan mean antar kelompok tersebut. Logikanya sederhana saja. Ada 95% kemungkinan bahwa interval yang Anda hitung mengandung perbedaan mean yang sesungguhnya antar kelompok tersebut. Dengan logika yang hampir sama, metode ini berlaku untuk menghitung tingkat keyakinan (CI) 95% bagi proporsi rasio, best-fit slope of linear regression, dan hampir semua parameter statistik yang lain.
Tidak ada yang spesial dengan 95% (Nothing special about 95%)
Perlu diketahui bahwa tidak ada sesuatu yang magis dengan angka 95%. Anda dapat menghitung confidence iterval (CI) untuk berapa saja derajat keyakinan yang Anda inginkan. Jika Anda ingin lebih yakin bahwa interval yang akan Anda hitung benar-benar mengandung parameter yang sesungguhnya, maka interval tersebut akan menjadi lebih lebar. Jadi, interval keyakinan (CI) 99% sudah jelas akan lebih lebar dari CI 95%, dan CI 90% akan lebih sempit dari CI 95%.

P values
Apa itu P value?
Anggap bahwa Anda telah mengumpulkan data dari dua sampel hewan yang diberi perlakuan yang sama. Anda mengukur enzim pada masing-masing plasma hewan tersebut, dan Anda menemukan bahwa mean atau rata-rata enzime dari kedua hewan tersebut berbeda. Anda ingin mengetahui apakah perbedaan mean enzim tersebut dikarenakan oleh efek obat—dengan kata lain apakah kedua populasi benar-benar memiliki mean yang berbeda. Mengamati mean sampel yang berbeda tidaklah cukup untuk meyakinkan Anda dan membuat kesimpulan bahwa kedua populasi memiliki mean yang berbeda. Mungkin saja sebenarnya kedua populasi memiliki mean yang sama (obat-obatan tersebut tidak memiliki efek pada enzmi yang Anda ukur), dan perbedaan yang terlihat tersebut hanyalah faktor kebetulan semata. Tidak ada cara yang dapat meyakinkan Anda bahwa perbedaan yang Anda amati tersebut mecerminkan adanya perbedaan yang sesungguhnya atau bahwa perbedaan tersebut hanyalah kebetulan karena adanya sampling acak (random sapling). Satu-satunya cara yang dapat Anda lakukan adalah menghitung probabilitasnya. Perhitungan statistik dapat menjawab pertanyaan ini: Jika populasi benar-benar memiliki mean yang sama, berapakah probabilitasnya (kemungkinanya) untuk mendapatkan perbedaan sebesar itu (atau lebih besar lagi) diantara mean sampel dalam sebuah eksperimen semacam ini?
Jawaban dari pertanyaan di atas disebut dengan nilai P atau P value.
P value adalah sebuah probabilitas atau kemungkinan, dengan nilai berkisar dari 0 ke 1. Jika nilai P (P value) kecil, maka Anda akan menyimpulkan bahwa perbedaan antar mean sampel tidaklah karena kebetulan semata. Dengan kata lain, Anda dapat menyimpulkan bahwa populasi tersebut benar-benar memiliki mean yang berbeda.

Apa itu hipotesis nol (Ho)?
Ketika para ahli membicarakan nilai P (P values), mereka menggunakan terminologi hipotesis nol (null hypothesis). Hipotesis nol menyatakan bahwa tidak ada perbedan antar kelompok. Dengan menggunakan terminologi tersebut, Anda dapat mendefinisikan nilai P sebagai probabilitas untuk mendapatkan perbedaan sebesar (atau lebih besar) dari yang Anda amati jika hipotesis nol benar.
Salah penafsiran yang biasa dilakukan tentang nilai P
Banyak orang salah menafsirkan nilai P. Jika nilai P sebesar 0,03, hal itu berarti bahwa ada 3% kemungkinan untuk mendapatkan perbedaan sebesar yang Anda amati meskipun jika kedua mean populasi identik (hipotesis nol benar). Kalau Anda mengartikan demikian, ini sama artinya dengan Anda mencoba menyimpulkan bahwa ada 97% kemungkinan bahwa perbedaan yang Anda amati mencerminkan perbedaan antar populasi yang sesungguhnya, dan 3% kemungkinan bahwa perbedaan tersebut hanyalah suatu kebetulan saja. Namun demikian, ini adalah kesimpulan yang keliru. Yang dapt Anda katakan adalah bahwa pengambilan sampel secara acak dari (random sampling) dari populasi yang identik akan menyebabkan perbedaan yang lebih kecil dari apa yang Anda amati dalam 97% eksperimen, dan lebih bedar dari yang Anda amati dalam 3% eksperimen. Perbedaan ini mungkin akan lebih jelas Anda pahami setelah Anda membaca “Perspective Bayesian dalam menterjemahkan signifikansi statistik” pada bahasan selanjutnya.
Nilai P satu sisi vs dua sisi (One- vs. two-tail P values)
Ketika membandingkan dua kelompok, Anda harus membedakan antara nilai P satu sisi dan dua sisi. Mulailah dengan hipotesis nol yang menyatakan bahwa kedua populasi benar-benar sama, dan perbedaan yang terlihat antar mean sampel hanyalah suatu kebetulan saja.
Catatan: Contoh ini adalah untuk t tes yang tidak berpasangan, yang membandingkan dua kelompok yang independen. Ide yang sama dapat diterapkan untuk tes statistik yang lain.
v Nilai P dua sisi menjawab pertanyaan ini: Anggap hipotesis nol benar, berapakah kemungkinannya bahwa sampel yang Anda pilih secara acak akan memiliki mean sebesar (atau lebih besar) dari yang Anda dapatkan dalam eksperimen ini dengan kelompok yang lain memiliki mean yang lebih besar?
v Untuk menterjemahkan nilai P satu sisi, Anda harus memprediksikan kelompok mana yang akan memiliki mean yang lebih besar sebelum mengumpulkan data-data. Nilai P satu sisi menjawab pertanyaan ini: Anggap hipotesis nol benar, berapakah kemungkinan bahwa sampel yang dipilih secara acak akan memiliki mean sebesar (atau lebih besar) yang Anda dapatkan dalam eksperimen ini dengan kelompok yang telah ditetapkan akan memiliki mean yang lebih besar?
Nilai P satu sisi tepat digunakan hanya ketika data sebelumnya, keterbatasan fisik, atau akal sehat mengatakan pada Anda bahwa perbedaan tersebut, jika ada, hanya akan berjalan satu arah. Intinya bukan apakah Anda mengharapkan perbedaan itu terjadi—yang Anda coba ketahui dengan melakukan eksperimen. Intinya adalah apakah Anda harus menterjemahkan lenaikan dan penurunan dengan cara yang sama.
Anda hanya boleh memilih nilai P satu sisi ketika dua di bawah ini benar.
*Anda harus memprediksikan grup atau kelompok mana yang akan memiliki mean (atau proporsi ) yang lebih besar sebelum Anda mengumpulkan data-data.
*Jika gup/kelompok lain terbukti memiliki mean yang lebih besar – meski selisihnya sedikit sekali –Anda tetap harus rela/legowo untuk mengakui perbedaan tersebut sebagai hal yang mungkin.
Nilai P dua sisi tepat digunakan pada situasi sebagai berikut:
o Hubungan/ relationship antara nilai P (P values) dan interval keyakinan (confidence intervals) akan lebih mudah dipahami menggunakan nilai P dua sisi.
o Beberapa tes membandingkan tiga atau lebih grup/kelompok, yang membuat konsep sisi/ekor (tails) tidak tepat (lebih-lebih nilai P (P value) yang memiliki sisi/ekor yang banyak. Nilai P dua sisi lebih konsisten dengan nilai P yang dilaporakan oleh tes-tes ini.
Memilih nilai P satu sisi dapat menyebabkan dilema. Apa yang akan Anda lakukan jika Anda memilih untuk menggunakan nilai P satu sisi, terlihat perbedaan yang besar antar mean, tapi grup/kelompok yang “salah” memiliki mean yang lebih besar? Dengan kata lain, perbedaan yang terlihat berlawanan dengan hipotesis percobaan Anda. Untuk lebih tegasnya, Anda mesti menyimpulkan bahwa perbedaan tersebut hanyalah karena kebetulan semata, mestki perbedaan tersebut sangatlah besar sekali. Meskipun tergoda, tidaklah fair kalau Anda kemudian merubahnya menjadi nilai P dua sisi atau merbah arah hipotesis percobaan Anda. Untuk menghindari situasi ini, selalu gunakan nilai P dua sisi.

Hypothesis testing and statistical significance
Statistical hypothesis testing
Banyak penalaran statistik dikembangkan dalam konteks quality control dimana Anda membutuhkan jawaban tegas “Ya” atau “Tidak” dari setiap analisis. Apakah Anda menerima atau menolak batch? Logika yang digunakan untuk menjawabnya disebut dengan hypothesis testing.
Pertama-tama, definisikan ambang batas (threshold) nilai P sebelum Anda melakukan percobaan/eksperimen. Idealnya, Anda harus menetapkan nilai tersebut berdasarkan konsekwensi relatif untuk kehilangan perbedaan yang sesungguhnya atau menemukan perbedaan yang salah. Dalam prakteknya, nilai ambang batas/threshold value (disebut dengan a) hampir selalu ditetapkan dengan angka 0.05 (sebuah nilai sembarang yang telah diadopsi/digunakan secara luas).
Selanjutnya, definisikan hipotesis nol (null hypothesis). Jika Anda membandingkan dua rata-rata (dua mean), hipotesis nol-nya adalah bahwa kedua populasi memiliki mean yang sama. Dalam hampir semua situasi, hipotesis nol merupakan kebalikan hipotesis eksperimen yang menyatakan bahwa rata-rata (mean) keduanya berasal dari populasi yang berbeda (mean keduanya berbeda/tidak sama).
Sekarang, lakukan tes yang sesuai untuk menghitung nilai P. Jika nilai P kurang dari ambang batas (threshold), nyatakan bahwa Anda “menolak hipotesis nol” dan bahwa perbedaan tersebut “signifikan secara statistik”. Jika nilai P lebih besar dari nilai ambang batas (treshold), nyatakan bahwa Anda “tidak menolak hipotesis nol” dan bahwa perbedaan tersebut “tidak signifikan secara statistik”. Meski demikian, Anda tidak dapat menyimpulkan bahwa hipotesis nol benar. Yang dapat Anda simpulkan adalah bahwa Anda tidak memiliki bukti yang cukup untuk menerima hipotesis nol.

Statistical significance in science
Istilah signifikan adalah menggiurkan, dan mudah untuk disalahinterpretasikan. Dengan menggunakan definisi konvensional dengan alpha= 0.05, suatu hasil dikatakan signifikan secara statistik ketika hasil tersebut akan terjadi kurang dari 5% kali jika populasinya benar-benar identik. Mudah untuk meembaca sangat jauh kedalam kata significant karena penggunaan kata secara statistik memiliki arti yang sepenuhnya berbeda dari arti biasanya. Hanya karena sebuah perbedaan signifikan secara statistik, tidak berarti bahwa secara biologis atau secara klinis penting atau menarik. because the
statistical use of the word has a meaning entirely distinct from its usual
meaning. Just because a difference is statistically significant does not mean
that it is biologically or clinically important or interesting. Lebih dari itu, sebuah hasil yang tidak signifikan secara statistik, (dalam eksperimen pertama) boleh jadi akan menjadi sangat penting.
Jika sebuah hasil signifikan secara statistikm maka ada dua penjelasan yang mungkin:
  • Populasi mereka (yang bersangkutan) adalah identik, jadi benar-benar tidak ada perbedaan. Secara kebetulan, Anda mendapatkan niali yang lebih besar dalam salah satu grup dan nilai yang lebih kecil dalam grup yang lain. Mendapatkan hasil yang signifikan secara statistik ketika populasi yang bersangkutan identik disebut dengan membuat “error tipe I”. Jika Anda mendefinisikan signifikan secara statistik pada mean “P<0.05”,>
  • Populasi mereka (yang bersangkutan) memang berbeda, jadi kesimpulan Anda benar. Perbedaan tersebut kemungkinan cukup bedat untuk menjadi menarik secara statistik. Atau, ini hanya sangat kecil dan sepele.
Outliers
Apa itu outlier?
Ketika menganalisa data, kadang-kadang Anda menemukan sebuah data yang nilainya sangat jauh dengan yang lainya. Nilai seperti itu disebut dengan outlier, istilah yang biasanya tidak didefinisikan secara tegas/pasti. Jika Anda mendapati sebuah outlier, mungkin Anda tergoda untuk menghapusnya dari analsis. Sebelum Anda melakukan hal yang lebih jauh, tanyakan pada diri Anda sendiri pertanyaan-pertanyaan sebagai berikut:
Ø Apakah nilai tersebut telah Anda entry ke dalam komputer dengan benar? Jika ternyata telah terjadi kesalahan dalam proses pemasukan data, segera perbaiki.
Ø Apakah mungkin ada kesalah eksperimen dalam menghasilkan nilai tersebut? Sebagai contoh, jika Anda menganggap sebuah botol kelihatan aneh atau lucu, kemudian Anda melakukan pembenaran untuk tidak memasukan nilai yang dihasilkan oleh botol tersebut tanpa sebelumnya melakukan suatu perhitungan.
Ø Apakah mungkin outlier tersebut disebabkan oleh biological diversity? Jika nilai tersebut dperoleh dari orang atau hewan lain, mungkin outlier tersebut memang nilai yang benar. Jadi nilai tersebut merupakan outlier yang bukan disebabkan oleh kesalahan eksperimen, tapi lebih disebabkan karena individu tersebut kemungkinan memang berbeda dengan yang lainnya. Jika demikian halnya, ini adalah penemuan data yang sangat menarik!
Jika jawaban Anda untuk ketiga pertanyaan di atas adalah “tidak”, maka Anda harus segera memutuskan apa akan Anda lakukan terhadap outlier tersebut. Ada dua kemungkinan yang dapat Anda lakukan:
v Kemungkinan yang pertama adalah bahwa outlier tersebut hanyalah suatu kebetulan saja. Jika kasusnya seperti ini, Anda harus mengikutsertakan nilai tersebut dalam analisis Anda. Nilai outlier tersebut diperoleh dari distribusi yang sama, meskipun nilainya sangat jauh berbeda, jadi harus tetap diikutsertakan.
v Kemungkinan yang lain adalah outlier tersebut muncul karena suatu kesalahan – pipetting yang buruk, tegangan yang anjlok/tidak stabil, lubang pada filter/saringan dan lain-lain. Karena mengandung nilai yang salah maka analsis Anda akan memberikan hasil yang tidak valid. Jadi, Anda harus membuang nilai outlier tersebut. Dengan kata lain, nilai tersebut berasal dari populasi yang berbeda dengan nilai-nilai yang lain, dan berpotensi akan menyesatkan.
Namun masalahnya adalah, Anda tidak pernah yakin untuk menetukan kemungkinan mana diantara semua kemungkinan tersebut yang benar. Tidak ada perhitungan statistik yang dapat meyakinkan Anda apakah outlier yang muncul berasal dari populasi yang sama atau berlainan dengan yang lain. Namun demikian, perhitungan statistik mempu menjawab pertanyaan ini: Jika semua nilai data tersebut benar-benar diambil secara acak dari distribusi normal (Gaussian), berapakah kemungkinannya bahwa Anda akan mendapatkan lagi sebuah nilai yang jauh berbeda dengan yang lainnya seperti yang telah Anda amati/dapatkan? Jika kemungkinan/probabilitasnya kecil, maka Anda harus menyimpulkan bahwa outlier tersebut merupakan nilai yang salah/error, dan Anda telah mendapatkan pembenaran untuk membuangnya dari analisis Anda.
Para ahli statistik telah memikirkan beberapa metode untuk mendeteksi outlier. Semua metode tersebut pertama mengukur/menghitung seberapa jauh outlier tersebut (jika ada) dari nilai-nilai yang lain. Ini bisa saja perbedaan antara outlier dengan rata-rata (mean) semua nilai, perbedaan antara outlier dan rata-rata (mean) dari nilai-nilai selain outlier tersebut, atau perbedaan antara outlier dan nilai terdekat. Langkah selanjutnya adalah menstandarisasi nilai ini dengan membaginya dengan beberapa ukuran penyebaran (scatter), seperti SD (standar deviasi) dari seluruh nilai, SD dari sisa nilai, atau range data. Akhirnya, penghitungan nilai P dapat menjawab pertanyaan ini: Jika seluruh nilai benar-benar diambil dari populasi nirmal (Gaussian), berapakah kemingkinannya mendapatkan sebuah outlier secara acak yang jauh dengan nilai-nilai yang lain? Jika nilai P kecil, mak Anda dapat menyimpulkan bahwa deviasi/penyimpangan outlier tersebut dari nilai-nilai yang lain adalah signifikan secara statistik.