Pengetahuan terhadap
jenis-jenis data merupakan syarat mutlak yang harus dimiliki oleh seorang peneliti
yang ingin menggunakan instrumen analisis
ilmu statistik. Setiap jenis data memiliki karakteristik yang berbeda-beda sehingga dalam penggunaannya pun juga berbeda-beda. Penggunaan data yang
salah akan menghasilkan kesimpulan yang
juga salah. Oleh karena itu, dalam awal pembahasan
buku ini akan dibahas terlebih dahulu mengenai
pengertian data serta jenis-jenisnya. Dengan pengetahuan tentang data yang
tepat diharapkan proses analisis data
dengan menggunakan instrumen ilmu statistik dapat berjalan dengan
baik dan menghasilkan kesimpulan yang benar.
2.1. Pengertian Data
Data sering kali diartikan sebagai kumpulan catatan dari fakta. Secara etimologis data merupakan bentuk jamak dari kata datum yang berasal dari bahasa Latin dengan arti “sesuatu yang diberikan”. Dengan kata lain data bisa diartikan sebagai kumpulan catatan
yang
diberikan berdasarkan fakta
yang terjadi.
Dalam kehidupan sehari-hari semua orang
tidak bisa lepas dari
data. Bahkan kehidupan manusia sendiri merupakan kumpulan dari data mulai
dari bangun tidur, mandi, makan,
bekerja, sampai dengan istirahat dari
berbagai kesibukan sehari-hari merupakan data
yang bisa dianalisis untuk berbagai kepentingan. Sebagai contoh, perusahaan
Go-Jek sebagai salah satu penyedia jasa transportasi on-line mengumpulkan
dan menganalisis kebiasaan masyarakat
jajan. Berdasarkan kebiasaan tersebut Go-Jek
menyediakan aplikasi Go-Send untuk membantu
masyarakat membeli
makanan yang diinginkan tanpa harus ke luar rumah atau tempat
kerja.
Dalam suatu proses penelitian, data tidak hanya terbatas pada kumpulan angka- angka saja.
Pernyataan dalam
bentuk kalimat serta gambar
juga merupakan data. Oleh karena itu, seluruh aspek kehidupan dan kajian bidang keilmuan, tidak bisa lepas dari data mulai dari bidang-bidang ilmu eksakta
sampai ilmu-ilmu sosial.
Namun, sering kali data yang tersedia di lapangan belum memiliki nilai informasi yang
dibutuhkan. Data yang tersedia biasanya baru kumpulan fakta yang belum
bisa memberikan informasi yang bisa dijadikan
dasar untuk pengambilan keputusan. Supaya bisa
memiliki nilai yang informatif, data yang tersedia
biasanya harus dikumpulkan, disusun, diolah, dianalisis, dan diintrepretasikan. Tahapan-tahapan
dari mulai proses pengumpulan sampai tahap interpretasi data memerlukan keahlian khusus. Dalam proses inilah ilmu statistik memiliki peran yang
sangat penting dan belum tergantikan sampai saat ini.
Statistika saat ini telah menjadi ilmu yang
berkembang pesat dan bahkan telah muncul produk-produk
ilmu
terapannya yang dipergunakan
dalam kajian empiris. Namun
tentunya sebagai suatu ilmu yang
bersinggungan langsung dengan data, maka data yang
dikumpulkan harus data yang benar-benar valid. Dalam kajian ilmu statistik ada istilah “garbage in garbage out” yang artinya jika data yang diolah adalah data yang
tidak akurat atau data palsu (fake data)
maka sudah pasti hasil analisis yang
dihasilkan akan jauh dari kata akurat.
Dalam ilmu statistik, terdapat
berbagai macam data yang berbeda karakteristiknya antara satu jenis data dengan
jenis data lainnya. Ada data yang bisa dianalisis oleh
semua instrumen analisis ilmu statistik, namun
ada pula data yang hanya bisa diolah dan dianalisis dengan instrumen tertentu
saja. Seorang peneliti harus sangat
jeli dan bisa membedakan karakteristik
masing-masing data. Ilmu statistik
dalam beberapa kondisi tidak bisa membedakan mana data yang bisa diolah dan mana data yang tidak bisa diolah. Hanya peneliti yang bisa memilah dan membedakan mana data yang dapat diolah oleh instrumen tertentu dan mana yang tidak. Jika hanya melihat
dari sisi angka maka hampir semua data bisa diolah namun output yang dihasilkan oleh ilmu
statistik menjadi sulit atau bahkan tidak
bisa diinterpretasikan.
Dalam bab ini akan dibahas
macam-macam data beserta karakteristiknya sehingga peneliti yang ingin meneliti suatu fenomena
atau permasalahan dapat
melakukan analisis secara benar. Pengetahuan mengenai jenis-jenis data ini sangat penting karena berkaitan secara langsung dengan keakuratan hasil penelitian. Data yang diolah bisa saja menghasilkan output namun makna dibalik output tersebut menjadi
bias jika data yang digunakan tidak
akurat.
2.2. Jenis-Jenis Data
Sebagaimana telah dijelaskan
dalam pembahasan awal
buku ini bahwa statistika
adalah suatu proses yang semuanya
berhubungan dengan data. Oleh karena itu, untuk menghasilkan kesimpulan yang tepat
maka diperlukan data yang juga tepat. Jika data yang dikumpulkan salah
maka sudah dipastikan kesimpulan yang dihasilkan juga akan
salah ibarat pepatah “garbage in, garbage out”.
Oleh karena itu, peneliti atau orang yang ingin melakukan
analisis statistika harus
memahami jenis-jenis dan karakter data yang akan dikumpulkannya.
Jenis-jenis data dapat dibedakan dan dikelompokkan seperti dalam Gambar
2.2 (Sugiyono, 2007).
Kualitatif
Data
Diskrit/Nominal
Kuantitatif
Kontinum
Ordinal
Interval
Ratio
GAMBAR 1.2. Jenis-Jenis
Data
Data kualitatif adalah data yang dinyatakan
dalam bentuk kata, kalimat, dan gambar
seperti sangat bagus, bagus, sangat suka, rasanya enak, dan sangat indah. Sedangkan data
kuantitatif adalah data yang berbentuk angka (numeric), atau data kualitatif yang diangkakan. Data kuantitatif seperti jumlah mobil (1, 2, 3, dan seterusnya),
jarak kota Jakarta dengan Kota
Bogor adalah 50 Km, dan lain sebagainya.
Data kuantitatif ini dibedakan lagi
menjadi dua yaitu data
nominal (diskrit) dan data kontinum.
Data konstinu terbagi lagi menjadi tiga yaitu data ordinal,
interval, dan rasio.
Data nominal (diskrit) data yang hanya dapat digolong-golongkan secara terpisah, diskrit, atau kategori. Data ini tidak menunjukkan
perbedaan tingkatan seperti nomor
1 lebih tinggi atau lebih baik dari data nomor 2. Data jenis ini digunakan hanya untuk membedakan antara kelompok yang satu dengan kelompok
lainnya.
Contoh:
Jenis Kelamin:
1 = Laki-laki
2 = Perempuan
Suku Bangsa:
1. Suku
Betawi
2. Suku
Jawa
3. Suku
Sunda
4. Suku
Padang
5. Suku
Bugis
Warna Objek:
1. Merah
2. Putih
Data kontinum adalah data yang bervariasi menurut tingkatan dan diperoleh dari hasil
pengukuran. Data ini dibagi lagi menjadi data ordinal, interval, dan rasio.
Data Ordinal adalah data yang berbentuk ranking atau peringkat (berlaku perbandingan
dengan menggunakan fungsi
pembeda yaitu “>” (lebih
besar dari) dan “<” (lebih
kecil dari). Data ini belum dapat
dilakukan operasi matematika (+, – , × ,÷)).
Contoh jenis data ordinal
ini adalah medali juara dalam suatu pertandingan oleh
raga.
1. Juara 1
= Medali Emas
2. Juara 2
= Medali Perak
3. Juara 3
= Medali Perunggu
Dari medali di atas apakah bisa disimpulkan 2 medali perak sama dengan 1 medali
emas? Atau 1 medali emas setara dengan 3 medali perak? Dalam data medali
di atas tidak bisa disimpulkan bahwa 2 atau 3 medali perak sama dengan 1 medali emas. Hal ini karena data medali di atas adalah
data ordinal yang jarak
antara satu peringkat dengan peringkat lainnya tidak sama atau tidak
diketahui.
Contoh lainnya adalah
data peringkat murid di kelas.
I II
III
IV
V
100 95
85 83
75
Peringkat pertama memiliki
nilai 100 dan peringkat kedua
memiliki nilai 95. Namun peringkat ketiga memiliki jarak yang lebih besar dengan perolehan nilai 85.
Peringkat keempat memiliki nilai yang tidak terlalu jauh dengan peringkat
ketiga yaitu
83. Sedangkan
peringkat kelima memiliki
nilai yang jauh dari peringkat keempat
yaitu
75. Data peringkat
murid di kelas ini merupakan contoh data ordinal di mana
jarak untuk masing-masing data berbeda.
Sebagian besar peneliti
berpendapat bahwa jenis data ordinal
ini merupakan jenis data yang bisa dioperasikan untuk menghitung
tingkat keeratan suatu hubungan dan tingkat
pengaruh suatu variabel
independen terhadap
variabel dependennya.
Data interval
adalah data yang jarak
antara satu dengan data yang lain
sama tetapi tidak mempunyai nilai nol
(0), absolut/mutlak. Data jenis ini
dapat dilakukan operasi matematika penjumlahan dan pengurangan (+, –). Contoh dari data ini adalah temperatur
yang ada dalam skala
thermometer. Skala thermometer biasanya diukur
dengan satuan Celcius atau Fahrenheit. Walaupun ada nilai 0o C namun nilai nol
tersebut masih ada nilainya. Jika dikonversi ke dalam skala
Fahrenheit, 0o C sama dengan
32o F.
Contoh lainnya dari
data
interval ini adalah
data hasil penelitian yang diukur
dengan skala Likert. Dalam penelitian manajemen, data ini seringkali di dapat dari hasil
pengukuran data kualitatif yang
hasilnya “diangkakan” (kuantifikasi). Sebagai
contoh adalah tingkat kepuasan
konsumen yang dibagi ke dalam lima
jenis tingkat kepuasan. Masing-masing
kelompok memiliki tingkatan yang
berbeda-beda. Namun jarak antara
kelompok tersebut tidaklah sama. Oleh karena itu, jenis data ini tidak bisa
dilakukan operasi matematika.
Contoh data tingkat kepuasan konsumen:
1. Sangat
Tidak Puas
2. Tidak
Puas
3. Cukup
Puas
4. Puas
5. Sangat
Puas
Data di atas menunjukkan
perbedaan tingkatan namun jarak antara tingkatan tidak
diketahui. Jenis data interval ini dapat
dibuat menjadi data ordinal (peringkat).
Gambar Thermometer yang tidak memiliki nilai
nol mutlak
Data rasio adalah data yang
jaraknya sama, dan mempunyai
nilai nol (0) mutlak.
Dapat dilakukan seluruh operasi
matematika. Contoh dari jenis data ini adalah berat badan dan tinggi badan.
Berat badan 0 Kg berarti tidak
memiliki bobot atau panjang 0 m berarti
tidak ada panjangnya. Data jenis ini
dapat diubah menjadi data ordinal dan interval. Semua operasi
matematika aljabar dapat dilakukan untuk data jenis ini. Contoh
3 meter ditambah
dengan 7 meter
maka hasilnya adalah 10 meter. Bandingkan dengan penjumlahan dalam data interval,
misal satu gelas air dengan suhu 30o C + dengan segelas air dengan suhu 15o C maka suhunya tidak menjadi 45o C, namun kira-kira
menjadi 22,5o C.
Dalam pengolahan data ilmu statistik, jenis data rasio ini boleh menggunakan semua instrumen olah data ilmu statistik seperti mengukur derajat
keeratan antara dua variabel ataupun
pengaruh satu variabel
terhadap variabel
lainnya.
Dengan demikian maka pengetahuan
terhadap klasifikasi data ini menjadi
sangat wajib bagi
para peneliti yang ingin
menggunakan teknik analisis dengan instrumen ilmu statistik. Jika peneliti tidak mampu untuk membedakan jenis-jenis data yang akan
digunakan maka sudah
pasti kesimpulan dari hasil penelitiannya akan sangat
jauh dari kata benar. Selalu
ingat motto “garbage in garbage out”.
2.3. Hati-Hati dengan Kebohongan Statistika
Sebagaimana telah dijelaskan sebelumnya bahwa statistika sangat membantu para
peneliti, manajer, dan pengambil
keputusan dalam mengambil keputusan strategis
perusahaan. Namun tidak jarang statistika dipergunakan sebagai alat untuk mendukung
suatu kebohongan. Fenomena ini dikenal dengan
sebutan “Kebohongan” Statistika. Contoh kasus kebohongan statistika:
Beberapa waktu yang lalu kita pernah menonton
salah satu iklan di televisi tentang
produk pembalut wanita. Dalam
iklan tersebut dikatakan bahwa tujuh
dari 10 wanita Indonesia menggunakan pembalut merek “X”. Iklan produk
pembalut ini mengandung Kebohongan Statistika untuk menciptakan persepsi positif dari
konsumen terhadap produk pembalut tersebut.
Beberapa hal yang menjadi
dasar kenapa iklan tersebut dikatakan mengandung kebohongan statistika adalah:
1. Data
yang disampaikan oleh iklan
tersebut merupakan data sampel
namun dalam iklan tersebut tidak disebutkan berapa jumlah sampelnya dan berapa populasinya sehingga sampel tersebut bisa benar-benar mewakili populasi wanita Indonesia?
2. Jika data tersebut merupakan data sampel maka harus disampaikan juga berapa
margin of error-nya dan berapa
tingkat kepercayaannya.
3. Dalam iklan tersebut
tidak dijelaskan juga karakteristik
data populasinya. Jika
disebutkan seluruh wanita Indonesia, apakah jumlah tersebut termasuk bayi, anak-
anak, dan lansia?
4. Informasi dalam iklan tersebut juga memiliki
kerancuan. Jika memang benar tujuh
dari 10 wanita Indonesia menggunakan
pembalut tersebut maka dia sudah menjadi pemain monopoli karena dengan kata lain produk pembalut tersebut sudah
menguasai 70 persen pangsa pasar pembalut wanita. Sebagai monopolis maka
seharusnya program promosi melalui
iklan sudah tidak
perlu dilakukan.
Masih banyak kasus kebohongan statistika yang saat ini beredar
luas di masyarakat
termasuk dalam bidang politik
seperti
kampanye politik. Oleh karena itu,
kita semua harus sangat berhati-hati dalam memahami dan menyebarkan
informasi statistika yang tingkat keakuratannya masih belum
jelas.
No comments:
Post a Comment