Sudah saya jelaskan pada artikel sebelumnya bahwa statistika terbagi menjadi dua jenis; statistika deskriptif dan statistika inferensial. Nah, pada artikel kali ini saya masih bahas materi statistika dasar, yakni mengenai statistika deskriptif, setelah itu baru kita lanjut ke materi yang lebih advanced.
Enggak usah basa-basi dulu lagi, deh, ya.
Pengertian Statistika Deskriptif
Statistik deskriptif adalah istilah yang diberikan untuk analisis data yang membantu menggambarkan, menunjukkan atau meringkas data dengan cara yang bermakna sehingga (misalnya) pola muncul dari dalam data.
Kendati demikian, statistik deskriptif ini tidak dapat mengakomodir peneliti untuk membuat kesimpulan di luar data yang telah dianalisis mengenai hipotesis apapun, sebab statistik deskriptif ini hanya bertujuan menggambarkan data.
Pernyataan tersebut di atas, sebagaimana dikemukakan oleh David & Djamaris (2018) yang mengemukakan bahwa;
Statistik deskriptif ini bagian dari ilmu statistik yang hanya mengolah, menyajikan data tanpa mengambil keputusan mengenai populasi, sebab statistika ini hanya berkenaan dengan penggambaran data semata.
Walaupun kesimpulan analisis suatu data didapat dengan menggunakan statistika inferensial, namun secara umum analisis statistika deskriptif ini juga memiliki peran, karena jika peneliti hanya menyajikan data mentah saja, maka tentu masyarakat akan sulit memvisualisasikan dan mengambil makna dari data yang ada.
Oleh karena itu, dengan adanya statistika deskriptif ini memungkinkan peneliti untuk mmenyajikan data dengan lebih bermakna dan mudah dipahami dengan membuat interpretasi yang lebih sederhana.
Kalian udah tahu pengertian statistika? kalau belum, baca dulu: Pengertian statistika, statistik, serta jenis-jenisnya.
Dalam konteks statistika deskriptif, ada tiga jenis yang umumnya sering digunakan dalam statistika deskriptif, meliputi: distribusi, tendensi sentral (ukuran pemusatan data), dan penyebaran data.
Penjelasan selengkapnya, simak pemaparan berikut ini.
Distribusi dalam Statistika Deskriptif
Pengaturan, penyusunan, dan peringkasan data dengan membuat tabel sering kali membantu peneliti keika pada saat bekerja dengan sejumlah data yang besar.
Tabel-tabel tersebut lazimnya akan berisi daftar nilai data yang mungkin berbeda (bisa data tunggal ataupun data berkelompok) beserta nilai frekuensinya.
Frekuensi yang muncul biasanya akan menunjukkan banyaknya kejadian atau kemunculan nilai data dengan kategori tertentu, Nah di sini, distribusi data yang sudah diatur tersebut sering disebut dengan distribusi frekuensi.
Distribusi Frekuensi
Secara etimologi distribusi frekuensi ini terdiri dari dua kata; distribusi dan frekuensi. Distribusi atau dalam bahasa Inggris; distribution memiliki arti penyaluran, atau pembagian.
Adapun frekuensi (frequency) memiliki arti kekerapan, keseringan. Secara terminologi frekuensi ini merupakan angka bilangan yang menunjukkan seberapa sering angka-angka itu berulang dalam deretan angka yang ada.
Jadi secara terminologi, gini;
Distribusi frekuensi ini suatu keadaan yang menggambarkan bagaimana frekuensi dari gejala yang dilambangkan dengan angka-angka itu telah tersalur, terbagi atau terpencar.
Jadi secara sederhana distribusi frekuensi merupakan daftar sebaran data (data tunggal atau data berkelompok) yang disertai dengan jumlah frekuensinya.
Perhatikan Ilustrasi berikut.
Supaya sebuah data hasil ujian siswa mudah dibaca dan dipahami, maka hendaknya guru yang bersangkutan disusun dari yang paling kecil ke yang paling besar atau sebaliknya.
Seandainya jumlah datanya cukup banyak akan sulit membacanya secara cepat, oleh sebab itu data tersebut sebaiknya dibuat dalam bentuk distribusi frekuensi atau mengumpulkan data yang sama dalam satu kelompok.
Paham nggak?
Saya kasih contoh lagi..
Nilai ujian mata pelajaran ekonomi, dari 10 orang siswa kelas 10 yang sudah disajikan dalam bentuk tabel distribusi frekuensi, maka pembagian atau frekuensi dari nilai ke-10 orang siswa tersebut akan tampak seperti ini:
Nilai UJian Frekuensi
90 1
80 1
75 2
70 1
60 3
50 1
55 1
40 1
Total 10
Data yang disajikan di atas merupakan data dalam distribusi frekuensi, bisa dibayangkan apabila data tersebut belum disajikan dalam bentuk distribusi frekuensi, maka pengguna data akan disuguhkan data seperi ini: 90, 80, 75, 75, 70, 60, 60, 60, dan seterusnya.
Apabila datanya tidak ditulis dengan format tabel distribusi frekuensi, tentu akan sulit dipahami dan peneliti ataupun guru akan kesulitan melakukan mengindentifikasi karakteristik dari data yang ada.
Nah, jadi dengan distribusi frekuensi inilah pembaca data akan memperoleh gambaran yang sederhana, jelas, dan sistematis mengenai rangkaian data tersebut.
Jenis Distribusi Frekuensi dalam Statistika Deskriptif
Di dalam dunia statistik ada berbagai macam dbentuk istribusi frekuensi, namun demikian yang dikemukakan dalam pembahasan kali ini hanya beberapa yang sekiranya penting dan sering digunakan, yakni
- distribusi frekuensi data tunggal,
- distribusi frekuensi data berkelompok,
- distribusi frekuensi kumulatif, dan
- distribus frekunsi relatif.
Distribusi Frekuensi Data Tunggal
Distribusi frekuensi tunggal merupakan penyebaran nilai untuk masing-masing satu nilai (nilainya hanya satu macam untuk setiap bagiannya).
Maksudnya, Jika sejumlah data yang dimiliki terdiri dari nilai yang sebaran nilainya tidak terlalu banyak, ketika nilai yang sama dikelompokkan maka banyak macam nilai hanya beberapa buah saja.
Simak ilustrasi berikut.
Data hasil ujian sebanyak 60 orang siswa adalah sebagai berikut:
8 4 5 4 5 5 5 5 5 5 5 6 7 5 5 5 7 5 5 6 7 6 6 6 6 6 6 6 6 6
6 6 6 6 6 6 7 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 5 7 7 7 7 7 6
Jika diamati, tentu sebaran data semacam itu akan sulit dibaca dan dipahami secara cepat, oleh sebab itu data dimasukan ke dalam sebuah tabel dalam bentuk distribusi frekuensi tunggal seperti dalam Tabel 1, berikut.
[tabel id = 6 /]
Jika diamati pada tabel dalam ilustrasi di atas, terdapat tiga kolom;
- Nilai
- Tally, dan
- Frekuensi.
Kolom nilai berisi jenis-jenis nilai yang terdapat pada data yang disusun dari nilai tertinggi ke nilai terkecil. Kolom kedua, Tally adalah kolom untuk menghitung dengan cara menandai pada masing-masing nilai (kolom ini opsional).
Kolom yang ketiga adalah kolom frekuensi, yaitu penjumlahan banyaknya tanda tally pada tiap baris untuk menyimpulkan banyaknya nilai yang sama pada data.
Distribusi Frekuensi Data Berkelompok
Distribusi frekuensi berkelompok atau bergolong adalah penyebaran data yang dilakukan berdasarkan rentangan nilai tertentu untuk setiap bagiannya. Tipe ini dapat digunakan jika sekelompok data yang dimiliki nilainya menyebar cukup panjang antara nilai tertinggi dan terendah, sehingga tidak mungkin dibuat dalam distribusi tunggal.
Penggunaan distribusi frekuensi bergolong cukup menghemat energi, karena tidak harus menyamtumkan semua nilai yang ada dan jumlahnya banyak.
Simak Ilustrasi berikut.
Data hasil ujian 70 orang siswa dalam mata pelajaran ekonomi kelas X, sebagai berikut.
50 53 56 57 57 58 60 60 61 62 62 63 64 65 65 66 67 67 67 68
68 68 69 69 70 70 70 71 71 71 72 72 72 72 72 73 73 73 73 74
74 74 75 75 76 76 76 76 77 77 78 78 78 79 80 80 81 81 82 83
84 84 85 86 86 88 89 90 92 94
Data hasil ujian di atas menunjukkan bahwa nilai terendah adalah 50, sedangkan yang tertinggi adalah 94. Untuk mempermudah menyajikan data tersebut, digunakan tabel dalam bentuk distribusi bergolong. Sebagai berikut.
Kelompok Nilai Frekuensi
90 - 94 3
85 - 89 5
80 - 84 8
75 - 79 12
70 - 74 18
65 - 69 11
60 - 64 7
55 - 59 4
50 - 54 2
Distribusi Frekuensi Data Kumulatif/ Meningkat
Tabel distribusi meningkat/ kumulatif ini merupakan salah satu jenis tabel statistik yang di dalamnya disajikan frekuensi yang dihitung terus meningkat atau ditambahkan baik dari atas ke bawah atau sebaliknya.
Perhatikan tabel distribusi frekuensi kumulatif berikut.
Kelompok Nilai Frekuensi Frekuensi Kumulatif
90 - 94 3 70
85 - 89 5 67
80 - 84 8 62
75 - 79 12 54
70 - 74 18 42
65 - 69 11 24
60 - 64 7 13
55 - 59 4 6
50 - 54 2 2
CATATAN: Nilai kumulatif pada tabel tersebut disusun dari bawah ke atas.
Jika tabel tersebut diamati, pada kolom frekuensi kumulatif yang dihitung dari bawah ke atas (kalau kalian mau, bisa juga dihitung dari atas ke bawah).
Angka yang tersaji dalam kolom frekuensi kumulatif diperoleh dari langkah kerja; 2 + 4 = 6; 6 + 7 = 13; 13 + 11 = 24; dan seterusnya. Di sini, hasil penjumlahan akhir kumulatif akan selalu sama dengan nilai N (nilai N dalam contoh kasus tersebut adalah 70).
Distribusi Frekeunsi Relatif
Tabel distribusi frekuensi relatif juga dinamakan tabel persentase. Disebut sebagai frekuensi relatif karena frekuensi yang dihadirkan bukanlah frekuensi yang sebenarnya, melainkan frekuensi yang dituangkan dalam bentuk angka persenan.
Perhatikan contoh berikut.
Kelompok Nilai Frekuensi Persentase (%)
90 - 94 3 4,3
85 - 89 5 7,1
80 - 84 8 11,4
75 - 79 12 17,1
70 - 74 18 25,7
65 - 69 11 15,7
60 - 64 7 10,0
55 - 59 4 5,7
50 - 54 2 2,8
di sini, agar peneliti dapat memproleh angka relatif (persentase) sebagaimana tersaji pada kolom persentase, peneliti dapat membagi nilai frekuensi (f) dengan jumlah data (N) kemudian dikali 100%.
Istilah dalam Tabel Distribusi frekuensi
- Interval nilai, merupakan nilai pada tiap kelompok nilai, misalnya pada Tabel contoh kasus, ada 9 interval kelas dengan masing-masing interval terdiri dari dari 5 nilai variabel (dari 90 ke 94 terdiri dari 5 nilai; 90, 91, 92, 93, 94, 95) begitupun juga yang lainnya.
- Batas kelas, yaitu nilai yang membatasi kelas yang satu dengan kelas yang lain di atas dan di bawahnya, misalnya interval kelas nomor tiga adalah 80-84 yang merupakan nilai pembatas dari kelompok nilai yang lain.
- Batas atas dan Batas bawah, Tiap interval kelas terdapat dua angka di sebelah kiri dan sebelah kanan. Nilai disebelah kiri disebut batas bawah (lower limits) dan niali sebelah kanan disebut batas atas (upper limits).
- Batas semu dan batas nyata, jika nilai interval kelas ditulis dalam bentuk datar, maka antara 54 dan 55 mempunyai selisih, nah selisih ini bukanlah batas sebenarnya, melainkan batas semu. Batas kelas interval sebenarnya adalah 54,5 dan 55,5.
- Lebar kelas, yaitu jumlah nilai variabel pada setiap kelas.
- Titik tengah, yaitu nilai variabel yang berada di tengah interval kelas, misalnya kelas interval 80-84 (80, 81, 82, 83, 84) di sini titik tengahnya adalah 82. Apabila interval kelasnya genap, maka menghitung titik tengahnya adalah batas bawah semu ditambah batas atas semua lalu dibagi 2.
- Jumlah interval, adalah banyaknya interval yang digunakan dalam penyusunan distribusi (pada Tabel 2, ada 9 buah jumlah kelas interval).
- Jarak pengukuran, jarak pengukuran (range), adalah selisih nilai tertinggi dan nilai terendah, mengukur range ini menggunakan nilai tertinggi batas nyata atas dikurangi nilai terkecil batas nyata bawah, misalnya 94,5 – 49,5.
Cara Menghitung Jumlah Kelas Interval
Langkah pertama yang harus dilakukan untuk membuat distribusi frekuensi bergolong adalah dengan menghitung berapa jumlah interval kelas akan dibuat. Salah satu aturan penentuan interval kelas ini bisa menggunakan Aturan Sturges, yaitu:
Jumlah interval = 1 + (3,3) log n
Contoh:
Jika n = 70
maka jumlah interval kelasnya = 1 + (3,3) log 70 = 1 + (3,3) 1,84 = 7,09.
Cara Menghitung Lebar Interval
Apabila kelas intervalnya sudah didapatkan, maka selanjutnya adalah menghitung kelas interval dengan cara
i = jarak pengukuran/ jumlah interval kelas
Tendensi Sentral dalam Statistika Deskriptif
Pembaahasan lengkap mengenai Tendensi sentral dan jenis-jenisnya, silakan klik link berikut: Pengertian mean, median, dan modus. Di sana saya bahas tendensi sentral dengan sangat komprehensif.
Sekian dulu untuk pembahasan Statistika deskriptif (descriptive statistics) bagian 1 ini, hehe