Data primer umumnya diperoleh dari hasil pengukuran atau observasi langsung terhadap objek yang menjadi fokus kita. Namun kadang kala kita juga menggunakan data yang diperoleh dari hasil pengumpulan data sekunder yang telah ada. Setelah data terkumpul mulai timbul sebuah pertanyaan yaitu mau diapakan ini data ??

Biasanya dari data primer atau sekunder data dicatat seperti dibawah ini :

53,53   63,14   49,03  55,15   67,79
63,49  58,63  50,84  51,77   41,22
73,55   50,74  56,00  46,98  46,33
62,66  66,60  59,16   50,37  44,32
52,49  53,35   61,61   55,54   50,94
33,38  52,26  47,92  64,00  58,94
34,88  58,87  59,84  56,23  42,59
45,77   63,28  48,75  69,79  56,71
70,51   56,72   66,12   59,06  44,54
48,10  47,83  56,31   51,54   44,88
58,21   44,14   67,48  58,77   53,94
61,50   50,91   34,38  63,85  36,41
57,07   45,51   71,16   55,78   56,57
65,41   69,65  54,96  52,26  45,01
51,61   47,76   29,10  53,02  73,53
44,06  47,54   50,09  39,19   48,97
60,48  74,63  54,31   55,27   44,48
63,48  43,01  52,94  50,75   51,31
40,48  48,67  66,19   57,29   55,05
56,34  32,61   62,98  45,09  37,57
54,09  51,74   35,54   38,87  27,43
51,13   60,36  54,51   52,43  26,87
20,07



Jika data yang kita peroleh hanya dicatat seperti di atas, maka tidak begitu besar kegunaannya bagi pengambaran peristiwa-peristiwa yang bersifat kuantitatif. Ilmu Statistika sebetulnya memberikan cara untuk menganalisa data kuantitatif yang bervariasi. Meskipun demikian, sebelum data tersebut dapat dianalisa secara baik, kesemuanya sebaiknya disusun kedalam bentuk yang mudah dimengerti serta berguna bagi tujuan analisa tersebut.

Penyusunan data yang paling sederhana adalah dalam bentuk urutan (array). Data disusun teratur dari nilai ujian terkecil hingga nilai ujian tersebar atau sebaliknya. Urutan data diatas dapat disusun sebagai berikut :
20,07  44,88  50,94  55,27   61,50
26,87  45,01   51,13   55,54   61,61
27,43  45,09  51,31   55,78   62,66
29,10  45,41   51,54   56,00  62,98
32,61   45,77   51,61   56,23  63,14
33,88  46,33  51,74   56,31   63,28
34,38  46,98  51,77   56,34  63,48
34,88  47,54   52,26  56,57   63,49
35,54   47,76   52,26  56,71   63,85
36,41   47,83  52,43  56,72   64,00
37,57   47,92  52,49  57,07   65,41
38,87  48,10  52,94  57,29   66,12
39,19   48,67  53,02  58,21   66,19
40,48  48,75  53,35   58,63  66,60
41,22   48,97  53,53   58,77   67,48
42,59  49,03  53,94  58,87  67,79
43,01  50,09  54,09  58,94  69,65
44,06  50,37  54,31   59,06  69,79
44,14   50,74  54,51   59,16   70,51
44,48  50,75   54,96  59,84  71,16
44,54  50,84  55,05   60,36  73,53
44,82  50,91   55,15   60,48  73,55
                                                                                                74,63

Dari urutan (array) diatas, dapat diperoleh informasi bahwa data terkecil adalah 20,07 dan data terbesar adalah 74,63. Jarak antara dari data tersebut adalah 74,63 - 20,07 = 54,56. Jarak (range) adalah beda antara nilai terendah dan nilai tertinggi dalam suatu urutan. Namun perlu diperhatikan urutan itu sendiri bukan merupakan cara penyusunan yang memuaskan guna menggambarkan distribusi data statistik.

Bentuk penyusunan data yang lebih baik lagi dari urutan adalah distribusi frekuensi. Distribusi frekuensi merupakan salah satu bentuk penyusunan data yang teratur dengan menggolongkan besar kecilnya angka-angka yang bervariasi ke dalam kelas-kelas tertentu seperti pada gambar dibawah ini.




Pada umumnya dalam distribusi frekuensi, tiap kelas memiliki 2 batas kelas (class limit). Batas kelas ialah nilai batas tiap kelas dalam sebuah distribusi dan digunakan sebagai pedoman guna memasukkan angka-angka hasil observasi ke dalam kelas-kelas yang sesuai. Contoh  pada gambar diatas kelas pertama dari distribusi frekuensi memiliki batas kelas bawah (lower class limit) sebesar 20.00 dan batas kelas atas (upper class limit) sebesar 29.99. Semua nilai yang terletak 19.995 dan 20.005 dicatat menjadi 20.00 karena data tersebut diperhitungkan hingga 2 angka di belakang koma. Secara teoritis, kelas pertama sebetulnya memiliki semua nilai-nilai antara 19.995 dan 29.995 inklusif. Oleh karena itu dua batas tersebut merupakan tepi kelas (class-boundaries) atau batas teorities (true limits). Selain itu didapat pula secara teoritis, interval kelas merupakan lebar dari sebuah kelas dan dihitung dari perbedaan antara kedua tepi kelas diatas yaitu 29.995 – 19.995 = 10. Titik tengah (mid point atau class mark) suatu kelas dihitung dari rata-rata hitung dari kedua batas kelasnya atau tepi kelasnya yaitu (29.995 + 19.995)/2 = 24.995.

Perlu diingat bahwa penyajian data ke dalam distribusi frekuensi membawa suatu konsekuensi logis bahwa ada beberapa informasi yang berasal dari data akan hilang. Karena kita tidak dapat mengatahui secara pasti berapa besar nilai data tersebut. Namun demikian kerugian hilangnya informasi jauh lebih sedikit dibandingkan dengan keuntungan yang diperoleh dari kegunaan distribusi itu sendiri.
 




0 komentar