Belajar Statistik, dari Pembentangan hingga Pengedaran Data

Statistik adalah sains matematik yang mengkaji pengumpulan, pemprosesan, analisis dan persembahan data. Statistik banyak digunakan dalam syarikat insurans, salah satunya adalah untuk menentukan jumlah premium dalam polisi insurans. Setiap pemegang insurans diminta membayar sumbangan yang disebut premium. Premium yang dibayar sesuai dengan perlindungan insurans yang dia dapat.

Di sini, syarikat insurans menggunakan statistik sehingga jumlah premium sesuai dengan jumlah perlindungan yang dapat diberikan kepada pemegang insurans. Dengan cara itu, kedua-dua pihak mendapat manfaat daripadanya.

Seperti yang telah disebutkan sebelumnya, statistik tidak hanya mengumpulkan dan memproses, tetapi juga menampilkan data. Statistik juga menggunakan beberapa langkah penyebaran data dalam memproses data. Hari ini, kita akan membincangkan jenis persembahan serta ukuran penyebaran data dalam statistik.

Jenis Penyampaian Data

Jenis persembahan data dalam statistik merangkumi jadual taburan frekuensi, histogram, poligon, dan ogives.

Bentuk pertama persembahan data adalah menggunakan jadual taburan frekuensi. Seperti namanya, kami menggunakan tabel untuk memaparkan jenis dan jumlah data yang diperoleh. Jadual taburan frekuensi juga mempunyai beberapa jenis, iaitu jadual taburan frekuensi untuk data tunggal dan data kumpulan.

(Baca juga: Dua Data Pengukuran dalam Statistik)

Jadual pengagihan frekuensi data tunggal digunakan untuk menunjukkan sejumlah kecil data, sekurang-kurangnya kurang dari 30 data. Contoh penyampaian data menggunakan jadual taburan frekuensi data tunggal adalah seperti berikut.

Data di bawah adalah skor ujian 30 orang pelajar. Layan ke dalam jadual taburan frekuensi data tunggal!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Sekiranya kita memberi perhatian, skor ujian terendah yang diperoleh adalah 3, sementara skor tertinggi adalah 10. Kemudian dari skor ini, bilangan pelajar yang memperolehnya dikira. Untuk kelas 3, misalnya, hanya 1 pelajar. Untuk kelas 4, ada 4 orang pelajar, dan seterusnya. Angka ini kemudian ditunjukkan dalam jadual seperti berikut.

turbin di tanah ladang angin luar pesisir

Jenis jadual taburan frekuensi seterusnya adalah jadual taburan frekuensi data kumpulan. Jadual ini digunakan untuk menyajikan banyak data, iaitu lebih dari 30 data. Mari lihat contoh di bawah.

Berikut adalah ketinggian tanaman cili (dalam milimeter) di ladang cili. Kemukakan data ke dalam jadual pengedaran data kumpulan!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

Tidak seperti data tunggal, di sini kita harus mengira bilangan kelas dan panjang kelas yang akan dipaparkan dalam jadual. Dengan menggunakan data di atas, berikut adalah pengiraannya.

Banyak data (n) = 40

Tinggi maksimum (x maks ) = 135

Tinggi minimum (x min ) = 120

Julat (J) = x maks  - x min = 135 - 120 = 15

Bilangan kelas (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Panjang kelas (c) = J / k = 15/6 = 2.5 ≈ c = 3

Dari hasil ini, kita dapat memaparkan jadual pengedaran data kumpulan seperti berikut.

turbin di tanah ladang angin luar pesisir

Seterusnya, kita akan membincangkan jenis persembahan data berkumpulan lain, iaitu dalam bentuk histogram, poligon frekuensi, dan ogives. Lihat jadual frekuensi di bawah, yang mengandungi maklumat berat badan untuk 80 ahli kelab sukan.

turbin di tanah ladang angin luar pesisir

Untuk membentangkan data menggunakan grafik histogram, pertama-tama kita membina carta Cartesian. Paksi-x menunjukkan sempadan atas dan bawah setiap kelas, manakala paksi-y menunjukkan frekuensi.

statistik4 (1)

Tidak seperti histogram, graf poligon frekuensi mengambil nilai min selang kelas dan memaparkannya dengan garis mengikut frekuensi.

statistik5 (1)

Akhirnya, persembahan data menggunakan keluk frekuensi positif atau negatif positif. Pertama, tandakan nilai frekuensi kumulatif setiap kelas selang pada paksi-y. Kemudian, tandakan koordinat titik mengikut pasangan teratas atas kelas selang dan frekuensi kumulatif. Sambungkan titik ke lekukan yang lancar.

Saiz Penyebaran Data

Dalam statistik, terdapat dua jenis pengukuran data, yaitu ukuran kepekatan data dan ukuran pengedaran data. Apakah penjelasan dan perbezaannya?

Ukuran pusat data adalah nilai yang mewakili lokasi data. Dalam ukuran berpusatkan data, ada rata-rata, mod, dan median.

Rata-rata atau min adalah hasil bagi jumlah semua data yang diperhatikan dengan sebilangan besar data. Kita dapat merumuskan maksudnya seperti berikut.

Maksud = (Jumlah semua data) / (Banyak data)

Untuk memahami dengan lebih baik, mari kita selesaikan contoh masalah berikut. Jumlah jam dalam seminggu yang diperlukan oleh 5 orang untuk aktiviti sosial di persekitaran mereka adalah 10, 7, 13, 20, dan 15 jam. Tentukan jumlah jam rata-rata seminggu yang mereka habiskan untuk aktiviti sosial!

Berdasarkan masalah di atas, kita dapat memasukkan nombor ke dalam formula seperti berikut.

Purata = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

Ini bermaksud jumlah jam yang mereka habiskan untuk melakukan aktiviti sosial adalah 13 jam.

Selain dari min atau min, ada juga mod. Mod adalah nilai yang paling kerap muncul dalam data. Mari kita lihat contoh masalah berikut.

Berikut adalah data berat (dalam kilogram) sebilangan pelajar kelas 7. Tentukan mod data tersebut!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Pertama sekali, kita mesti mengira berapa kali setiap nilai muncul dalam data. Berdasarkan data ini, kita memperoleh 31 (x3), 32 (x2), 33 (x1), 34 (x2), dan 35 (x4). Oleh kerana 35 berlaku paling kerap, mod data di atas adalah 35.

Jenis ukuran data centered terakhir adalah median. Median membahagi data menjadi dua bahagian yang sama, sehingga median adalah nilai tengah dari data yang disusun.

Untuk menentukan median, pertama kita harus menyusun semua data mengikut urutan menaik atau menurun. Kedua, menentukan banyak data dan melambangkannya sebagai "n". Sekiranya n adalah ganjil, formula yang kami gunakan adalah seperti berikut.

Median = nombor data - ((n + 1) / 2)

Sementara itu, jika n genap, kami menggunakan formula di bawah.

Median = (data ith (n / 2) + data ith (n / 2 + 1)) / 2

Pengukuran data kedua dalam statistik adalah ukuran penyebaran data. Ukuran penyebaran data adalah nilai yang menyatakan sejauh mana data dari pusat data. Ukuran taburan data terdiri daripada julat, kuartil, dan julat antara kuartil.

Julatnya adalah perbezaan antara nilai data terbesar dan nilai data terkecil. Kita boleh mendapatkan jangkauan dengan mengurangkan data terbesar dari data terkecil. Sebagai contoh, jika dalam satu kelas, pelajar tertinggi mempunyai ketinggian 160 cm dan pelajar terpendek mempunyai ketinggian 143 cm, kita akan mencapai jangkauan 23 cm.

Sementara itu, kuartil adalah pengelompokan data statistik menjadi empat bahagian yang sama. Saiz kuartil terbahagi kepada 3, iaitu kuartil bawah (Q 1 ), kuartil tengah (Q 2 atau median), dan kuartil atas (Q 3 ). Untuk menentukan setiap kuartil, ada beberapa langkah yang mesti kita ambil.

Pertama, susun data mengikut urutan menaik atau menurun. Kedua, tentukan nilai tengah atau median data. Ketiga, tentukan kuartil bawah (Q 1 ), yang merupakan nilai min bagi kumpulan data di bawah median (Q 2) . Akhirnya, tentukan kuartil atas (Q 3 ), yang merupakan nilai min bagi set data di atas median (Q 2) .

Jenis pengagihan data yang terakhir adalah julat interkuartil. Julat interkuartil adalah perbezaan antara kuartil atas dan bawah. Rumusannya adalah seperti berikut.

Q d = Q 3 - Q 1