Plot sebar (Scatter Plot)

Dipublikasikan oleh Siti Nur Rahmawati

22 Agustus 2022, 11.09

Scatter plot (Wikipedia)

Plot sebar atau Scatter Plot (juga disebut sebar, grafik sebar, bagan sebar, scattergram, atau diagram sebar) adalah jenis plot atau diagram matematika yang menggunakan koordinat Cartesian untuk menampilkan nilai-nilai biasanya dua variabel untuk satu set data. Jika poin dikodekan (warna/bentuk/ukuran), satu variabel tambahan dapat ditampilkan. Data ditampilkan sebagai kumpulan titik, masing-masing memiliki nilai satu variabel yang menentukan posisi pada sumbu horizontal dan nilai variabel lain yang menentukan posisi pada sumbu vertikal.

Waktu tunggu antara letusan dan durasi letusan untuk Old Faithful Geyser di Taman Nasional Yellowstone, Wyoming, AS. Bagan ini menunjukkan secara umum ada dua jenis letusan: durasi pendek-tunggu-pendek, dan durasi-tunggu-lama-lama.

Plot sebar 3D memungkinkan visualisasi data multivarian. Plot sebar ini mengambil beberapa variabel skalar dan menggunakannya untuk sumbu yang berbeda dalam ruang fase. Variabel yang berbeda digabungkan untuk membentuk koordinat dalam ruang fase dan ditampilkan menggunakan mesin terbang dan diwarnai menggunakan variabel skalar lain.

Ringkasan

Sebuah plot sebar dapat digunakan baik ketika satu variabel kontinu berada di bawah kendali eksperimen dan yang lainnya bergantung padanya atau ketika kedua variabel kontinu independen. Jika ada parameter yang secara sistematis ditambah dan/atau dikurangi oleh yang lain, itu disebut parameter kontrol atau variabel independen dan biasanya diplot sepanjang sumbu horizontal. Variabel yang diukur atau tergantung biasanya diplot sepanjang sumbu vertikal. Jika tidak ada variabel dependen, salah satu jenis variabel dapat diplot pada salah satu sumbu dan plot pencar hanya akan menggambarkan tingkat korelasi (bukan penyebab) antara dua variabel.

Sebuah plot pencar dapat menyarankan berbagai macam korelasi antar variabel dengan interval kepercayaan tertentu. Misalnya, berat dan tinggi akan berada di sumbu y, dan tinggi akan berada di sumbu x. Korelasi bisa positif (naik), negatif (turun), atau nol (tidak berkorelasi). Jika pola titik-titik miring dari kiri bawah ke kanan atas, menunjukkan korelasi positif antara variabel yang diteliti. Jika pola titik-titik miring dari kiri atas ke kanan bawah, menunjukkan korelasi negatif. Garis yang paling cocok (atau disebut 'garis tren') dapat ditarik untuk mempelajari hubungan antar variabel. Persamaan untuk korelasi antar variabel dapat ditentukan dengan prosedur yang paling sesuai. Untuk korelasi linier, prosedur yang paling cocok dikenal sebagai regresi linier dan dijamin akan menghasilkan solusi yang benar dalam waktu yang terbatas. Tidak ada prosedur universal yang paling sesuai yang dijamin untuk menghasilkan solusi yang tepat untuk hubungan yang berubah-ubah. Plot sebar juga sangat berguna ketika kita ingin melihat bagaimana dua set data yang sebanding setuju untuk menunjukkan hubungan nonlinier antar variabel. Kemampuan untuk melakukan ini dapat ditingkatkan dengan menambahkan garis halus seperti LOESS. Selanjutnya, jika data diwakili oleh model campuran hubungan sederhana, hubungan ini akan terlihat secara visual sebagai pola yang ditumpangkan.

Diagram pencar adalah salah satu dari tujuh alat dasar pengendalian kualitas.

Bagan sebar dapat dibuat dalam bentuk bagan gelembung, penanda, atau/dan garis.

 

Contoh

Misalnya, untuk menampilkan hubungan antara kapasitas paru-paru seseorang, dan berapa lama orang tersebut dapat menahan napas, seorang peneliti akan memilih sekelompok orang untuk dipelajari, kemudian mengukur kapasitas paru-paru masing-masing (variabel pertama) dan berapa lama orang tersebut dapat menahan napas (variabel kedua). Peneliti kemudian akan memplot data dalam plot pencar, menetapkan "kapasitas paru-paru" ke sumbu horizontal, dan "waktu menahan napas" ke sumbu vertikal.

Seseorang dengan kapasitas paru-paru 400 cl yang menahan napas selama 21,7 s akan diwakili oleh satu titik pada plot pencar pada titik (400, 21,7) dalam koordinat Cartesian. Plot sebar dari semua orang dalam penelitian ini akan memungkinkan peneliti untuk mendapatkan perbandingan visual dari dua variabel dalam kumpulan data dan akan membantu untuk menentukan jenis hubungan apa yang mungkin ada antara dua variabel.

Matriks petak sebar

Untuk sekumpulan variabel data (dimensi) X1, X2, ... , Xk, matriks sebar menunjukkan semua plot sebar berpasangan dari variabel pada satu tampilan dengan beberapa plot sebar dalam format matriks. Untuk k variabel, matriks scatterplot akan berisi k baris dan k kolom. Plot yang terletak pada perpotongan baris dan kolom ke-j adalah plot variabel Xi versus Xj. Ini berarti bahwa setiap baris dan kolom adalah satu dimensi, dan setiap sel memplot plot sebar dua dimensi.

Sebuah matriks plot sebar umum menawarkan berbagai tampilan kombinasi berpasangan variabel kategoris dan kuantitatif. Plot mosaik, diagram fluktuasi, atau diagram batang segi dapat digunakan untuk menampilkan dua variabel kategori. Plot lain digunakan untuk satu variabel kategorikal dan satu variabel kuantitatif.

 

Sumber Artikel: en.wikipedia.org