Contoh struktur data Scatter Plot
Untuk membuat plot sebar, kita perlu memilih dua kolom dari tabel data, satu untuk setiap dimensi plot. Setiap baris tabel akan menjadi satu titik dalam plot dengan posisi sesuai dengan nilai kolom.
Referensi : https://chartio.com/learn/charts/what-is-a-scatter-plot/
Capaian Pembelajaran : Menggunakan diagram pencar untuk menyelediki dan menjelaskan hubungan antara dua variabel numerik
Tujuan Pembelajaran :
1. Menyajikan diagram pencar dari sepasang data
2. Menjelaskan hubungan antara dua variabel numerik antara dua variabel
Pengertian Diagram Pencar
Diagram pencar merupakan penyajian data dalam bentuk penyebaran titik-titik pada diagram kartesius yang berguna untuk menunjukkan ada atau tidaknya hubungan/korelasi antara dua variabel kuantitatif yang disebut dengan data bivariat.
Jenis – jenis varibel variabel
1. Variabel Bebas merupakan variabel yang memberikan pengaruh terhadap variabel lainnya. istilah lain dari variabel bebas yaitu variabel independen/variabel stimulus/ variabel input/variabel predictor/variabel anteseden yang disimbolkan dengan X
2. Variabel terikat merupakan variabel yang dipengaruhi oleh variabel lainnya tapi tidak dapat mempengaruhi variabel lainnya. Istilah lain dari variabel terikat yaitu variabel dependen/variabel outpot/ variabel respon/variabel criteria/variabel konsekuen yang disimbolkan dengan Y
Menggambar diagram pencar secara manual
1. Menentukan variabel bebas (X) dan variabel terikat (Y)
2. Temukanlah nilai tertinggi dan nilai terendah untuk setiap variabel
3. Membuat diagram kartesius dengan skala yang sama untuk memuat seluruh nilai pada setiap data.
4. Menggambarkan setiap pasangan titik-titik (X,Y) pada diagram kartesius.
Gambarkan diagram pencar tentang pengaruh jumlah penduduk miskin terhadap jumlah talak dan cerai (pasangan nikah) tahun 2016 di Pulau Sumatera.
Jumlah Penduduk Miskin tahun 2016
Jumlah Talak dan Cerai (Pasangan Nikah) tahun 2016
Variabel bebas (X) : Jumlah penduduk miskin tahun 2016
Variabel terikat (Y) : Jumlah talak dan cerai pada pasangan nikah tahun 2016
Nilai minimal (X) = 71071
Nilai maksimal (X) = 1452550
Nilai minimal (Y) = 0
Diagram Scatter (Diagram Pencar)
Kesimpulan: Materi yang telah dipelajari pada video ini
Diagram Pencar Atau Diagram Scatter
Pengertian Diagram Pencar
Langkah pertama dalam pengvisuaslisasian data dengan diagram scatter plot adalah mengumpulkan data.Pada studi kasus kali ini data yang akan digunakan berasal dari platform Kaggle. Untuk dapat menggunakannya dapat menggunakan link sebagai berikut :
https://www.kaggle.com/datasets/toramky/automobile-dataset
Setelah data berhasil di download, langkah pertama adalah merapihkan data. Untuk merapihkan data dapat dilakukan dengan cara klik pada kolom pertama->Data->Text To Columns. Pilih delimited untuk memisah-misahkan data dan tentukan Comma sebagai tanda pembatas untuk pemisahan datanya.
Jika sudah akan terlihat lebih rapi dibandingkan sebelumnya.
Membuat Data Visualisasi Diagram Scatterplot pada data Engine-size dan Price
3. Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter. Jika sudah akan tampak seperti gambar di bawah ini.
4. Edit chart scatter sesuai keinginan dan kebutuhan.
5.Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram
6. Untuk menampilkan nilai R-squared dapat mengklik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”. Jika sudah dilakukan tampilan diagram scatternya akan tampak seperti berikut.
7. Menentukan nilai rata-rata pada 2 variabel data yang disajikan yaitu Engine-size dan juga Price. Untuk dapat mendapatkan nilai rata-rata dapat menggunakan rumus yang tersedia di Microsoft Excel yaitu =AVERAGE().
8. Langkah selanjutnya adalah menentukan nilai R. Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar kuadrat. Maka hasil akhir yang akan dihasilkan akan membentuk diagram seperti berikut.
Dengan membuat diagram diatas bisa kita dapatkan :
Hasil diatas telah memperlihatkan dimana terdapat hubungan linear antara variable Engine-size dan juga variable Price. Dapat dilihat juga, semakin tinggi nilai dari variable Engine-Size maka semakin tinggi juga Nilai pada Variabel Price. Hubungan kedua variable ini bisa dikatakan memiliki nilai positif dengan memiliki nilai R atau nilai korelasinya yaitu 0,704202
Membuat Data Visualisasi Diagram Scatterplot pada data Highway-mpg dan Price
Langkah yang dilakukan sama seperti mengvisualisasikan data sebelumnya yaitu seperti berikut.
3. Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter
4. Edit tampilan chart scatter sesuai keinginan dan kebutuhan.
5. Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram
6. Untuk mendapatkan nilai r-squared secara otomatis dapat mengklik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”.
7. Menentukan nilai rata-rata pada 2 variabel data yang disajikan yaitu Engine-size dan juga Price. Untuk dapat mendapatkan nilai rata-rata dapat menggunakan rumus yang tersedia di Microsoft Excel yaitu =AVERAGE().
8. adalah menentukan nilai R. Nilai R dapat ditemukan dari nilai R2 dengan menggunakan fungsi =SQRT() untuk mengembalikan akar kuadrat. Jika semua langkah telah dilakukan maka akan mendapatkan hasil diagram scatter seperti gambar di bawah ini.
Dengan membuat diagram diatas bisa kita dapatkan :
Dapat disimpulkan, semakin tinggi nilai pada variable Highway-mpg maka akan semakin rendah nilai variable Price, hubungan kedua variable tersebut dapat dikatakan kuat negatif dengan nilai korelasi yaitu 0,686222
Scatter Plot sering juga disebut dengan bagan sebar atau grafik sebar, adalah penggunaan titik-titik untuk mewakili nilai untuk dua variabel numerik yang berbeda. Posisi setiap titik pada sumbu horizontal dan vertikal menunjukkan nilai untuk titik data individual. Scatter plot digunakan untuk mengamati hubungan antar variabel.
Contoh Scatter Plot di atas menunjukkan diameter dan tinggi untuk sampel pohon fiksi. Setiap titik mewakili satu pohon; posisi horizontal setiap titik menunjukkan diameter pohon (dalam sentimeter) dan posisi vertikal menunjukkan tinggi pohon (dalam meter).
Dari plot, kita dapat melihat korelasi positif yang secara umum erat antara diameter pohon dan tingginya. Kita juga bisa mengamati titik outlier, sebuah pohon yang diameternya jauh lebih besar dari yang lain. Pohon ini tampak cukup pendek untuk ketebalannya, yang mungkin memerlukan penyelidikan lebih lanjut.
Kapan menggunakan Scatter Plot ?
Kegunaan utama scatter plot adalah untuk mengamati dan menunjukkan hubungan antara dua variabel numerik. Titik-titik dalam sebar plot tidak hanya melaporkan nilai titik data individual, tetapi juga pola ketika data diambil secara keseluruhan.
Identifikasi hubungan korelasional yang umum dengan plot pencar. Dalam kasus ini, kami ingin tahu, jika kami diberi nilai horizontal tertentu, prediksi yang baik untuk nilai vertikal. Anda akan sering melihat variabel pada sumbu horizontal dilambangkan sebagai variabel bebas, dan variabel pada sumbu vertikal adalah variabel terikat. Hubungan antar variabel dapat digambarkan dalam banyak cara: positif atau negatif, kuat atau lemah, linier atau nonlinier.