Scatter Plot Random Data Distributions
Random Data Distributions
Dalam Machine Learning, kumpulan data dapat berisi ribuan, atau bahkan jutaan, nilai.
Kita mungkin tidak memiliki data dunia nyata saat menguji algoritme, kita mungkin harus menggunakan nilai yang dihasilkan secara acak.
Seperti yang telah kita pelajari di bab sebelumnya, modul NumPy dapat membantu kita dalam hal itu!
Mari kita buat dua array yang keduanya diisi dengan 1000 angka acak dari distribusi data normal.
Array pertama akan memiliki rata-rata yang disetel ke 5,0 dengan standard deviation 1,0.
Areay kedua akan memiliki rata-rata yang disetel ke 10,0 dengan standard deviation 2,0:
Contoh
Scatter Plot dengan 1000 titik:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)
plt.scatter(x, y)
plt.show()Result
Scatter Plot Explained
Kita dapat melihat bahwa titik-titik terkonsentrasi di sekitar nilai 5 pada sumbu x, dan 10 pada sumbu y.
Kita juga dapat melihat bahwa sebaran lebih lebar pada sumbu y daripada pada sumbu x.


Komentar
Posting Komentar