Scatter Plot Random Data Distributions

 


Random Data Distributions

Dalam Machine Learning, kumpulan data dapat berisi ribuan, atau bahkan jutaan, nilai.

Kita mungkin tidak memiliki data dunia nyata saat menguji algoritme, kita mungkin harus menggunakan nilai yang dihasilkan secara acak.

Seperti yang telah kita pelajari di bab sebelumnya, modul NumPy dapat membantu kita dalam hal itu!

Mari kita buat dua array yang keduanya diisi dengan 1000 angka acak dari distribusi data normal.

Array pertama akan memiliki rata-rata yang disetel ke 5,0 dengan standard deviation 1,0.

Areay kedua akan memiliki rata-rata yang disetel ke 10,0 dengan standard deviation 2,0:

Contoh
Scatter Plot dengan 1000 titik:
import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.01.01000)
y = numpy.random.normal(10.02.01000)

plt.scatter(x, y)
plt.show()

Result

Scatter Plot Explained 

Kita dapat melihat bahwa titik-titik terkonsentrasi di sekitar nilai 5 pada sumbu x, dan 10 pada sumbu y.

Kita juga dapat melihat bahwa sebaran lebih lebar pada sumbu y daripada pada sumbu x.

Komentar

Postingan populer dari blog ini

NumPy Array Search

NumPy Array Split

NumPy Array Iterating