Scatter Plot Random Data Distributions

- Desember 08, 2022

Random Data Distributions

Dalam Machine Learning, kumpulan data dapat berisi ribuan, atau bahkan jutaan, nilai.

Kita mungkin tidak memiliki data dunia nyata saat menguji algoritme, kita mungkin harus menggunakan nilai yang dihasilkan secara acak.

Seperti yang telah kita pelajari di bab sebelumnya, modul NumPy dapat membantu kita dalam hal itu!

Mari kita buat dua array yang keduanya diisi dengan 1000 angka acak dari distribusi data normal.

Array pertama akan memiliki rata-rata yang disetel ke 5,0 dengan standard deviation 1,0.

Areay kedua akan memiliki rata-rata yang disetel ke 10,0 dengan standard deviation 2,0:

Contoh

Scatter Plot dengan 1000 titik:

import numpy
import matplotlib.pyplot as plt

x = numpy.random.normal(5.0, 1.0, 1000)
y = numpy.random.normal(10.0, 2.0, 1000)

plt.scatter(x, y)
plt.show()

Result

Scatter Plot Explained

Kita dapat melihat bahwa titik-titik terkonsentrasi di sekitar nilai 5 pada sumbu x, dan 10 pada sumbu y.

Kita juga dapat melihat bahwa sebaran lebih lebar pada sumbu y daripada pada sumbu x.

Cari Blog Ini

Coding Is Fun