Data Distribution
What is Data Distribution?
Data Distribution adalah daftar semua nilai yang mungkin. dan seberapa sering setiap nilai muncul.
Daftar tersebut penting ketika bekerja dengan statistik dan data science.
Modul acak menawarkan metode yang mengembalikan data distribution yang dihasilkan secara acak.
Random Distribution
Random distribution adalah himpunan bilangan acak yang mengikuti Probability Density Function tertentu.
Probability Density Function: Sebuah fungsi yang menggambarkan probabilitas continue. yaitu probabilitas semua nilai dalam array.
Kita dapat menghasilkan angka acak berdasarkan probabilitas yang ditentukan menggunakan choice() metode random modul.
Metode choice() ini memungkinkan kita untuk menentukan probabilitas untuk setiap nilai.
Probabilitas ditentukan oleh angka antara 0 dan 1, dimana 0 berarti nilai tidak akan pernah terjadi dan 1 berarti nilai akan selalu muncul.
Contoh
Hasilkan array 1-D yang berisi 100 nilai, dimana setiap nilai harus 3,5,7 atau 9.
Probabilitas nilai menjadi 3 ditetapkan menjadi 0.1.
Probabilitas nilai menjadi 5 diatur menjadi 0.3.
Probabilitas nilai menjadi 7 diatur menjadi 0.6.
Probabilitas nilai menjadi 9 diatur menjadi 0.
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(100))
print(x)Jumlah semua angka probabilitas harus 1.
Bahkan jika kita menjalankan contoh diatas 100 kali, nilai 9 tidak akan pernah muncul.
Kita dapat mengembalikan array dengan bentuk dan ukuran apa pun dengan menentukan bentuk di size parameter.
Contoh
Contoh yang sama seperti diatas, tetapi mengembalikan array 2-D dengan 3 baris, masing-masing berisi 5 nilai.
from numpy import random
x = random.choice([3, 5, 7, 9], p=[0.1, 0.3, 0.6, 0.0], size=(3, 5))
print(x)
Komentar
Posting Komentar