Linear Regression Part 2
R for Relationship
Penting untuk diketahui bagaimana relationship antara nilai sumbu x dan nilai sumbu y, jika tidak ada relationship maka linear regression tidak dapat digunakan untuk memprediksi apapun.
Relationship- koefisien korelasi - disebut r.
Nilainya r berkisar dari -1 hingga 1, di mana 0 berarti tidak ada relationship, dan 1 (dan -1) berarti 100% terkait.
Python dan modul Scipy akan menghitung nilai ini untuk kita, yang harus kita lakukan hanyalah memberinya nilai x dan y.
Contoh
Seberapa cocok data saya dalam linear regression?
from scipy import stats
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
slope, intercept, r, p, std_err = stats.linregress(x, y)
print(r)Note: Hasil -0,76 menunjukkan adanya hubungan/relationship, tidak sempurna, tetapi menunjukkan bahwa kita dapat menggunakan linear regression dalam prediksi mendatang.
Predict Future Values
Sekarang kita dapat menggunakan informasi yang telah kita kumpulkan untuk memprediksi nilai masa depan.
Contoh: Mari kita coba memprediksi kelajuan sebuah mobil berumur 10 tahun.
Untuk melakukannya, kita memerlukan myfunc() fungsi yang sama dari contoh di atas:
def myfunc(x):
return slope * x + intercept
Contoh
Memprediksi kecepatan mobil berusia 10 tahun:
from scipy import stats
x = [5,7,8,7,2,17,2,9,4,11,12,9,6]
y = [99,86,87,88,111,86,103,87,94,78,77,85,86]
slope, intercept, r, p, std_err = stats.linregress(x, y)
def myfunc(x):
return slope * x + intercept
speed = myfunc(10)
print(speed)Contoh memprediksi kecepatan pada 85,6, yang juga dapat kita baca dari diagram:


Komentar
Posting Komentar