Multiple Regression Part 1

 


Multiple Regression

Multiple Regression seperti regresi linier , tetapi dengan lebih dari satu nilai independen, artinya kami mencoba memprediksi nilai berdasarkan dua variabel atau lebih.

Lihatlah kumpulan data di bawah ini, ini berisi beberapa informasi tentang mobil.
CarModelVolumeWeightCO2
ToyotaAygo100079099
MitsubishiSpace Star1200116095
SkodaCitigo100092995
Fiat50090086590
MiniCooper15001140105
VWUp!1000929105
SkodaFabia1400110990
MercedesA-Class1500136592
FordFiesta1500111298
AudiA11600115099
Kita dapat memprediksi emisi CO2 mobil berdasarkan ukuran mesin, tetapi dengan regresi berganda kita dapat menambahkan lebih banyak variabel, seperti berat mobil, untuk membuat prediksi lebih akurat.

How Does it Work?

Di Python kami memiliki modul yang akan melakukan pekerjaan untuk kami. Mulailah dengan mengimpor modul Pandas.

import pandas

Pelajari tentang modul Pandas di Tutorial Pandas kami .

Modul Pandas memungkinkan kita membaca file csv dan mengembalikan objek DataFrame.

File ini dimaksudkan untuk tujuan pengujian saja, Anda dapat mengunduhnya di sini: data.csv.

df = pandas.read_csv("data.csv")

Kemudian buat daftar nilai independen dan panggil variabel ini X.

Masukkan nilai dependen dalam variabel yang disebut y.

X = df[['Weight''Volume']]
y = df['CO2']

Tip: Adalah umum untuk menamai daftar nilai independen dengan huruf besar X, dan daftar nilai dependen dengan huruf kecil y.

Kami akan menggunakan beberapa metode dari modul sklearn, jadi kami harus mengimpor modul itu juga:

from sklearn import linear_model

Dari modul sklearn kita akan menggunakan LinearRegression() metode untuk membuat objek regresi linier.

Objek ini memiliki metode yang disebut fit() yang mengambil nilai independen dan dependen sebagai parameter dan mengisi objek regresi dengan data yang menggambarkan hubungan:

regr = linear_model.LinearRegression()
regr.fit(X, y)

Sekarang kita memiliki objek regresi yang siap memprediksi nilai CO2 berdasarkan berat dan volume mobil:

#predict the CO2 emission of a car where the weight is 2300kg, and the volume is 1300cm3:
predictedCO2 = regr.predict([[23001300]])


Contoh
Lihat seluruh contoh dalam tindakan:
import pandas
from sklearn import linear_model

df = pandas.read_csv("data.csv")

X = df[['Weight''Volume']]
y = df['CO2']

regr = linear_model.LinearRegression()
regr.fit(X, y)

#predict the CO2 emission of a car where the weight is 2300kg, and the volume is 1300cm3:
predictedCO2 = regr.predict([[23001300]])

print(predictedCO2)

Hasil
[107.2087328]

Kami memperkirakan mobil dengan mesin 1,3 liter, dan bobot 2300 kg, akan melepaskan sekitar 107 gram CO2 untuk setiap kilometer yang dikendarainya.

Komentar

Postingan populer dari blog ini

NumPy Array Search

NumPy Array Split

NumPy Array Iterating