Konten [Tampil]

 

Cara Membuat Model Prediksi dengan Machine Learning dalam 10 Menit

Pendahuluan

Machine Learning (ML) memungkinkan kita membuat model prediksi berdasarkan data historis. Dengan menggunakan pustaka populer seperti scikit-learn, kita bisa membangun model dalam waktu singkat. Artikel ini akan menunjukkan langkah-langkah membuat model prediksi sederhana dalam 10 menit menggunakan Python.

1. Instalasi dan Persiapan

Pastikan Anda telah menginstal pustaka berikut:

pip install numpy pandas scikit-learn matplotlib seaborn

Import pustaka yang diperlukan:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error

2. Memuat Dataset

Gunakan dataset contoh atau dataset dari scikit-learn:

from sklearn.datasets import load_diabetes

data = load_diabetes()
df = pd.DataFrame(data.data, columns=data.feature_names)
df['target'] = data.target

# Melihat 5 baris pertama
df.head()

3. Exploratory Data Analysis (EDA)

Sebelum membuat model, kita perlu memahami data.

sns.pairplot(df, diag_kind='kde')
plt.show()

Cek korelasi antar fitur:

plt.figure(figsize=(10,6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.show()

4. Membagi Data untuk Pelatihan dan Pengujian

Pisahkan data menjadi training set dan testing set:

X = df.drop(columns=['target'])
y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

5. Membuat Model Machine Learning

Gunakan Linear Regression untuk membuat model prediksi:

model = LinearRegression()
model.fit(X_train, y_train)

6. Evaluasi Model

Setelah model dilatih, lakukan prediksi dan evaluasi:

y_pred = model.predict(X_test)

mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)

print(f'MAE: {mae}')
print(f'MSE: {mse}')
print(f'RMSE: {rmse}')

7. Visualisasi Hasil Prediksi

Buat grafik perbandingan antara nilai aktual dan prediksi:

plt.scatter(y_test, y_pred, alpha=0.5)
plt.xlabel("Actual Values")
plt.ylabel("Predicted Values")
plt.title("Actual vs Predicted Values")
plt.show()

Kesimpulan

Dalam waktu kurang dari 10 menit, kita telah membuat model prediksi menggunakan Linear Regression. Anda bisa mencoba algoritma lain seperti Random Forest atau Gradient Boosting untuk meningkatkan akurasi.

Selamat mencoba! 🚀

Post a Comment

Lebih baru Lebih lama