Cara Membuat Model Prediksi dengan Machine Learning dalam 10 Menit
Pendahuluan
Machine Learning (ML) memungkinkan kita membuat model prediksi berdasarkan data historis. Dengan menggunakan pustaka populer seperti scikit-learn, kita bisa membangun model dalam waktu singkat. Artikel ini akan menunjukkan langkah-langkah membuat model prediksi sederhana dalam 10 menit menggunakan Python.
1. Instalasi dan Persiapan
Pastikan Anda telah menginstal pustaka berikut:
pip install numpy pandas scikit-learn matplotlib seaborn
Import pustaka yang diperlukan:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error
2. Memuat Dataset
Gunakan dataset contoh atau dataset dari scikit-learn:
from sklearn.datasets import load_diabetes
data = load_diabetes()
df = pd.DataFrame(data.data, columns=data.feature_names)
df['target'] = data.target
# Melihat 5 baris pertama
df.head()
3. Exploratory Data Analysis (EDA)
Sebelum membuat model, kita perlu memahami data.
sns.pairplot(df, diag_kind='kde')
plt.show()
Cek korelasi antar fitur:
plt.figure(figsize=(10,6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm')
plt.show()
4. Membagi Data untuk Pelatihan dan Pengujian
Pisahkan data menjadi training set dan testing set:
X = df.drop(columns=['target'])
y = df['target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
5. Membuat Model Machine Learning
Gunakan Linear Regression untuk membuat model prediksi:
model = LinearRegression()
model.fit(X_train, y_train)
6. Evaluasi Model
Setelah model dilatih, lakukan prediksi dan evaluasi:
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
print(f'MAE: {mae}')
print(f'MSE: {mse}')
print(f'RMSE: {rmse}')
7. Visualisasi Hasil Prediksi
Buat grafik perbandingan antara nilai aktual dan prediksi:
plt.scatter(y_test, y_pred, alpha=0.5)
plt.xlabel("Actual Values")
plt.ylabel("Predicted Values")
plt.title("Actual vs Predicted Values")
plt.show()
Kesimpulan
Dalam waktu kurang dari 10 menit, kita telah membuat model prediksi menggunakan Linear Regression. Anda bisa mencoba algoritma lain seperti Random Forest atau Gradient Boosting untuk meningkatkan akurasi.
Selamat mencoba! 🚀
Posting Komentar