### Apa Itu Supervised Learning (Prediksi)?
**Supervised Learning** adalah teknik dalam machine learning di mana model dilatih menggunakan data yang sudah diberi label. Data ini terdiri dari fitur input dan output yang diketahui. Model belajar dari data ini untuk memprediksi output yang benar ketika diberikan data baru.
**Prediksi** dalam konteks supervised learning biasanya mengacu pada tugas regresi, di mana output yang diprediksi adalah nilai kontinu. Misalnya, prediksi harga rumah berdasarkan fitur-fitur seperti ukuran, lokasi, dan kondisi rumah.
### Algoritma Prediksi dalam Supervised Learning
Berikut adalah penjelasan dari 30 algoritma prediksi yang umum digunakan dalam supervised learning:
1. **Linear Regression**
- **Deskripsi:** Algoritma ini mencari garis terbaik yang meminimalkan jumlah kuadrat kesalahan antara prediksi dan nilai aktual. Cocok untuk hubungan linier antara variabel input dan output.
- **Contoh:** Memprediksi harga rumah berdasarkan ukuran dan lokasi.
2. **Ridge Regression**
- **Deskripsi:** Varian dari linear regression yang menambahkan regularisasi L2 untuk mencegah overfitting dengan mengurangi bobot koefisien yang besar.
- **Contoh:** Memprediksi pengeluaran bulanan rumah tangga berdasarkan pendapatan dan jumlah anggota keluarga.
3. **Lasso Regression**
- **Deskripsi:** Varian dari linear regression yang menambahkan regularisasi L1 untuk mencegah overfitting dengan mengurangi beberapa koefisien menjadi nol, sehingga juga melakukan feature selection.
- **Contoh:** Memprediksi nilai properti berdasarkan berbagai fitur seperti ukuran, jumlah kamar, dan lokasi.
4. **Elastic Net**
- **Deskripsi:** Kombinasi dari Ridge dan Lasso regression yang menambahkan regularisasi L1 dan L2. Digunakan ketika terdapat banyak fitur yang berkorelasi.
- **Contoh:** Memprediksi performa saham berdasarkan berbagai indikator pasar.
5. **Polynomial Regression**
- **Deskripsi:** Memperluas model linear regression untuk menangkap hubungan non-linier antara variabel input dan output dengan menambahkan polinomial dari fitur.
- **Contoh:** Memprediksi pertumbuhan populasi berdasarkan data historis.
6. **Support Vector Regression (SVR)**
- **Deskripsi:** Versi regresi dari Support Vector Machine yang mencoba menemukan hyperplane terbaik yang memprediksi nilai kontinual.
- **Contoh:** Memprediksi harga komoditas seperti minyak atau emas.
7. **Decision Tree Regression**
- **Deskripsi:** Algoritma ini membagi data ke dalam beberapa simpul berdasarkan fitur yang memberikan informasi paling banyak, dan memberikan prediksi berdasarkan nilai rata-rata di simpul daun.
- **Contoh:** Memprediksi harga mobil bekas berdasarkan fitur seperti usia, jarak tempuh, dan kondisi.
8. **Random Forest Regression**
- **Deskripsi:** Algoritma ensemble yang menggabungkan beberapa pohon keputusan (decision trees) dan menggabungkan prediksi mereka untuk meningkatkan akurasi.
- **Contoh:** Memprediksi hasil panen pertanian berdasarkan data cuaca dan kondisi tanah.
9. **Gradient Boosting Regression**
- **Deskripsi:** Algoritma ensemble yang membangun model secara bertahap, di mana setiap model baru mengoreksi kesalahan dari model sebelumnya.
- **Contoh:** Memprediksi harga tiket pesawat berdasarkan berbagai fitur seperti musim, destinasi, dan waktu pemesanan.
10. **XGBoost Regression**
- **Deskripsi:** Implementasi efisien dari gradient boosting yang dioptimalkan untuk kecepatan dan performa.
- **Contoh:** Memprediksi harga jual rumah untuk kompetisi data science.
11. **AdaBoost Regression**
- **Deskripsi:** Algoritma boosting yang menambahkan model lemah secara berurutan dan memberi bobot lebih pada kesalahan prediksi sebelumnya.
- **Contoh:** Memprediksi biaya asuransi berdasarkan data pelanggan.
12. **LightGBM Regression**
- **Deskripsi:** Implementasi gradient boosting yang dirancang untuk kecepatan dan efisiensi, terutama pada dataset besar.
- **Contoh:** Memprediksi nilai properti berdasarkan berbagai fitur demografis.
13. **CatBoost Regression**
- **Deskripsi:** Algoritma gradient boosting yang dioptimalkan untuk menangani data kategori dan missing values.
- **Contoh:** Memprediksi perilaku pelanggan untuk memutuskan tingkat bunga pinjaman.
14. **K-Nearest Neighbors (KNN) Regression**
- **Deskripsi:** Algoritma non-parametrik yang memprediksi nilai berdasarkan rata-rata nilai dari K tetangga terdekat dalam ruang fitur.
- **Contoh:** Memprediksi suhu udara berdasarkan data historis dari tetangga terdekat.
15. **Bayesian Ridge Regression**
- **Deskripsi:** Varian dari ridge regression yang menggunakan pendekatan probabilistik untuk menentukan distribusi parameter model.
- **Contoh:** Memprediksi tingkat penjualan produk berdasarkan data historis penjualan.
16. **Huber Regression**
- **Deskripsi:** Kombinasi antara regresi linear dan regresi robust yang mengurangi pengaruh outliers dengan menggunakan fungsi loss Huber.
- **Contoh:** Memprediksi pendapatan individu berdasarkan tingkat pendidikan dan pengalaman kerja.
17. **Quantile Regression**
- **Deskripsi:** Algoritma yang memprediksi kuantil dari distribusi target, memungkinkan untuk model yang lebih tahan terhadap outliers.
- **Contoh:** Memprediksi distribusi pendapatan rumah tangga berdasarkan demografi.
18. **Principal Component Regression (PCR)**
- **Deskripsi:** Menggabungkan analisis komponen utama (PCA) dan regresi linear untuk menangani multikolinearitas dalam dataset dengan banyak fitur.
- **Contoh:** Memprediksi konsumsi energi berdasarkan berbagai variabel lingkungan.
19. **Partial Least Squares Regression (PLSR)**
- **Deskripsi:** Algoritma yang mengurangi dimensi data dan membangun model regresi dengan mempertimbangkan kovarians antara fitur dan target.
- **Contoh:** Memprediksi hasil produksi pabrik berdasarkan variabel proses industri.
20. **Stochastic Gradient Descent (SGD) Regression**
- **Deskripsi:** Algoritma yang mengoptimalkan model menggunakan pendekatan gradient descent secara bertahap dan acak, cocok untuk dataset besar.
- **Contoh:** Memprediksi harga saham berdasarkan data historis dan fitur teknis.
21. **Neural Network Regression**
- **Deskripsi:** Jaringan saraf tiruan yang digunakan untuk memprediksi nilai kontinu dengan menggunakan lapisan tersembunyi untuk menangkap pola kompleks dalam data.
- **Contoh:** Memprediksi harga properti berdasarkan berbagai fitur.
22. **Convolutional Neural Network (CNN) Regression**
- **Deskripsi:** Versi regresi dari CNN yang dioptimalkan untuk data spasial atau gambar, menggunakan operasi konvolusi untuk menangkap fitur.
- **Contoh:** Memprediksi harga real estat berdasarkan citra udara.
23. **Recurrent Neural Network (RNN) Regression**
- **Deskripsi:** Jaringan saraf yang digunakan untuk data urut, seperti time series, dengan mempertimbangkan konteks sebelumnya dalam prediksi.
- **Contoh:** Memprediksi harga saham berdasarkan urutan data historis.
24. **Long Short-Term Memory (LSTM) Regression**
- **Deskripsi:** Jenis RNN yang mengatasi masalah pelatihan pada urutan panjang dengan mekanisme memori khusus.
- **Contoh:** Memprediksi permintaan energi berdasarkan data historis.
25. **Gated Recurrent Unit (GRU) Regression**
- **Deskripsi:** Varian RNN yang lebih sederhana dibandingkan LSTM namun tetap efektif untuk data sekuensial.
- **Contoh:** Memprediksi lalu lintas jalan raya berdasarkan data historis dan pola waktu.
26. **Gaussian Process Regression (GPR)**
- **Deskripsi:** Algoritma non-parametrik yang mengasumsikan distribusi Gaussian pada data dan memberikan prediksi dengan estimasi ketidakpastian.
- **Contoh:** Memprediksi deformasi tanah berdasarkan data geoteknik.
27. **Support Vector Regression (SVR) with Radial Basis Function (RBF) Kernel**
- **Deskripsi:** Varian dari SVR yang menggunakan kernel RBF untuk menangkap hubungan non-linier antara variabel input dan output.
- **Contoh:** Memprediksi harga kripto berdasarkan indikator teknis.
28. **Elastic Net Regression**
- **Deskripsi:** Kombinasi dari Ridge dan Lasso Regression yang menggunakan regularisasi L1 dan L2 untuk menangani multikolinearitas dan melakukan feature selection.
- **Contoh:** Memprediksi kinerja akademik siswa berdasarkan berbagai fitur demografi dan pendidikan.
29. **Orthogonal Matching Pursuit (OMP)**
- **Deskripsi:** Algoritma regresi yang memilih subset fitur yang memberikan kontribusi terbesar terhadap prediksi, mengurangi kompleksitas model.
- **Contoh:** Memprediksi permintaan pasar berdasarkan berbagai indikator ekonomi.
30. **Automatic Relevance Determination (ARD) Regression**
- **Deskripsi:** Varian dari Bayesian Ridge Regression yang menentukan relevansi setiap fitur secara otomatis, mengurangi bobot fitur yang kurang penting.
- **Contoh:** Memprediksi tingkat inflasi berdasarkan berbagai variabel ekonomi.
Setiap algoritma memiliki kekuatan dan kelemahan serta cocok untuk jenis data dan masalah
0 comments:
Posting Komentar