Pembelajaran Mesin: Kepentingan Generalisasi
Dalam konteks pembelajaran mesin, "ungeneralized" merujuk kepada model yang belum dilatih pada set data yang pelbagai. Model umum ialah model yang boleh mengendalikan pelbagai input dan menghasilkan ramalan yang tepat untuk data baharu yang tidak kelihatan. Model yang tidak digeneralisasikan, sebaliknya, mungkin hanya berfungsi dengan baik pada data khusus yang dilatih dan mungkin tidak digeneralisasikan dengan baik kepada data baharu.
Sebagai contoh, jika anda melatih model pembelajaran mesin pada set data yang hanya terdiri daripada contoh daripada satu domain tertentu (cth., imej kucing), model mungkin menjadi terlalu sesuai dengan domain tersebut dan gagal untuk digeneralisasikan kepada contoh baharu daripada domain yang berbeza (cth., anjing). Dalam kes ini, model itu dikatakan tidak digeneralisasikan kerana ia tidak dilatih pada set data yang pelbagai.
Untuk mengelakkan overfitting dan meningkatkan generalisasi model pembelajaran mesin, adalah penting untuk menggunakan set data latihan yang pelbagai yang mewakili pelbagai input dan output. Ini boleh membantu model mempelajari ciri dan corak yang lebih umum yang boleh digunakan pada data baharu yang tidak kelihatan.



