Koneoppiminen: yleistämisen merkitys
Koneoppimisen yhteydessä "yleistämätön" viittaa malliin, jota ei ole koulutettu erilaisiin tietoihin. Yleistetty malli on malli, joka pystyy käsittelemään monenlaisia syötteitä ja tuottamaan tarkkoja ennusteita uudelle, näkemättömälle tiedolle. Toisaalta yleistämätön malli voi toimia hyvin vain tietyillä tiedoilla, joille se on koulutettu, eikä se välttämättä yleisty hyvin uusiin tietoihin.
Esimerkiksi jos harjoitat koneoppimismallia tietojoukossa, joka koostuu vain yhdestä mallista peräisin olevista esimerkeistä. tietyllä alueella (esim. kissojen kuvat), malli voi tulla liian sopivaksi kyseiselle alueelle eikä se voi yleistää uusiin esimerkkeihin eri alueilta (esim. koirat). Tässä tapauksessa mallin sanotaan olevan yleistämätön, koska sitä ei ole koulutettu erilaisille datajoukoille.
Jotta vältytään ylisovittamiselta ja parannetaan koneoppimismallin yleistämistä, on tärkeää käyttää monipuolista koulutusdataa, joka edustaa laaja valikoima tuloja ja lähtöjä. Tämä voi auttaa mallia oppimaan yleistettäviä ominaisuuksia ja malleja, joita voidaan soveltaa uuteen, näkymättömään dataan.



