


Machine Learning: het belang van generalisatie
In de context van machinaal leren verwijst 'niet-gegeneraliseerd' naar een model dat niet is getraind op een diverse reeks gegevens. Een gegeneraliseerd model is een model dat een breed scala aan inputs kan verwerken en nauwkeurige voorspellingen kan doen voor nieuwe, ongeziene gegevens. Een niet-gegeneraliseerd model daarentegen werkt mogelijk alleen goed op de specifieke gegevens waarop het is getraind en generaliseert mogelijk niet goed naar nieuwe gegevens. Als u bijvoorbeeld een machine learning-model traint op een gegevensset die alleen uit voorbeelden uit één specifiek domein (bijvoorbeeld afbeeldingen van katten), kan het model overmatig passend worden voor dat domein en er niet in slagen te generaliseren naar nieuwe voorbeelden uit verschillende domeinen (bijvoorbeeld honden). In dit geval wordt gezegd dat het model niet-gegeneraliseerd is omdat het niet is getraind op een diverse set gegevens. Om overfitting te voorkomen en de generalisatie van een machine learning-model te verbeteren, is het belangrijk om een diverse set trainingsgegevens te gebruiken die representatief zijn voor een breed scala aan in- en uitgangen. Dit kan het model helpen meer generaliseerbare kenmerken en patronen te leren die kunnen worden toegepast op nieuwe, onzichtbare gegevens.



