Koneoppimisen selkärangat: Syväoppimismallien perustan ymmärtäminen
Koneoppimisen yhteydessä runko on esikoulutettu hermoverkko, joka toimii perustana monimutkaisempien mallien rakentamiselle. Runko on tyypillisesti konvoluutiohermoverkko (CNN) tai toistuva hermoverkko (RNN), ja se on koulutettu suuren tietojoukon avulla oppimaan yleisiä ominaisuuksia, joita voidaan käyttää muiden mallien lähtökohtana.
Runkverkon käytön idea on hyödyntää tietoja ja kykyjä, jotka esikoulutettu malli on jo oppinut, sen sijaan, että koulutettaisiin uutta mallia tyhjästä. Tämä voi säästää aikaa ja laskennallisia resursseja ja parantaa suorituskykyä, koska runko on jo oppinut tunnistamaan tietyt ominaisuudet ja mallit tiedoista.
Joitakin yleisiä esimerkkejä syväoppimisessa käytetyistä rungoista:
* ResNet (jäännösverkko): Eräs CNN-tyyppi, jota käytetään yleisesti kuvien luokittelutehtävien selkärankana.
* VGG (Visual Geometry Group): Toinen CNN-tyyppi, jota käytetään usein kuvien luokittelutehtävien selkärankana.
* Alkuverkot: CNN-tyyppi. joka on suunniteltu kaappaamaan monimuotoisia ominaisuuksia, ja sitä käytetään usein tietokonenäkötehtävien selkärankana.
* LSTM (Long Short-Term Memory): RNN-tyyppi, jota käytetään yleisesti runkoverkkona peräkkäisille tiedoille, kuten esim. puhe tai teksti.
Kun runko on koulutettu, sitä voidaan hienosäätää tiettyä tehtävää varten lisäämällä ylimääräisiä kerroksia rungon päälle tai säätämällä olemassa olevien tasojen painoja ja painotuksia. Tämä prosessi antaa mallin mukautua uuteen tehtävään samalla kun se hyödyntää selkärangan oppimia tietoja ja kykyjä.



