Bagging (Bootstrap Aggregating) ve strojovém učení: Snížení rozptylu a zlepšení zobecnění
Bagging (Bootstrap Aggregating) je technika používaná ve strojovém učení ke snížení rozptylu modelu a zlepšení jeho schopnosti generalizace. Zahrnuje vytvoření více instancí stejného modelu, z nichž každá má jinou podmnožinu trénovacích dat, a kombinování jejich předpovědí za účelem vytvoření konečné předpovědi.……Funguje to takto:…1. Vzorkování bootstrapu: Náhodná podmnožina trénovacích dat je vybrána s nahrazením (tj. některé vzorky mohou být vybrány více než jednou). Tím se vytvoří nová datová sada, která je náhodnou reprezentací té původní.
2. Trénink modelu: Každá instance modelu je trénována na vzorku bootstrapu.
3. Predikce: Každá instance modelu vytváří předpověď na testovací data.
4. Kombinování předpovědí: Předpovědi ze všech instancí modelu jsou kombinovány pomocí techniky, jako je průměrování nebo hlasování, aby se vytvořila konečná předpověď. každá instance modelu sníží rozptyl modelu a zlepší jeho schopnost zobecnit na nová data. Kombinací předpovědí více modelů může pytlování také pomoci snížit nadměrné vybavení a zlepšit robustnost modelu. Je zvláště užitečné, když je v datové množině mnoho funkcí a vztah mezi funkcemi a cílovou proměnnou je složitý.



