การบรรจุถุง (การรวม Bootstrap) ในการเรียนรู้ของเครื่อง: การลดความแปรปรวนและการปรับปรุงลักษณะทั่วไป
Bagging (Bootstrap Aggregating) เป็นเทคนิคที่ใช้ในการเรียนรู้ของเครื่องเพื่อลดความแปรปรวนของแบบจำลองและปรับปรุงความสามารถในการวางนัยทั่วไป โดยเกี่ยวข้องกับการสร้างอินสแตนซ์เดียวกันหลายอินสแตนซ์ โดยแต่ละอินสแตนซ์มีชุดย่อยของข้อมูลการฝึกที่แตกต่างกัน และรวมการคาดการณ์เข้าด้วยกันเพื่อทำการทำนายขั้นสุดท้าย ต่อไปนี้คือวิธีการทำงาน:
1 การสุ่มตัวอย่าง Bootstrap: ชุดย่อยแบบสุ่มของข้อมูลการฝึกจะถูกเลือกพร้อมการแทนที่ (เช่น ตัวอย่างบางส่วนอาจถูกเลือกมากกว่าหนึ่งครั้ง) สิ่งนี้จะสร้างชุดข้อมูลใหม่ที่เป็นการสุ่มแทนชุดข้อมูลดั้งเดิม
2 การฝึกโมเดล: แต่ละอินสแตนซ์ของโมเดลได้รับการฝึกฝนบนตัวอย่างบูตสแตรป
3 การคาดการณ์: แต่ละอินสแตนซ์ของแบบจำลองจะทำการคาดการณ์ข้อมูลการทดสอบ
4 การรวมการคาดการณ์: การคาดการณ์จากทุกกรณีของแบบจำลองจะรวมกันโดยใช้เทคนิค เช่น การหาค่าเฉลี่ยหรือการลงคะแนนเสียง เพื่อทำการทำนายขั้นสุดท้าย แนวคิดเบื้องหลังการบรรจุถุงคือการสุ่มในการเลือกข้อมูลการฝึกอบรมและชุดย่อยต่างๆ ของคุณสมบัติที่ใช้โดย แต่ละอินสแตนซ์ของโมเดลจะลดความแปรปรวนของโมเดลและปรับปรุงความสามารถในการสรุปข้อมูลใหม่ ด้วยการรวมการคาดการณ์ของแบบจำลองต่างๆ เข้าด้วยกัน การบรรจุถุงยังสามารถช่วยลดการบรรจุมากเกินไปและปรับปรุงความทนทานของแบบจำลองได้อีกด้วย
การบรรจุถุงมักใช้ในแผนผังการตัดสินใจ ป่าสุ่ม และวิธีการเรียนรู้แบบรวมกลุ่มอื่นๆ ซึ่งจะมีประโยชน์อย่างยิ่งเมื่อมีคุณลักษณะมากมายในชุดข้อมูล และความสัมพันธ์ระหว่างคุณลักษณะกับตัวแปรเป้าหมายมีความซับซ้อน



