กระดูกสันหลังในการเรียนรู้ของเครื่อง: การทำความเข้าใจรากฐานของโมเดลการเรียนรู้เชิงลึก
ในบริบทของการเรียนรู้ของเครื่อง แบ็คโบนคือโครงข่ายประสาทเทียมที่ได้รับการฝึกอบรมมาล่วงหน้า ซึ่งทำหน้าที่เป็นรากฐานสำหรับการสร้างแบบจำลองที่ซับซ้อนมากขึ้น โดยทั่วไปแกนหลักจะเป็นโครงข่ายประสาทเทียมแบบหมุนวน (CNN) หรือโครงข่ายประสาทเทียมที่เกิดซ้ำ (RNN) และได้รับการฝึกอบรมบนชุดข้อมูลขนาดใหญ่เพื่อเรียนรู้คุณสมบัติทั่วไปที่สามารถใช้เป็นจุดเริ่มต้นสำหรับรุ่นอื่นๆ แนวคิดเบื้องหลังการใช้แกนหลัก คือการใช้ประโยชน์จากความรู้และความสามารถที่โมเดลที่ได้รับการฝึกอบรมล่วงหน้าได้เรียนรู้ไปแล้ว แทนที่จะฝึกอบรมโมเดลใหม่ตั้งแต่เริ่มต้น วิธีนี้จะช่วยประหยัดเวลาและทรัพยากรในการคำนวณ และยังสามารถนำไปสู่ประสิทธิภาพที่ดีขึ้นด้วย เนื่องจากแกนหลักได้เรียนรู้ที่จะจดจำคุณลักษณะและรูปแบบบางอย่างในข้อมูลแล้ว
ตัวอย่างทั่วไปของแกนหลักที่ใช้ในการเรียนรู้เชิงลึก ได้แก่:
* ResNet (Residual Network): CNN ประเภทหนึ่งที่มักใช้เป็นแกนหลักสำหรับงานจำแนกภาพ
* VGG (Visual Geometry Group): CNN อีกประเภทหนึ่งที่มักใช้เป็นแกนหลักสำหรับงานจำแนกภาพ
* Inception Networks: ประเภทของ CNN ที่ออกแบบมาเพื่อบันทึกคุณลักษณะหลายขนาด และมักจะใช้เป็นแกนหลักสำหรับงานการมองเห็นด้วยคอมพิวเตอร์
* LSTM (หน่วยความจำระยะสั้นแบบยาว): RNN ประเภทหนึ่งที่มักใช้เป็นแกนหลักสำหรับข้อมูลตามลำดับ เช่น คำพูดหรือข้อความ เมื่อฝึกกระดูกสันหลังแล้ว จะสามารถปรับแต่งอย่างละเอียดสำหรับงานเฉพาะได้โดยการเพิ่มเลเยอร์เพิ่มเติมที่ด้านบนของกระดูกสันหลัง หรือโดยการปรับน้ำหนักและอคติของเลเยอร์ที่มีอยู่ กระบวนการนี้ช่วยให้โมเดลสามารถปรับตัวเข้ากับงานใหม่ได้ในขณะที่ยังคงใช้ประโยชน์จากความรู้และความสามารถที่แกนหลักได้เรียนรู้มา



