การทำความเข้าใจเลเยอร์ในการเรียนรู้เชิงลึก
ในบริบทของการเรียนรู้ของเครื่อง เลเยอร์คือชุดของเซลล์ประสาทที่เชื่อมต่อถึงกันในลักษณะเฉพาะ แต่ละเลเยอร์ในโครงข่ายประสาทเทียมได้รับการออกแบบมาเพื่อทำหน้าที่เฉพาะ เช่น แยกคุณสมบัติออกจากข้อมูลอินพุตหรือการแปลงเอาต์พุตของเลเยอร์ก่อนหน้า
มีเลเยอร์หลายประเภทที่ใช้กันทั่วไปในสถาปัตยกรรมการเรียนรู้เชิงลึก รวมถึง:
1 เลเยอร์อินพุต: เลเยอร์นี้รับข้อมูลอินพุตดิบและส่งผ่านไปยังเลเยอร์ถัดไป
2 เลเยอร์ที่ซ่อนอยู่: เลเยอร์เหล่านี้เป็นที่ที่ความมหัศจรรย์เกิดขึ้น พวกเขารับข้อมูลอินพุตและใช้ชุดของการแปลงกับข้อมูลดังกล่าว เช่น การแปลงเชิงเส้น การเปิดใช้งานแบบไม่เชิงเส้น และการรวมกลุ่ม ผลลัพธ์ของเลเยอร์เหล่านี้เป็นชุดของแผนที่คุณลักษณะที่แสดงข้อมูลอินพุตในลักษณะที่เป็นนามธรรมมากขึ้น
3 เลเยอร์เอาต์พุต: เลเยอร์นี้รับเอาต์พุตของเลเยอร์ที่ซ่อนอยู่และสร้างเอาต์พุตสุดท้ายของโมเดล โดยทั่วไปจะมีฟังก์ชันการเปิดใช้งาน softmax เพื่อสร้างความน่าจะเป็นสำหรับแต่ละคลาส
4 เลเยอร์แบบหมุนวน: เลเยอร์เหล่านี้ได้รับการออกแบบมาเพื่อดึงคุณลักษณะต่างๆ จากรูปภาพและข้อมูลคล้ายตารางอื่นๆ พวกเขาใช้ตัวกรองแบบหมุนเพื่อสแกนข้อมูลอินพุตและสร้างแผนที่คุณลักษณะ
5 การรวมเลเยอร์: เลเยอร์เหล่านี้จะลดขนาดเชิงพื้นที่ของข้อมูลอินพุตเพื่อรวบรวมคุณสมบัติที่สำคัญที่สุด พวกเขาใช้ฟังก์ชันการรวมกลุ่ม เช่น การรวมกลุ่มสูงสุดหรือการรวมกลุ่มเฉลี่ย เพื่อเลือกคุณสมบัติที่เกี่ยวข้องมากที่สุด
6 เลเยอร์ที่เกิดซ้ำ: เลเยอร์เหล่านี้ออกแบบมาเพื่อประมวลผลข้อมูลตามลำดับ เช่น อนุกรมเวลาหรือข้อความ พวกเขาใช้การเชื่อมต่อที่เกิดซ้ำเพื่อรักษาสถานะที่ซ่อนอยู่ซึ่งรวบรวมข้อมูลจากอินพุตก่อนหน้า แต่ละเลเยอร์ในโครงข่ายประสาทเทียมเชื่อมต่อกับเลเยอร์ถัดไปผ่านชุดน้ำหนักและอคติ น้ำหนักจะกำหนดความแข็งแกร่งของการเชื่อมต่อระหว่างเซลล์ประสาท ในขณะที่อคติจะกำหนดเกณฑ์ในการเปิดใช้งานเซลล์ประสาทแต่ละอัน ในระหว่างการฝึก โมเดลจะปรับน้ำหนักและความเอนเอียงเหล่านี้เพื่อลดข้อผิดพลาดระหว่างเอาต์พุตที่คาดการณ์ไว้และเอาต์พุตที่แท้จริง



