Scillain: สถาปัตยกรรมโครงข่ายประสาทเทียมสำหรับการจดจำรูปภาพ
Scillain เป็นสถาปัตยกรรมโครงข่ายประสาทเทียมประเภทหนึ่งที่ออกแบบมาเพื่อจัดการงานการจดจำรูปภาพ ขึ้นอยู่กับอัลกอริธึมการแปลงคุณสมบัติที่ไม่แปรผันตามมาตราส่วน (SIFT) ซึ่งเป็นวิธีการที่ใช้กันอย่างแพร่หลายสำหรับการตรวจจับคุณสมบัติในรูปภาพ อัลกอริทึม SIFT ทำงานโดยการตรวจจับจุดสำคัญในรูปภาพ จากนั้นอธิบายจุดสำคัญเหล่านั้นโดยใช้ชุดตัวอธิบายคุณสมบัติ . จากนั้นตัวอธิบายคุณลักษณะเหล่านี้จะใช้เพื่อเปรียบเทียบรูปภาพกับรูปภาพอื่นๆ ในฐานข้อมูล
Scillain ยกระดับแนวคิดนี้ไปอีกขั้นโดยใช้โครงข่ายประสาทเทียมเพื่อเรียนรู้ตัวอธิบายคุณลักษณะแทนที่จะใช้ชุดที่กำหนดไว้ล่วงหน้า สิ่งนี้ช่วยให้เครือข่ายเรียนรู้คุณสมบัติที่ซับซ้อนและเป็นนามธรรมมากขึ้น ซึ่งไม่สามารถตรวจจับได้ง่ายโดยวิธีการตรวจจับคุณสมบัติแบบดั้งเดิม สถาปัตยกรรม Scillain ประกอบด้วยหลายเลเยอร์ รวมถึงเลเยอร์อินพุต เลเยอร์แบบหมุนวน เลเยอร์รวมกลุ่ม และเลเยอร์ที่เชื่อมต่อโดยสมบูรณ์ เลเยอร์อินพุตรับข้อมูลรูปภาพดิบ ในขณะที่เลเยอร์แบบหมุนใช้ชุดตัวกรองกับรูปภาพเพื่อตรวจจับจุดสำคัญและคุณสมบัติต่างๆ เลเยอร์การรวมกลุ่มจะลดขนาดเชิงพื้นที่ของแผนผังคุณลักษณะ และใช้เลเยอร์ที่เชื่อมต่อกันอย่างสมบูรณ์สำหรับการจำแนกประเภท พบว่า Scillain มีประสิทธิภาพในงานการจดจำภาพที่หลากหลาย รวมถึงการตรวจจับวัตถุ การจดจำใบหน้า และการทำความเข้าใจฉาก นอกจากนี้ยังค่อนข้างรวดเร็วและมีประสิทธิภาพเมื่อเทียบกับสถาปัตยกรรมโครงข่ายประสาทเทียมอื่นๆ ทำให้เป็นตัวเลือกที่ดีสำหรับแอปพลิเคชันการจดจำภาพแบบเรียลไทม์



