Scillain: Seni Bina Rangkaian Neural untuk Pengecaman Imej
Scillain ialah sejenis seni bina rangkaian saraf yang direka untuk mengendalikan tugas pengecaman imej. Ia berdasarkan algoritma Scale-Invariant Feature Transform (SIFT), yang merupakan kaedah yang digunakan secara meluas untuk pengesanan ciri dalam imej.
Algoritma SIFT berfungsi dengan mengesan titik utama dalam imej dan kemudian menerangkan perkara utama tersebut menggunakan set deskriptor ciri . Deskriptor ciri ini kemudiannya digunakan untuk membandingkan imej dengan imej lain dalam pangkalan data.
Scillain membawa idea ini selangkah lebih jauh dengan menggunakan rangkaian saraf untuk mempelajari deskriptor ciri dan bukannya menggunakan set yang telah ditetapkan daripadanya. Ini membolehkan rangkaian mempelajari ciri yang lebih kompleks dan abstrak yang tidak mudah ditangkap oleh kaedah pengesanan ciri tradisional.
Seni bina Scillain terdiri daripada beberapa lapisan, termasuk lapisan input, lapisan konvolusi, lapisan pengumpulan dan lapisan bersambung sepenuhnya. Lapisan input mengambil data imej mentah, manakala lapisan konvolusi menggunakan satu siri penapis pada imej untuk mengesan titik dan ciri utama. Lapisan pengumpulan mengurangkan dimensi spatial peta ciri, dan lapisan bersambung sepenuhnya digunakan untuk pengelasan.
Scillain telah terbukti berkesan pada pelbagai tugas pengecaman imej, termasuk pengesanan objek, pengecaman muka dan pemahaman pemandangan. Ia juga agak pantas dan cekap berbanding dengan seni bina rangkaian saraf yang lain, menjadikannya pilihan yang baik untuk aplikasi pengecaman imej masa nyata.



