การทำความเข้าใจคำและวลีที่ไม่มีก้านในกระบวนการประมวลผลภาษาธรรมชาติ
Unstemmed หมายถึงคำหรือวลีที่ไม่มีต้นกำเนิดหรือรูปแบบราก กล่าวอีกนัยหนึ่ง มันเป็นคำที่ไม่สามารถลดให้เป็นรูปแบบฐานหรือรากได้ ตัวอย่างเช่น คำว่า "วิ่ง" เป็นคำที่แยกไม่ออกเพราะไม่สามารถย่อให้เป็นรูปแบบที่เรียบง่ายกว่าเช่น "วิ่ง" ได้อีกต่อไป ในทำนองเดียวกัน วลี "ม้าสีน้ำตาลตัวใหญ่" ก็ไม่ถูกตัดทอนเช่นกัน เนื่องจากเป็นวลีประสมและไม่สามารถแยกย่อยเป็นคำเดี่ยวๆ ด้วยก้านของมันเองได้ ในทางตรงกันข้าม คำที่ตัดก้านคือคำที่ถูกตัดทอนให้เหลือรูปฐานหรือรากศัพท์ของมันเอง ตัวอย่างเช่น คำว่า "วิ่ง" เป็นคำที่ย่อมาจากคำว่า "วิ่ง" เนื่องจากสามารถย่อมาจากคำว่า "วิ่ง" ได้ ในทำนองเดียวกัน คำว่า "สีน้ำตาล" เป็นคำที่ย่อมาจากวลี "ม้าสีน้ำตาลตัวใหญ่" การสะกดคำและการไม่สะกดคำเป็นแนวคิดที่สำคัญในการประมวลผลภาษาธรรมชาติและการเรียกค้นข้อมูล เนื่องจากช่วยระบุโครงสร้างพื้นฐานของคำและ วลี ซึ่งจะมีประโยชน์สำหรับงานต่างๆ เช่น การค้นหาข้อความ การดึงคำสำคัญ และการสร้างแบบจำลองภาษา



