แบบจำลอง Linear binary classification

หลังจากที่เราได้รู้จักหลักในการสร้าง adversarial example และการเทรน robust model กันแล้ว เราจะลองนำหลักดังกล่าวมาวิเคราะห์บนแบบจำลอง classification ที่ง่ายที่สุดก่อน นั่นคือแบบจำลองเชิงเส้น (linear model) ซึ่งจะใช้ฟังก์ชันเชิงเส้น (linear function) ในการจำแนกข้อมูล หรือกล่าวได้ว่าเราสามารถแทนแบบจำลองได้ด้วยฟังก์ชัน ดังนี้

เมื่อ

Logistic regression

เพื่อความง่าย เราจะเริ่มพิจารณากรณีที่ข้อมูลมี 2 กลุ่มเท่านั้น () นั่นคือ เราสนใจการสร้างฟังก์ชันเชิงเส้นสำหรับปัญหา binary classification

สำหรับ loss function ในกรณีที่เราต้องการจำแนกข้อมูลเป็นสองกลุ่ม (กลุ่มที่ 1 และกลุ่มที่ 2) หากเราใช้แบบจำลองที่คืนค่า เป็นเวกเตอร์สองมิติ และใช้ฟังก์ชัน softmax ในการคำนวณความน่าจะเป็นที่ตัวอย่างข้อมูล ใด ๆ จะอยู่ในแต่ละกลุ่ม จะได้ว่าความน่าจะเป็นที่ จะอยู่ในกลุ่มที่ 1 มีค่าเป็น

และความน่าจะเป็นที่ จะอยู่ในกลุ่มที่ 2 มีค่าเป็น

เมื่อ และ

ดังนั้นจะเห็นว่า เราสามารถใช้ฟังก์ชันเชิงเส้น ที่คืนค่าเป็นจำนวนจริง

เป็นตัวแทนการตัดสินใจของ ได้เช่นกัน โดยถ้าเราให้ข้อมูลกลุ่มแรกมี label เป็น และกลุ่มที่สองมี label เป็น จะได้ว่า ความน่าจะเป็นที่ตัวอย่างข้อมูล จะมี label เป็น คือ

ดังนั้น สำหรับปัญหา linear binary classification เราสามารถนิยามแบบจำลองเชิงเส้นได้ด้วยฟังก์ชัน ดังนี้

เมื่อ โดยมี class label เป็น และ loss function คำนวณได้จาก

เราเรียกแบบจำลองนี้ว่า logistic regression และเรียก loss function นี้ว่า logistic loss เพื่อความสะดวกเรานิยามให้ เราจะเขียนแทน logistic loss ได้ด้วย

References

  1. Z. Kolter, A. Madry. Adversarial Robustness - Theory and Practice

Prev: การสร้าง robust classifier

Next: Adversarial linear binary classification