Adversarial linear binary classification

ในหัวข้อนี้เราจะมาวิเคราะห์การสร้าง adversarial example สำหรับแบบจำลอง logistic regression และการเทรน logistic regression classifier ให้มีความทนทานต่อการก่อกวน

การสร้าง adversarial example

เมื่อเราพิจารณาการสร้าง adversarial example หรือการก่อกวนแบบจำลอง logistic regression นี้ด้วยปัญหา maximization ในปัญหา min-max robust optimization เราจะได้ว่าปัญหาของเราคือ

สิ่งที่น่าสนใจสำหรับกรณีของ logistic regression นี้คือเราสามารถแก้ปัญหา maximization นี้ได้ เนื่องจากฟังก์ชัน ที่เราใช้นั้นมีลักษณะเป็น monotonically decreasing กล่าวคือค่าของ จะมีค่าลดลงเสมอเมื่อ มีค่าเพิ่มขึ้น หากเราลองพล็อตกราฟระหว่าง และ จะได้รูปดังตัวอย่าง

จากคุณสมบัติของฟังก์ชัน นี้ จะเห็นว่าหากเราต้องการให้ คืนผลลัพธ์ที่มีค่ามากที่สุด เราทำได้โดยส่งค่าที่น้อยที่สุดเข้าไปให้ นั่นเอง นั่นคือ

จะได้ว่าปัญหาของเราลดรูปมาเป็น

สมมติให้ เป็น -norm หากเราพิจารณากรณีที่ จะเห็นว่า เราสามารถหาคำตอบของปัญหา minimization นี้ได้โดยกำหนดให้ เมื่อ และให้ เมื่อ ในกรณีที่ เราก็เพียงสลับเครื่องหมายของ ตามเงื่อนไขเหล่านี้ เราก็จะสามารถหา ที่เป็นคำตอบที่ดีที่สุดได้ เราอาจเขียนคำตอบนี้ได้เป็น

ซึ่งเมื่อเราแทนค่า เข้าไปในฟังก์ชันที่ต้องการค่าน้อยที่สุด จะได้ว่า

ดังนั้นเราสามารถแก้ปัญหา maximization ในการสร้าง adversarial example ได้ดังนี้

การเทรน robust classifier

จากปัญหา min-max robust optimization เมื่อเราสามารถแก้ปัญหา maximization ข้างในได้ การหาพารามิเตอร์ที่เหมาะสมสำหรับแบบจำลองที่มีความทนทานก็ทำได้โดยการแก้ปัญหา minimization ต่อไปนี้

เมื่อ เป็นเซตของ training data ซึ่งปัญหานี้มีคุณสมบัติ convex บนตัวแปร และ ดังนั้นอัลกอริทึมในกลุ่ม gradient descent เช่น SGD ก็สามารถนำไปสู่คำตอบที่ดีที่สุดได้

References

  1. Z. Kolter, A. Madry. Adversarial Robustness - Theory and Practice

Prev: แบบจำลอง Linear binary classification

Next: Fast Gradient Sign Method