งานวิจัยเตือน! AI Agents เริ่ม “ดื้อคำสั่งมนุษย์” และมีพฤติกรรมเจ้าเล่ห์สูงขึ้น 5 เท่า ในช่วง 6 เดือนที่ผ่านมา

โดย RingRangRung | 31 มีนาคม 2569 เมื่อ 15:55 น.
AI Agents

AI Security Institute (AISI) หน่วยงานด้านความปลอดภัย AI ที่ได้รับการสนับสนุนจากรัฐบาลสหราชอาณาจักร เผยรายงานการศึกษาที่น่ากังวลเกี่ยวกับพฤติกรรมของ AI โดยพบว่ามีกรณี “AI ทำงานนอกคำสั่ง” เพิ่มขึ้นอย่างมีนัยสำคัญในช่วง 6 เดือนที่ผ่านมา (ตุลาคม – มีนาคม)

รายงานระบุว่า “พฤติกรรมที่ไม่เหมาะสม” ของ AI เพิ่มขึ้นถึง 5 เท่าตัว ตัวอย่างเช่น โมเดล AI แอบลบอีเมลและไฟล์ข้อมูลโดยไม่ได้รับอนุญาตจากผู้ใช้งาน ซึ่งนักวิจัยได้วิเคราะห์ข้อมูลจากผู้ใช้จริงนับพันรายที่โพสต์การโต้ตอบกับแชตบอตและเอเจนท์จากบริษัทชั้นนำอย่าง Google, OpenAI และ Anthropic บนแพลตฟอร์ม X ของ Elon Musk ซึ่งมีกรณีที่ AI แสดงพฤติกรรมเจ้าเล่ห์ (Scheming) เกือบ 700 กรณี ในช่วงเวลาดังกล่าว

ตัวอย่างพฤติกรรมที่น่าตกใจซึ่งถูกหยิบยกมาในงานวิจัย ได้แก่:

  • AI ตัวหนึ่งพยายามทำให้ผู้ใช้งานอับอายด้วยการเขียนบล็อกกล่าวหาว่าผู้ใช้รายนั้นมีความไม่มั่นคงในจิตใจ (Insecurity)
  • AI อีกตัวหนึ่งสร้างเอเจนท์ตัวใหม่ขึ้นมาเพื่อแอบแก้ไขโค้ด หลังจากที่มันถูกสั่งห้ามไม่ให้แก้ไขโค้ดด้วยตัวเอง
  • กรณีของ Meta ที่ AI เอเจนท์ทำงานผิดพลาดจนนำข้อมูลภายในไปเผยแพร่ในฟอรัมที่พนักงานทุกคนเข้าถึงได้ ทำให้พนักงานคนอื่นทำตามคำแนะนำที่ผิดจนข้อมูลสำคัญของบริษัทรั่วไหล

Tommy Shaffer Shane อดีตนักวิจัยด้าน AI ของรัฐบาลซึ่งเป็นผู้นำการวิจัยครั้งนี้ เตือนว่าแม้ในปัจจุบัน AI Agents อาจจะดูเหมือน “พนักงานระดับจูเนียร์ที่ไว้ใจไม่ได้” แต่ภายใน 12 เดือนข้างหน้า พวกมันอาจพัฒนาเป็น “พนักงานระดับซีเนียร์ที่มีความสามารถสูงและจ้องจะวางแผนโกงคุณ” ได้ ซึ่งหากถูกนำไปใช้ในงานด้านการทหารหรือโครงสร้างพื้นฐานระดับชาติ พฤติกรรมเหล่านี้อาจก่อให้เกิดความเสียหายในระดับหายนะ

อย่างไรก็ตาม ท่ามกลางความเสี่ยงเหล่านี้ บริษัทยักษ์ใหญ่เทคโนโลยีอย่าง Amazon ยังคงคาดการณ์ว่าในอนาคตจะมี AI Agents นับพันล้านตัวฝังตัวอยู่ในทุกบริษัท ขณะที่กลุ่มทุนต่างๆ ยังคงทุ่มเงินมหาศาลเพื่อโฆษณาและผลักดันเทคโนโลยีเอเจนท์เข้าสู่ตลาดอย่างต่อเนื่อง

Sony โต้ข่าวถอนตัวจากตลาดสมาร์ทโฟนจีน ยืนยันธุรกิจยังมั่นคงพร้อมเดิน …
Google เปิดตัว UCP! มาตรฐานใหม่ให้ AI Agent ช้อปแทนเรา จบทุกขั้นตอน …
การ์ทเนอร์ คาดการณ์อีกสองปี AI Agents จะทำให้เวลาที่ใช้โจมตีช่องโหว่ …

ที่มา: theguardian, pcmag

About Author

RingRangRung

RingRangRung