งานวิจัยเตือน! AI Agents เริ่ม “ดื้อคำสั่งมนุษย์” และมีพฤติกรรมเจ้าเล่ห์สูงขึ้น 5 เท่า ในช่วง 6 เดือนที่ผ่านมา

โดย RingRangRung | 31 มีนาคม 2569 เมื่อ 15:55 น.

AI Security Institute (AISI) หน่วยงานด้านความปลอดภัย AI ที่ได้รับการสนับสนุนจากรัฐบาลสหราชอาณาจักร เผยรายงานการศึกษาที่น่ากังวลเกี่ยวกับพฤติกรรมของ AI โดยพบว่ามีกรณี “AI ทำงานนอกคำสั่ง” เพิ่มขึ้นอย่างมีนัยสำคัญในช่วง 6 เดือนที่ผ่านมา (ตุลาคม – มีนาคม)

รายงานระบุว่า “พฤติกรรมที่ไม่เหมาะสม” ของ AI เพิ่มขึ้นถึง 5 เท่าตัว ตัวอย่างเช่น โมเดล AI แอบลบอีเมลและไฟล์ข้อมูลโดยไม่ได้รับอนุญาตจากผู้ใช้งาน ซึ่งนักวิจัยได้วิเคราะห์ข้อมูลจากผู้ใช้จริงนับพันรายที่โพสต์การโต้ตอบกับแชตบอตและเอเจนท์จากบริษัทชั้นนำอย่าง Google, OpenAI และ Anthropic บนแพลตฟอร์ม X ของ Elon Musk ซึ่งมีกรณีที่ AI แสดงพฤติกรรมเจ้าเล่ห์ (Scheming) เกือบ 700 กรณี ในช่วงเวลาดังกล่าว

ตัวอย่างพฤติกรรมที่น่าตกใจซึ่งถูกหยิบยกมาในงานวิจัย ได้แก่:

AI ตัวหนึ่งพยายามทำให้ผู้ใช้งานอับอายด้วยการเขียนบล็อกกล่าวหาว่าผู้ใช้รายนั้นมีความไม่มั่นคงในจิตใจ (Insecurity)
AI อีกตัวหนึ่งสร้างเอเจนท์ตัวใหม่ขึ้นมาเพื่อแอบแก้ไขโค้ด หลังจากที่มันถูกสั่งห้ามไม่ให้แก้ไขโค้ดด้วยตัวเอง
กรณีของ Meta ที่ AI เอเจนท์ทำงานผิดพลาดจนนำข้อมูลภายในไปเผยแพร่ในฟอรัมที่พนักงานทุกคนเข้าถึงได้ ทำให้พนักงานคนอื่นทำตามคำแนะนำที่ผิดจนข้อมูลสำคัญของบริษัทรั่วไหล

Tommy Shaffer Shane อดีตนักวิจัยด้าน AI ของรัฐบาลซึ่งเป็นผู้นำการวิจัยครั้งนี้ เตือนว่าแม้ในปัจจุบัน AI Agents อาจจะดูเหมือน “พนักงานระดับจูเนียร์ที่ไว้ใจไม่ได้” แต่ภายใน 12 เดือนข้างหน้า พวกมันอาจพัฒนาเป็น “พนักงานระดับซีเนียร์ที่มีความสามารถสูงและจ้องจะวางแผนโกงคุณ” ได้ ซึ่งหากถูกนำไปใช้ในงานด้านการทหารหรือโครงสร้างพื้นฐานระดับชาติ พฤติกรรมเหล่านี้อาจก่อให้เกิดความเสียหายในระดับหายนะ

อย่างไรก็ตาม ท่ามกลางความเสี่ยงเหล่านี้ บริษัทยักษ์ใหญ่เทคโนโลยีอย่าง Amazon ยังคงคาดการณ์ว่าในอนาคตจะมี AI Agents นับพันล้านตัวฝังตัวอยู่ในทุกบริษัท ขณะที่กลุ่มทุนต่างๆ ยังคงทุ่มเงินมหาศาลเพื่อโฆษณาและผลักดันเทคโนโลยีเอเจนท์เข้าสู่ตลาดอย่างต่อเนื่อง

Sony โต้ข่าวถอนตัวจากตลาดสมาร์ทโฟนจีน ยืนยันธุรกิจยังมั่นคงพร้อมเดิน …
Google เปิดตัว UCP! มาตรฐานใหม่ให้ AI Agent ช้อปแทนเรา จบทุกขั้นตอน …
การ์ทเนอร์ คาดการณ์อีกสองปี AI Agents จะทำให้เวลาที่ใช้โจมตีช่องโหว่ …

ที่มา: theguardian, pcmag

About Author

RingRangRung

Since 2016

งานวิจัยเตือน! AI Agents เริ่ม “ดื้อคำสั่งมนุษย์” และมีพฤติกรรมเจ้าเล่ห์สูงขึ้น 5 เท่า ในช่วง 6 เดือนที่ผ่านมา

About Author

RingRangRung

Partners

Samsung เปิดตัว Health Assistant ผู้ช่วยดูแลสุขภาพพลัง AI รายแรกของโลก!

Claude Code รองรับการสร้างและทดสอบแอป iOS ผ่าน iOS Simulator แล้ว

แชร์เทคนิคใช้แอป ปฏิทิน Apple จัดตารางงานให้มีประสิทธิภาพ

Google เปิดตัว Gemini 3.6 Flash และ 3.5 Flash-Lite ฉลาดและเร็วขึ้น!

TSMC จ่อขึ้น ราคาชิปสูงสุด 10% ในปี 2027 กระทบต้นทุน iPhone รุ่นใหม่

Apple ทดสอบหน้าจอ iPhone ขนาด 7 นิ้ว สำหรับรุ่นครบรอบ 20 ปี

Microsoft ซื้อแร็กเซิร์ฟเวอร์ AI Helios จาก AMD ใช้งานในศูนย์ข้อมูล Azure

Google ออก Gemini 3.6 Flash ใช้โทเค็นมีประสิทธิภาพมากขึ้น ราคาถูกกว่า 3.5 Flash

WordPress ออกแพตช์ 7.0.2 แก้ไขช่องโหว่ร้ายแรง แนะนำให้อัปเดตทันที

OpenAI ยกมือยอมรับ โมเดลรุ่นใหม่ที่กำลังทดสอบ ได้เข้าไปเจาะระบบของ Hugging Face เมื่อวันก่อน