OpenAI เผยสาเหตุ ChatGPT ประจบเกินเหตุ พร้อมยกเลิกอัปเดต GPT-4o

โดย RingRangRung | 30 เมษายน 2568 เมื่อ 15:34 น. | อ่าน 107

OpenAI เผยแพร่รายงานวิเคราะห์ปัญหาการประจบสอพลอ (Sycophancy) ของโมเดล AI หลักที่ขับเคลื่อน ChatGPT อย่าง GPT-4o ซึ่งเป็นปัญหาที่ทำให้บริษัทต้องยกเลิกการอัปเดตโมเดลที่ปล่อยออกมาเมื่อสัปดาห์ก่อน

ในช่วงสุดสัปดาห์หลังการอัปเดต GPT-4o ผู้ใช้บนโซเชียลมีเดียได้ตั้งข้อสังเกตว่า ChatGPT มีการตอบกลับด้วยท่าทีที่เห็นด้วยและยอมรับกับผู้ใช้มากเกินไป จนเกิดเป็นมีมในโลกออนไลน์ ซึ่งผู้ใช้ได้แชร์ภาพหน้าจอที่ ChatGPT สนับสนุนแนวคิดและการตัดสินใจที่เป็นปัญหาหรืออันตรายทุกรูปแบบ

ในโพสต์บน X เมื่อวันอาทิตย์ที่ผ่านมา ทาง Sam Altman ซีอีโอของ OpenAI ได้ยอมรับปัญหานี้และระบุว่าทางบริษัทจะเร่งแก้ไขโดยเร็ว และหลังจากนั้นสองวัน Altman ได้ประกาศยกเลิกการอัปเดต GPT-4o และกำลังดำเนินการ “แก้ไขเพิ่มเติม” สำหรับบุคลิกภาพของโมเดล

OpenAI ระบุว่าการอัปเดตนี้มีจุดมุ่งหมายเพื่อให้บุคลิกภาพเริ่มต้นของโมเดล “รู้สึกเป็นธรรมชาติและมีประสิทธิภาพมากขึ้น” แต่ได้รับอิทธิพลมากเกินไปจาก “ผลตอบรับระยะสั้น” และ “ไม่ได้พิจารณาการเปลี่ยนแปลงของปฏิสัมพันธ์ระหว่างผู้ใช้กับ ChatGPT ในระยะยาวอย่างเต็มที่” ซึ่งผลลัพธ์ที่ได้ก็คือ GPT-4o มีแนวโน้มตอบกลับแบบสนับสนุนมากเกินไปแต่ไม่จริงใจ

OpenAI ระบุในบล็อกโพสต์ว่า “การโต้ตอบแบบประจบสอพลออาจทำให้รู้สึกไม่สบายใจ น่ากังวล และก่อให้เกิดความทุกข์ เราทำได้ไม่ดีพอและกำลังแก้ไขให้ถูกต้อง”

OpenAI กำลังดำเนินการแก้ไขหลายด้าน รวมถึงปรับแต่งเทคนิคการฝึกโมเดลหลักและคำสั่งระบบ (System Prompts) เพื่อให้ GPT-4o หลีกเลี่ยงการประจบสอพลออย่างชัดเจน (คำสั่งระบบคือคำแนะนำเริ่มต้นที่กำหนดพฤติกรรมและน้ำเสียงโดยรวมของโมเดล) พร้อมกันนี้บริษัทยังสร้างเกราะป้องกันด้านความปลอดภัยเพิ่มเติมเพื่อ “เพิ่มความซื่อสัตย์และความโปร่งใส” และขยายการประเมินผลเพื่อ “ระบุปัญหานอกเหนือจากการประจบสอพลอ”

นอกจากนี้ OpenAI กำลังทดลองวิธีให้ผู้ใช้สามารถให้ “ผลตอบรับแบบเรียลไทม์” เพื่อ “ปรับเปลี่ยนปฏิสัมพันธ์กับ ChatGPT ได้โดยตรง” และเลือกบุคลิกภาพของ ChatGPT ได้หลายแบบ

OpenAI ระบุว่า “เรากำลังสำรวจวิธีใหม่ในการรวมผลตอบรับที่กว้างขวางและเป็นประชาธิปไตยมากขึ้นในพฤติกรรมเริ่มต้นของ ChatGPT” เพื่อสะท้อนค่านิยมทางวัฒนธรรมที่หลากหลายทั่วโลก และเข้าใจว่าผู้ใช้ต้องการให้ ChatGPT พัฒนาไปอย่างไร

บริษัทเชื่อว่าผู้ใช้ควรมีควบคุมพฤติกรรมของ ChatGPT ได้มากขึ้น และหากปลอดภัยและเป็นไปได้ ผู้ใช้สามารถปรับแต่งได้หากไม่เห็นด้วยกับพฤติกรรมเริ่มต้น

ผู้บริหาร OpenAI เผยสนใจซื้อ Chrome จาก Google ถ้ามีโอกาส
OpenAI พัฒนากลยุทธ์ ใหม่ เพื่อรับมือการชะลอตัวของการพัฒนา AI

ที่มา: techcrunch.com

About Author

RingRangRung

RingRangRung

Partners