เผย Gemini ของ Google มีอาการ ‘สติแตก’ ขณะเล่นเกม Pokémon

โดย RingRangRung | 18 มิถุนายน 2568 เมื่อ 18:02 น. | อ่าน 49

ในความพยายามศึกษาพฤติกรรมของโมเดลเอไอ ล่าสุด Google DeepMind และ Anthropic ได้ทดลองให้ Gemini 2.5 Pro และ Claude เล่นเกม Pokémon ซึ่งในการศึกษาก็ได้เจอกับผลลัพธ์ที่ได้ทั้งน่าสนใจ เมื่อพบว่า Gemini 2.5 Pro แสดงอาการ “ตื่นตระหนก” เมื่อ Pokémon ที่ใช้งานอยู่ใกล้ตาย ซึ่งส่งผลให้ “ประสิทธิภาพการใช้เหตุผลของโมเดลลดลงอย่างเห็นได้ชัด”

การวัดประสิทธิภาพ AI (AI benchmarking) หรือ กระบวนการเปรียบเทียบประสิทธิภาพของโมเดล AI ต่างๆ เป็นศาสตร์ที่มักให้บริบทเพียงเล็กน้อยเกี่ยวกับความสามารถที่แท้จริงของโมเดลที่กำหนด แต่ก็มีนักวิจัยบางรายเชื่อว่าการศึกษาโมเดล AI ว่าจะเล่นวีดีโอเกมอย่างไรเป็นสิ่งที่มีประโยชน์ (หรืออย่างน้อยก็เป็นความบันเทิงของผู้ทดสอบเอง)

ในช่วงหลายเดือนที่ผ่านมา นักพัฒนาอิสระสองรายที่ไม่เกี่ยวข้องกับ Google หรือ Anthropic ได้ตั้งสตรีมบน Twitch ชื่อ “Gemini Plays Pokémon” และ “Claude Plays Pokémon” เพื่อให้ทุกคนสามารถรับชมความพยายามของ AI ในการเล่นเกมที่ออกวางจำหน่ายมากว่า 25 ปี ได้แบบเรียลไทม์

แต่ละสตรีมจะแสดงกระบวนการ “การใช้เหตุผล” ของ AI หรือารแปลด้วยภาษาธรรมชาติว่า AI ประเมินปัญหาและตอบสนองอย่างไร ทำให้เราเข้าใจวิธีการทำงานของโมเดลเหล่านี้

แม้ว่าความก้าวหน้าของโมเดล AI เหล่านี้จะน่าประทับใจ แต่ AI ที่ทดสอบก็ยังเล่น Pokémon ได้ไม่เชี่ยวชาญนัก โดยที่ Gemini ต้องใช้เวลาหลายร้อยชั่วโมงในการใช้เหตุผลเพื่อผ่านเกมที่เด็กคนหนึ่งสามารถเล่นจนจบได้โดยเวลาที่น้อยกว่ามาก

อย่างไรก็ดีสิ่งที่น่าสนใจในการดู AI เล่นเกม Pokémon ไม่ใช่เรื่องระยะเวลาที่ใช้จบเกม แต่เป็นพฤติกรรมของ AI ที่แสดงในระหว่างการเล่น โดยที่ตามราย
งานระบุว่า “ในระหว่างการเล่น Gemini 2.5 Pro ได้เผชิญสถานการณ์ต่าง ๆ ที่ทำให้โมเดลจำลองพฤติกรรม ‘ตื่นตระหนก’”

สถานะ “ตื่นตระหนก” นี้ทำให้ประสิทธิภาพของโมเดลแย่ลง โดย AI อาจหยุดใช้เครื่องมือบางอย่างที่มีอยู่ในช่วงหนึ่งของระหว่างการเล่นเกม แม้ว่า AI จะไม่ได้คิดหรือสัมผัสอารมณ์ แต่การกระทำของมันเลียนแบบวิธีที่มนุษย์อาจตัดสินใจผิดพลาดอย่างเร่งรีบเมื่ออยู่ภายใต้ความกดดัน ซึ่งเป็นปฏิกิริยาที่น่าสนใจแต่ก็น่ากังวล

“พฤติกรรมนี้เกิดขึ้นในหลายๆ ครั้ง จนกระทั่งสมาชิกในแชท Twitch สังเกตเห็นเมื่อมันเกิดขึ้นอย่างชัดเจน” รายงานระบุ

ขณะที่ Claude จาก Anthropic ก็แสดงพฤติกรรมที่น่าสนใจในระหว่างการผจญภัยในภูมิภาค Kanto เช่นกัน โดยมีกรณีหนึ่งที่ Claude สังเกตว่ารูปแบบเมื่อ Pokémon ทั้งหมดที่มีหมดพลังชีวิต ตัวละครผู้เล่นจะ “White out” และกลับไปที่ Pokémon Center

เมื่อ Claude ติดอยู่ในถ้ำ Mt. Moon ตัว AI ก็ตั้งสมมติฐานผิด ๆ ว่าหากทำให้ Pokémon ที่มีหมดสติทั้งหมด ตัวละครของมันก็จะถูกส่งไปยัง Pokémon Center เมืองถัดไป

อย่างไรก็ตาม นั่นไม่ใช่วิธีการทำงานของเกม เมื่อ Pokémon ทั้งหมดตาย ผู้เล่นจะกลับไปที่ Pokémon Center ที่ใช้ล่าสุด ไม่ใช่ที่ใกล้ที่สุดทางภูมิศาสตร์ ซึ่งผู้ชมก็ต้องตกใจเมื่อเห็น AI พยายาม “ฆ่าตัวตาย” ในเกม

แม้จะมีข้อบกพร่อง แต่ AI ก็มีบางด้านที่เหนือกว่าผู้เล่นมนุษย์ โดยที่ในการเปิดตัว Gemini 2.5 Pro สามารถแก้ปริศนาได้อย่างแม่นยำ และด้วยความช่วยเหลือจากมนุษย์ AI ก็ได้สร้างเครื่องมือ Agentic หรืออินสแตนซ์ของ Gemini 2.5 Pro ที่ออกแบบสำหรับงานเฉพาะ เพื่อแก้ปริศนาก้อนหินและหาเส้นทางที่มีประสิทธิภาพในการไปถึงจุดหมายภายในเกม

“ด้วยเพียงคำสั่งที่อธิบายฟิสิกส์ของก้อนหินและวิธีตรวจสอบเส้นทางที่ถูกต้อง Gemini 2.5 Pro สามารถแก้ปริศนาก้อนหินที่ซับซ้อนบางอันได้ในครั้งเดียว ซึ่งจำเป็นสำหรับการผ่าน Victory Road” รายงานระบุ

เนื่องจาก Gemini 2.5 Pro ทำงานส่วนใหญ่ในการสร้างเครื่องมือเหล่านี้ด้วยตัวเอง Google จึงตั้งทฤษฎีว่าโมเดลปัจจุบันอาจสามารถสร้างเครื่องมือเหล่านี้ได้โดยไม่ต้องมีมนุษย์เข้ามาเกี่ยวข้อง แล้วใครเลยจะรู้ บางที Gemini อาจพัฒนาโมดูล “อย่าตื่นตระหนก” ให้ตัวเองได้ในอนาคต

Google Gemini อัปเดตใหม่ รองรับ “Scheduled Actions” แล้ว
Gmail ฉลาดขึ้น! Gemini ถูกเซ็ตเริ่มต้น ให้สรุปอีเมลเองแบบอัตโนมัติ

ที่มา: techcrunch.com

About Author

RingRangRung

Since 2016

เผย Gemini ของ Google มีอาการ ‘สติแตก’ ขณะเล่นเกม Pokémon

About Author

RingRangRung

Partners

Garmin ออกสายรัดอัจฉริยะไม่มีหน้าจอ CIRQA ชูจุดขายไม่ต้องจ่าย Subscription

Samsung ออกบัตรเครดิตสำหรับลูกค้าในอเมริกา Samsung Galaxy Card ใช้จ่ายเงินคืนสูงสุด 5%

แฮกเกอร์เจาะระบบกรมที่ดินโรมาเนียสำเร็จ ลบข้อมูลทะเบียนที่ดินทั้งประเทศ

โค้งสุดท้าย! กดซื้อดีลพิเศษ e-Voucher รวมมูลค่า 2,000 บาท ได้ถึง 22 ก.ค. นี้ เท่านั้น! เพื่อพรีออเดอร์ The new Galaxy

iPhone 18 Pro อาจมาพร้อม ชิป A20 Pro อัปเกรดครั้งใหญ่

สรุปข่าวลือ Apple Watch Series 12 ก่อนเปิดตัว คาดใช้ชิปใหม่ แบตเตอรี่อึดขึ้น และอาจมี Touch ID

พบโค้ด iOS 27 แย้ม iPhone รุ่นใหม่ ใช้แบตเตอรี่ 2 ก้อน คาดเป็น iPhone Ultra รุ่นพับได้!

2 คำถามที่ต่างกัน แต่รอคำตอบเดียวกัน — บมจ. ทรู คอร์ปอเรชั่น

เปิดตัว Kimi Work คู่แข่ง Claude Cowork ดึงราคาหุ้นได้ในตัว

แพลตฟอร์มสร้างร้านออนไลน์ Gumroad ลดพนักงานเหลือไม่ถึงครึ่ง ค่าโทเค็นเท่าเงินเดือน ลดวิศวกรก่อน