
ในความพยายามศึกษาพฤติกรรมของโมเดลเอไอ ล่าสุด Google DeepMind และ Anthropic ได้ทดลองให้ Gemini 2.5 Pro และ Claude เล่นเกม Pokémon ซึ่งในการศึกษาก็ได้เจอกับผลลัพธ์ที่ได้ทั้งน่าสนใจ เมื่อพบว่า Gemini 2.5 Pro แสดงอาการ “ตื่นตระหนก” เมื่อ Pokémon ที่ใช้งานอยู่ใกล้ตาย ซึ่งส่งผลให้ “ประสิทธิภาพการใช้เหตุผลของโมเดลลดลงอย่างเห็นได้ชัด”
การวัดประสิทธิภาพ AI (AI benchmarking) หรือ กระบวนการเปรียบเทียบประสิทธิภาพของโมเดล AI ต่างๆ เป็นศาสตร์ที่มักให้บริบทเพียงเล็กน้อยเกี่ยวกับความสามารถที่แท้จริงของโมเดลที่กำหนด แต่ก็มีนักวิจัยบางรายเชื่อว่าการศึกษาโมเดล AI ว่าจะเล่นวีดีโอเกมอย่างไรเป็นสิ่งที่มีประโยชน์ (หรืออย่างน้อยก็เป็นความบันเทิงของผู้ทดสอบเอง)
ในช่วงหลายเดือนที่ผ่านมา นักพัฒนาอิสระสองรายที่ไม่เกี่ยวข้องกับ Google หรือ Anthropic ได้ตั้งสตรีมบน Twitch ชื่อ “Gemini Plays Pokémon” และ “Claude Plays Pokémon” เพื่อให้ทุกคนสามารถรับชมความพยายามของ AI ในการเล่นเกมที่ออกวางจำหน่ายมากว่า 25 ปี ได้แบบเรียลไทม์
แต่ละสตรีมจะแสดงกระบวนการ “การใช้เหตุผล” ของ AI หรือารแปลด้วยภาษาธรรมชาติว่า AI ประเมินปัญหาและตอบสนองอย่างไร ทำให้เราเข้าใจวิธีการทำงานของโมเดลเหล่านี้
แม้ว่าความก้าวหน้าของโมเดล AI เหล่านี้จะน่าประทับใจ แต่ AI ที่ทดสอบก็ยังเล่น Pokémon ได้ไม่เชี่ยวชาญนัก โดยที่ Gemini ต้องใช้เวลาหลายร้อยชั่วโมงในการใช้เหตุผลเพื่อผ่านเกมที่เด็กคนหนึ่งสามารถเล่นจนจบได้โดยเวลาที่น้อยกว่ามาก
อย่างไรก็ดีสิ่งที่น่าสนใจในการดู AI เล่นเกม Pokémon ไม่ใช่เรื่องระยะเวลาที่ใช้จบเกม แต่เป็นพฤติกรรมของ AI ที่แสดงในระหว่างการเล่น โดยที่ตามราย
งานระบุว่า “ในระหว่างการเล่น Gemini 2.5 Pro ได้เผชิญสถานการณ์ต่าง ๆ ที่ทำให้โมเดลจำลองพฤติกรรม ‘ตื่นตระหนก’”
สถานะ “ตื่นตระหนก” นี้ทำให้ประสิทธิภาพของโมเดลแย่ลง โดย AI อาจหยุดใช้เครื่องมือบางอย่างที่มีอยู่ในช่วงหนึ่งของระหว่างการเล่นเกม แม้ว่า AI จะไม่ได้คิดหรือสัมผัสอารมณ์ แต่การกระทำของมันเลียนแบบวิธีที่มนุษย์อาจตัดสินใจผิดพลาดอย่างเร่งรีบเมื่ออยู่ภายใต้ความกดดัน ซึ่งเป็นปฏิกิริยาที่น่าสนใจแต่ก็น่ากังวล
“พฤติกรรมนี้เกิดขึ้นในหลายๆ ครั้ง จนกระทั่งสมาชิกในแชท Twitch สังเกตเห็นเมื่อมันเกิดขึ้นอย่างชัดเจน” รายงานระบุ
ขณะที่ Claude จาก Anthropic ก็แสดงพฤติกรรมที่น่าสนใจในระหว่างการผจญภัยในภูมิภาค Kanto เช่นกัน โดยมีกรณีหนึ่งที่ Claude สังเกตว่ารูปแบบเมื่อ Pokémon ทั้งหมดที่มีหมดพลังชีวิต ตัวละครผู้เล่นจะ “White out” และกลับไปที่ Pokémon Center
เมื่อ Claude ติดอยู่ในถ้ำ Mt. Moon ตัว AI ก็ตั้งสมมติฐานผิด ๆ ว่าหากทำให้ Pokémon ที่มีหมดสติทั้งหมด ตัวละครของมันก็จะถูกส่งไปยัง Pokémon Center เมืองถัดไป
อย่างไรก็ตาม นั่นไม่ใช่วิธีการทำงานของเกม เมื่อ Pokémon ทั้งหมดตาย ผู้เล่นจะกลับไปที่ Pokémon Center ที่ใช้ล่าสุด ไม่ใช่ที่ใกล้ที่สุดทางภูมิศาสตร์ ซึ่งผู้ชมก็ต้องตกใจเมื่อเห็น AI พยายาม “ฆ่าตัวตาย” ในเกม
แม้จะมีข้อบกพร่อง แต่ AI ก็มีบางด้านที่เหนือกว่าผู้เล่นมนุษย์ โดยที่ในการเปิดตัว Gemini 2.5 Pro สามารถแก้ปริศนาได้อย่างแม่นยำ และด้วยความช่วยเหลือจากมนุษย์ AI ก็ได้สร้างเครื่องมือ Agentic หรืออินสแตนซ์ของ Gemini 2.5 Pro ที่ออกแบบสำหรับงานเฉพาะ เพื่อแก้ปริศนาก้อนหินและหาเส้นทางที่มีประสิทธิภาพในการไปถึงจุดหมายภายในเกม
“ด้วยเพียงคำสั่งที่อธิบายฟิสิกส์ของก้อนหินและวิธีตรวจสอบเส้นทางที่ถูกต้อง Gemini 2.5 Pro สามารถแก้ปริศนาก้อนหินที่ซับซ้อนบางอันได้ในครั้งเดียว ซึ่งจำเป็นสำหรับการผ่าน Victory Road” รายงานระบุ
เนื่องจาก Gemini 2.5 Pro ทำงานส่วนใหญ่ในการสร้างเครื่องมือเหล่านี้ด้วยตัวเอง Google จึงตั้งทฤษฎีว่าโมเดลปัจจุบันอาจสามารถสร้างเครื่องมือเหล่านี้ได้โดยไม่ต้องมีมนุษย์เข้ามาเกี่ยวข้อง แล้วใครเลยจะรู้ บางที Gemini อาจพัฒนาโมดูล “อย่าตื่นตระหนก” ให้ตัวเองได้ในอนาคต
Google Gemini อัปเดตใหม่ รองรับ “Scheduled Actions” แล้ว
Gmail ฉลาดขึ้น! Gemini ถูกเซ็ตเริ่มต้น ให้สรุปอีเมลเองแบบอัตโนมัติ