Anthropic เปิดตัว Claude 3.7 Sonnet โมเดล AI ไฮบริด "คิด"

เมื่อวานนี้ (24 ก.พ.) แอนโทรปิก (Anthropic) เปิดตัว Claude 3.7 Sonnet โมเดล AI ระดับแนวหน้าที่สามารถ "คิด" วิเคราะห์คำถามได้นานตามความต้องการของผู้ใช้ โดยถือเป็นโมเดล AI แบบไฮบริดสำหรับการให้เหตุผล (hybrid AI reasoning model) ตัวแรกของวงการ

เว็บไซต์เทคครันช์ (TechCrunch) รายงานว่า Claude 3.7 Sonnet สามารถให้คำตอบได้ทั้งแบบทันทีและแบบที่ผ่านการวิเคราะห์อย่างละเอียด โดยผู้ใช้สามารถเลือกเปิด-ปิดฟีเจอร์ "การให้เหตุผล" ซึ่งจะกำหนดระยะเวลาในการ "คิด" ได้ตามต้องการ

การพัฒนาโมเดลนี้สะท้อนความพยายามของแอนโทรปิกในการปรับปรุงประสบการณ์ผู้ใช้ให้ง่ายขึ้น แทนที่จะมีตัวเลือกโมเดลหลากหลายที่สร้างความสับสน บริษัทเชื่อว่า โมเดลเดียวควรจัดการได้ทุกอย่าง

Claude 3.7 Sonnet จะเปิดให้บริการแก่ผู้ใช้และนักพัฒนาทั้งหมดตั้งแต่วันจันทร์นี้ แต่เฉพาะสมาชิกแบบพรีเมียมเท่านั้นที่จะเข้าถึงฟีเจอร์การให้เหตุผลได้ ส่วนผู้ใช้แบบฟรีจะได้ใช้เฉพาะเวอร์ชันมาตรฐานที่ไม่มีฟีเจอร์ดังกล่าว

โมเดลใหม่นี้มีอัตราค่าบริการอยู่ที่ 3 ดอลลาร์ต่อหนึ่งล้าน input tokens และ 15 ดอลลาร์ต่อหนึ่งล้าน output tokens ซึ่งแม้จะมีราคาสูงกว่าคู่แข่งอย่าง o3-mini ของโอเพนเอไอ (OpenAI) และ R1 ของดีปซีค (DeepSeek) แต่ข้อได้เปรียบคือความสามารถแบบไฮบริดที่รวมทั้งการตอบแบบทันทีและการวิเคราะห์เชิงลึกไว้ในโมเดลเดียว

ปัจจุบัน บรรดาโมเดล AI สำหรับการให้เหตุผล อาทิ o3-mini, R1, Gemini 2.0 Flash Thinking ของกูเกิล (Google) และ Grok 3 (Think) ของเอ็กซ์เอไอ (xAI) ทำงานโดยใช้ทรัพยากรประมวลผลที่มากขึ้น เพื่อวิเคราะห์และแยกแยะปัญหาออกเป็นขั้นตอนย่อยก่อนสรุปคำตอบ ซึ่งเทคนิคนี้เพิ่มความแม่นยำอย่างมีนัยสำคัญ แม้จะไม่เหมือนกระบวนการคิดของมนุษย์ทั้งหมด

ทางด้านแอนโทรปิกได้ปรับโหมดการคิดของ Claude ให้รองรับงานในโลกจริง โดยเฉพาะการเขียนโค้ดที่ซับซ้อนและงานที่ AI ทำหน้าที่เป็นตัวแทน (agent) ส่วนนักพัฒนาที่ใช้ API ของบริษัทสามารถกำหนด "งบประมาณ" สำหรับกระบวนการคิด เพื่อปรับสมดุลระหว่างความเร็ว ต้นทุน และคุณภาพของคำตอบได้ตามต้องการ

ผลการทดสอบพบว่า Claude 3.7 Sonnet มีความแม่นยำ 62.3% ในการทดสอบด้านการเขียนโค้ด SWE-Bench สูงกว่า o3-mini ของโอเพนเอไอที่ทำได้เพียง 49.3% ขณะที่การทดสอบ TAU-Bench ซึ่งวัดความสามารถในการโต้ตอบกับผู้ใช้และ API ภายนอกในบริบทของการค้าปลีก Claude 3.7 Sonnet ทำคะแนนได้ถึง 81.2% เทียบกับ o1 ของโอเพนเอไอที่ 73.5%

นอกจากนี้ แอนโทรปิกยังปรับปรุงโมเดลใหม่ให้ปฏิเสธคำถามน้อยลง โดยสามารถแยกแยะความแตกต่างระหว่างคำถามที่เป็นอันตรายกับไม่เป็นอันตรายได้ละเอียดยิ่งขึ้น ทำให้ลดการปฏิเสธที่ไม่จำเป็นลงได้ถึง 45% เมื่อเทียบกับรุ่นก่อนหน้า (Claude 3.5 Sonnet)

นอกจาก Claude 3.7 Sonnet แล้ว แอนโทรปิกยังเปิดตัว Claude Code เครื่องมือโค้ดดิ้งอัจฉริยะที่อยู่ในขั้นทดลองวิจัย เครื่องมือนี้ช่วยให้นักพัฒนาสามารถสั่งงาน Claude ได้โดยตรงผ่านเทอร์มินัล

ในการสาธิต ทีมงานแอนโทรปิกแสดงให้เห็นว่า Claude Code สามารถวิเคราะห์โครงสร้างโปรเจกต์ด้วยคำสั่งง่าย ๆ เช่น "Explain this project structure" นักพัฒนาสามารถแก้ไขโค้ดโดยใช้ภาษาธรรมดาในคอมมานด์ไลน์ โดย Claude Code จะอธิบายระหว่างการแก้ไข และยังสามารถทดสอบหาข้อผิดพลาดหรืออัปโหลดไปยัง GitHub ได้อีกด้วย

โฆษกของแอนโทรปิกเปิดเผยกับเทคครันช์ว่า ช่วงแรก Claude Code จะเปิดให้บริการแก่ผู้ใช้จำนวนจำกัดตามลำดับการลงทะเบียน

อนึ่ง แอนโทรปิกเปิดตัว Claude 3.7 Sonnet ในช่วงที่บรรดาบริษัท AI กำลังแข่งขันเปิดตัวโมเดลใหม่ ๆ อย่างรวดเร็ว แม้ที่ผ่านมา แอนโทรปิกจะเน้นแนวทางที่รอบคอบและให้ความสำคัญกับความปลอดภัย แต่ครั้งนี้บริษัทดูเหมือนต้องการก้าวขึ้นมาเป็นผู้นำในวงการมากขึ้น

แท็ก แนวหน้า ก.พ.

โดย พสิษฐ์ อุ่นเมตตาจิต/กัลยาณี ชีวะพานิช

Anthropic เปิดตัว Claude 3.7 Sonnet โมเดล AI ไฮบริด "คิด" ได้นานตามใจผู้ใช้