เมื่อวานนี้ (24 ก.พ.) แอนโทรปิก (Anthropic) เปิดตัว Claude 3.7 Sonnet โมเดล AI ระดับแนวหน้าที่สามารถ "คิด" วิเคราะห์คำถามได้นานตามความต้องการของผู้ใช้ โดยถือเป็นโมเดล AI แบบไฮบริดสำหรับการให้เหตุผล (hybrid AI reasoning model) ตัวแรกของวงการ
เว็บไซต์เทคครันช์ (TechCrunch) รายงานว่า Claude 3.7 Sonnet สามารถให้คำตอบได้ทั้งแบบทันทีและแบบที่ผ่านการวิเคราะห์อย่างละเอียด โดยผู้ใช้สามารถเลือกเปิด-ปิดฟีเจอร์ "การให้เหตุผล" ซึ่งจะกำหนดระยะเวลาในการ "คิด" ได้ตามต้องการ
การพัฒนาโมเดลนี้สะท้อนความพยายามของแอนโทรปิกในการปรับปรุงประสบการณ์ผู้ใช้ให้ง่ายขึ้น แทนที่จะมีตัวเลือกโมเดลหลากหลายที่สร้างความสับสน บริษัทเชื่อว่า โมเดลเดียวควรจัดการได้ทุกอย่าง
Claude 3.7 Sonnet จะเปิดให้บริการแก่ผู้ใช้และนักพัฒนาทั้งหมดตั้งแต่วันจันทร์นี้ แต่เฉพาะสมาชิกแบบพรีเมียมเท่านั้นที่จะเข้าถึงฟีเจอร์การให้เหตุผลได้ ส่วนผู้ใช้แบบฟรีจะได้ใช้เฉพาะเวอร์ชันมาตรฐานที่ไม่มีฟีเจอร์ดังกล่าว
โมเดลใหม่นี้มีอัตราค่าบริการอยู่ที่ 3 ดอลลาร์ต่อหนึ่งล้าน input tokens และ 15 ดอลลาร์ต่อหนึ่งล้าน output tokens ซึ่งแม้จะมีราคาสูงกว่าคู่แข่งอย่าง o3-mini ของโอเพนเอไอ (OpenAI) และ R1 ของดีปซีค (DeepSeek) แต่ข้อได้เปรียบคือความสามารถแบบไฮบริดที่รวมทั้งการตอบแบบทันทีและการวิเคราะห์เชิงลึกไว้ในโมเดลเดียว
ปัจจุบัน บรรดาโมเดล AI สำหรับการให้เหตุผล อาทิ o3-mini, R1, Gemini 2.0 Flash Thinking ของกูเกิล (Google) และ Grok 3 (Think) ของเอ็กซ์เอไอ (xAI) ทำงานโดยใช้ทรัพยากรประมวลผลที่มากขึ้น เพื่อวิเคราะห์และแยกแยะปัญหาออกเป็นขั้นตอนย่อยก่อนสรุปคำตอบ ซึ่งเทคนิคนี้เพิ่มความแม่นยำอย่างมีนัยสำคัญ แม้จะไม่เหมือนกระบวนการคิดของมนุษย์ทั้งหมด
ทางด้านแอนโทรปิกได้ปรับโหมดการคิดของ Claude ให้รองรับงานในโลกจริง โดยเฉพาะการเขียนโค้ดที่ซับซ้อนและงานที่ AI ทำหน้าที่เป็นตัวแทน (agent) ส่วนนักพัฒนาที่ใช้ API ของบริษัทสามารถกำหนด "งบประมาณ" สำหรับกระบวนการคิด เพื่อปรับสมดุลระหว่างความเร็ว ต้นทุน และคุณภาพของคำตอบได้ตามต้องการ
ผลการทดสอบพบว่า Claude 3.7 Sonnet มีความแม่นยำ 62.3% ในการทดสอบด้านการเขียนโค้ด SWE-Bench สูงกว่า o3-mini ของโอเพนเอไอที่ทำได้เพียง 49.3% ขณะที่การทดสอบ TAU-Bench ซึ่งวัดความสามารถในการโต้ตอบกับผู้ใช้และ API ภายนอกในบริบทของการค้าปลีก Claude 3.7 Sonnet ทำคะแนนได้ถึง 81.2% เทียบกับ o1 ของโอเพนเอไอที่ 73.5%
นอกจากนี้ แอนโทรปิกยังปรับปรุงโมเดลใหม่ให้ปฏิเสธคำถามน้อยลง โดยสามารถแยกแยะความแตกต่างระหว่างคำถามที่เป็นอันตรายกับไม่เป็นอันตรายได้ละเอียดยิ่งขึ้น ทำให้ลดการปฏิเสธที่ไม่จำเป็นลงได้ถึง 45% เมื่อเทียบกับรุ่นก่อนหน้า (Claude 3.5 Sonnet)
นอกจาก Claude 3.7 Sonnet แล้ว แอนโทรปิกยังเปิดตัว Claude Code เครื่องมือโค้ดดิ้งอัจฉริยะที่อยู่ในขั้นทดลองวิจัย เครื่องมือนี้ช่วยให้นักพัฒนาสามารถสั่งงาน Claude ได้โดยตรงผ่านเทอร์มินัล
ในการสาธิต ทีมงานแอนโทรปิกแสดงให้เห็นว่า Claude Code สามารถวิเคราะห์โครงสร้างโปรเจกต์ด้วยคำสั่งง่าย ๆ เช่น "Explain this project structure" นักพัฒนาสามารถแก้ไขโค้ดโดยใช้ภาษาธรรมดาในคอมมานด์ไลน์ โดย Claude Code จะอธิบายระหว่างการแก้ไข และยังสามารถทดสอบหาข้อผิดพลาดหรืออัปโหลดไปยัง GitHub ได้อีกด้วย
โฆษกของแอนโทรปิกเปิดเผยกับเทคครันช์ว่า ช่วงแรก Claude Code จะเปิดให้บริการแก่ผู้ใช้จำนวนจำกัดตามลำดับการลงทะเบียน
อนึ่ง แอนโทรปิกเปิดตัว Claude 3.7 Sonnet ในช่วงที่บรรดาบริษัท AI กำลังแข่งขันเปิดตัวโมเดลใหม่ ๆ อย่างรวดเร็ว แม้ที่ผ่านมา แอนโทรปิกจะเน้นแนวทางที่รอบคอบและให้ความสำคัญกับความปลอดภัย แต่ครั้งนี้บริษัทดูเหมือนต้องการก้าวขึ้นมาเป็นผู้นำในวงการมากขึ้น