อาลีบาบา คลาวด์ (Alibaba Cloud) บริษัทคลาวด์คอมพิวติ้งในเครืออาลีบาบา กรุ๊ป บริษัทเทคโนโลยียักษ์ใหญ่จากจีน เปิดตัวโมเดลภาษาขนาดใหญ่ (LLM) เวอร์ชันล่าสุด หลังจากมีการใช้งานโดยบริษัทต่าง ๆ มากกว่า 90,000 แห่ง
นายโจว จินเหริน ประธานเจ้าหน้าที่ฝ่ายเทคโนโลยีของอาลีบาบา คลาวด์ ระบุในแถลงการณ์ว่า บริษัทได้เห็นการนำโมเดลดังกล่าวไปใช้งานที่สร้างสรรค์มากมายจากอุตสาหกรรมต่าง ๆ" ซึ่งรวมถึงสินค้าอิเล็กทรอนิกส์สำหรับผู้บริโภคและเกม
"เราตั้งตารอที่จะร่วมมือกับลูกค้าและนักพัฒนาของเราในการคว้าโอกาสในการเติบโตอย่างยิ่งใหญ่ อันเนื่องมาจากการพัฒนา Generative AI ล่าสุด" นายโจวกล่าว
อาลีบาบา คลาวด์ระบุว่า Qwen2.5 ซึ่งเป็นโมเดลทงอี้ เชียนเวิ่น (Tongyi Qianwen) เวอร์ชันล่าสุด มีความก้าวหน้าที่โดดเด่นในด้านการใช้เหตุผล ความเข้าใจในโค้ด และความเข้าใจในข้อความ เมื่อเทียบกับ Qwen2.0 รุ่นก่อน
สำนักข่าวซีเอ็นบีซีรายงานว่า โมเดลภาษาขนาดใหญ่เป็นตัวขับเคลื่อนแอปพลิเคชันปัญญาประดิษฐ์ (AI) เช่น แชตจีพีที (ChatGPT) ของโอเพนเอไอ (OpenAI) โดยได้รับการฝึกฝนจากชุดข้อมูลจำนวนมหาศาล ซึ่งทำให้สามารถสร้างการตอบสนองต่อคำสั่งที่หลากหลายได้เหมือนกับมนุษย์
โอเพนคอมพาส (OpenCompass) ซึ่งเป็นแพลตฟอร์มประเมินโมเดลภาษาขนาดใหญ่ เปิดเผยผลการวิเคราะห์ของเดือนมี.ค. ระบุว่า โมเดล Qwen เวอรชันล่าสุดแซงหน้าโมเดลจีพีที-4 (GPT-4) ของโอเพนเอไอ ในด้านความสามารถทางภาษาและการสร้างสรรค์ แต่ยังตามหลังในหมวดหมู่อื่น ๆ เช่น ความรู้ การใช้เหตุผล และคณิตศาสตร์
ทั้งนี้ อาลีบาบาเปิดตัวโมเดลทงอี้ เชียนเวิ่นในเดือนเม.ย. 2566 หลังจากแชตจีพีได้รับความนิยมอย่างล้มหลามหลังเปิดตัวในเดือนพ.ย. 2565 ขณะที่เวอร์ชันอัปเกรดที่เปิดตัวในเดือนต.ค. มาพร้อมกับความสามารถในการทำความเข้าใจคำสั่งที่ซับซ้อน การเขียนคำโฆษณา การใช้เหตุผล การจดจำ และอื่น ๆ