ไมโครซอฟท์เปิดตัว VALL-E เอไอเปี่ยมศักยภาพจำลองเสียงได้ใน 3 วินาที

ข่าวเทคโนโลยี Thursday January 12, 2023 16:35 —สำนักข่าวอินโฟเควสท์ (IQ)

นักวิจัยของไมโครซอฟท์ได้ทำการเปิดตัว Vall-E ปัญญาประดิษฐ์ หรือเอไอรุ่นใหม่ที่สามารถช่วยแปลงข้อความเป็นเสียง (text-to-speech) ซึ่งเอไอรุ่นนี้สามารถฟังเสียงภายในระยะเวลาเพียงไม่กี่วินาที และเลียนแบบเสียงนั้น ๆ รวมถึงอารมณ์และน้ำเสียง

รายงานระบุว่า Vall-E เป็นอัลกอริธึมเอไอตัวใหม่ล่าสุดที่สามารถใช้ประโยชน์จากการบันทึกเสียงของผู้พูด และทำให้เอไอรุ่นดังกล่าวพูดคำและประโยคที่ผู้พูดไม่เคยพูดออกมา ซึ่งนับเป็นเรื่องน่าทึ่งที่สามารถใช้เสียงเพียงเล็กน้อย เพื่อสร้างเสียงของผู้พูดทั้งหมดได้

ก่อนหน้านี้ อัลกอริธึม Lyrebird ของมหาวิทยาลัยมอนทรีออลเมื่อปี 2560 ต้องอาศัยการพูดถึง 1 นาที เพื่อดำเนินการวิเคราะห์เสียง แต่ Vall-E ใช้ตัวอย่างข้อมูลเสียงเพียง 3 วินาทีเท่านั้น

นอกจากนี้ Vall-E ยังได้รับการฝึกฝนเกี่ยวกับการพูดภาษาอังกฤษประมาณ 6 หมื่นชั่วโมง โดยเป็นการฝึกฝนผ่านนักบรรยายหนังสือเสียงเป็นส่วนใหญ่ ขณะที่ นักวิจัยได้นำเสนอตัวอย่างเสียงมากมาย และ Vall-E พยายามเลียนแบบเสียงรูปแบบต่าง ๆ ของมนุษย์ โดยเอไอรุ่นดังกล่าวสามารถจับใจความของเสียงและสร้างประโยคใหม่ที่ฟังดูเป็นธรรมชาติได้อย่างยอดเยี่ยม จนยากที่จะบอกว่าเสียงใดเป็นเสียงจริงและเสียงใดเป็นเสียงสังเคราะห์


เว็บไซต์นี้มีการใช้งานคุกกี้ ศึกษารายละเอียดเพิ่มเติมได้ที่ นโยบายความเป็นส่วนตัว และ ข้อตกลงการใช้บริการ รับทราบ