OpenAI บริษัทผู้นำด้านปัญญาประดิษฐ์ หรือ AI ชั้นนำจากสหรัฐฯ หลังจากที่เปิดตัวโมเดลแชตบอตรุ่นใหม่อย่าง GPT-4 และ "Sora" Generative AI ที่สามารถสร้างวิดีโอสั้นได้เพียงแค่ใส่ข้อความ ไปเมื่อช่วงกลางเดือนกุมภาพันธ์ที่ผ่านมานั้น
ล่าสุด OpenAI เรียกเสียงฮือฮาได้อีกครั้ง หลังเปิดตัว "Voice Engine" โมเดล AI โคลนเสียง ที่สามารถสร้างการอ่านออกเสียง ให้เหมือนเสียงต้นฉบับได้
OpenAI ระบุว่า โปรเจกต์ Voice Engine ได้รับการพัฒนามาตั้งแต่ช่วงปลายปี 2022 แล้ว และเตรียมนำมาใช้ในการอ่านออกเสียงบน Chat-GPT
ความสามารถของเจ้า Voice Engine คือการฟังเสียงต้นฉบับ โดยใช้เวลาเพียง 15 วินาทีเท่านั้น หลังจากนั้นตัวโมเดลจะประมวลผลออกมาเป็นเสียงโคลน ที่เหมือนกับต้นฉบับแบบเป๊ะ ๆ สามารถอ่านออกเสียงตามข้อความได้ ทั้งยังใช้งานได้มากกว่า 57 ภาษาเลยทีเดียว (มีภาษาไทยด้วย!)
อย่างไรก็ตาม มีบริษัทเพียงหยิบมือเท่านั้น ที่สามารถเข้าถึงเทคโนโลยีนี้ได้ เช่น บริษัทเทคโนโลยีการศึกษา Age of Learning, แพลตฟอร์มการเล่าเรื่องด้วยภาพ HeyGen, ผู้ผลิตซอฟต์แวร์ด้านสุขภาพ Dimagi, ผู้สร้างแอปสื่อสาร AI Livox, และแพลตฟอร์มดูแลระบบสุขภาพ Lifespan
โดย เจฟฟ์ แฮร์ริส หนึ่งในสมาชิกของ OpenAI ผู้พัฒนา Voice Engine หรือโมเดลภาษาด้านเสียงของ OpenAI กล่าวว่า โมเดลดังกล่าว ได้รับการฝึกอบรม เรื่องการคัดกรองข้อมูลที่ได้รับอนุญาตให้เผยแพร่ และการเผยแพร่ข้อมูลต่อสาธารณะเป็นที่เรียบร้อยแล้ว และโมเดลนี้จะมีให้สำหรับนักพัฒนาประมาณ 10 คนใช้งานเท่านั้น
ที่มา : The Verge
ตรวจผลออกรางวัลสลากออมสินพิเศษ 2 ปี งวดวันที่ 1 เมษายน 2567
เปิดสถิติหวยวันสงกรานต์ ย้อนหลัง 15 ปี ประจำวันที่ 16 เมษายน