ปัจจุบัน การใช้บริการแปลภาษาที่ผู้คนส่วนใหญ่นึกถึงอาจหนีไม่พ้น Google Translate ที่เมื่อป้อนข้อความหรือคำพูดเข้าไปแล้ว ระบบจะประมวลผลออกมาเป็นข้อความตามภาษาที่เราต้องการ และสามารถคลิกฟังเสียงแปลได้
แต่หลังจากนี้การแปลภาษาจะเปลี่ยนไป เมื่อบริษัทเมตา (Meta) เปิดตัว SeamlessM4T เอไอโมเดลใหม่ที่สามารถแปลภาษาได้ครบวงจร รองรับการแปลทุกรูปแบบ ไม่ว่าจะเป็นการแปลจากเสียงพูดเป็นข้อความ ข้อความเป็นเสียงพูด การแปลระหว่างเสียงพูด และการแปลระหว่างข้อความ
SeamlessM4T เรียนรู้เสียงพูดได้เกือบ 100 ภาษา จากการรวบรวมเสียงในภาษาต่าง ๆ มีรูปแบบการแปลครบวงจร โดยแบ่งเป็นการแปลให้เป็นข้อความเกือบ 100 ภาษา และการแปลให้เป็นเสียงพูดกว่า 36 ภาษารวมภาษาอังกฤษ ซึ่งทีมวิจัยของเมตาใช้ระบบต่าง ๆ เช่น Pytorch ซอฟต์แวร์ที่ใช้ประมวลภาษา ระบบ BERT 2.0 ที่ใช้ในการเข้ารหัสเสียงเพื่อถอดออกมาเป็นภาษาที่ต้องการแปล และ HiFi-GAN เครื่องมือแปลงเสียงเพื่อสร้างเสียงที่ต้องการแปล
จุดเด่นของ SeamlessMT4 คือการแปลภาษาจากข้อความหรือเสียงพูดมากกว่า 2 ภาษาได้ในครั้งเดียว โดยเมตายกตัวอย่างการแปลเสียงพูดที่พูดภาษาฮินดีสลับกับการพูดภาษาเตลูกู ระบบก็จะแปลเสียงพูดนั้นออกมาเป็นภาษาอังกฤษได้อย่างแม่นยำ ซึ่งเหมาะสำหรับผู้ที่พูดหลายภาษา
นอกจากนี้ ทางเมตายังพัฒนา SeamlessMT4 ให้เรียนรู้และปรับปรุงการแปลภาษาที่มีผู้พูดน้อยถึงปานกลางให้แม่นยำขึ้น และพัฒนาการแปลภาษาที่มีผู้พูดเป็นวงกว้างให้มีประสิทธิภาพขึ้นเช่นกัน
มาร์ค ซัคเคอร์เบิร์ก เจ้าของบริษัทเมตา กล่าวถึง SeamlessM4T ว่า "ผมจินตนาการถึงเครื่องมือที่อำนวยความสะดวกในการโต้ตอบระหว่างผู้คนจากทั่วโลกในเมตาเวิร์ส ซึ่งเป็นโลกเสมือนจริงที่ผมสร้างขึ้นโดยเอาบริษัทเป็นเดิมพัน และเอไอดังกล่าวจะช่วยให้บริษัทเราได้ประโยชน์จากการที่ผู้ใช้บริการมีเครื่องมือที่คอยเป็นตัวเชื่อมระหว่างกันบนโลกโซเชียลอย่างมีประสิทธิภาพมากขึ้น โดยไม่คำนึงถึงการคิดค่าบริการใด ๆ"
โดยทางเว็บไซต์ของบริษัทเมตายังไม่ระบุว่าจะนำ SeamlessM4T มาใช้งานผ่านแอปพลิเคชันหรือเครื่องมือใด แต่เมตายังคงพัฒนา SeamlessM4T ให้สามารถแปลภาษาได้หลากหลายขึ้น เพื่อเชื่อมโยงผู้คนในสังคมผ่านการสื่อสารให้มีความใกล้ชิดกันมากขึ้นในอนาคต
เรียบเรียงจาก Endgadget / Reuters / Meta
ภาพจาก AFP