เมื่อวานนี้ (11 พ.ค.) ไอแซค แคสเวลล์ วิศวกรซอฟต์แวร์ของบริษัทยักษ์ใหญ๋ด้านเทคโนโลยีอย่างกูเกิล (Google) เปิดเผยว่า ได้เพิ่มภาษาใหม่ 24 ภาษาที่พูดโดยผู้คนรวมมากกว่า 300 ล้านคนลงในแพลตฟอร์มแปลภาษาที่เราคุ้นเคยกันดี “กูเกิลทรานสเลท (Google Translate)”
แคสเวลล์บอกว่า “เป็นเวลาหลายปีแล้วที่ Google Translate ได้ช่วยขจัดอุปสรรคด้านภาษาและเชื่อมโยงสังคมต่าง ๆ ทั่วโลก ... ตอนนี้ถึงเวลาแล้ว ที่เราจะช่วยเหลือผู้ที่ใช้ภาษาซึ่ง ‘ไม่ค่อยปรากฏในเทคโนโลยีส่วนใหญ่’”
"กูเกิลทรานสเลท" รับรองการแปลภาษาจาก "สตาร์ วอร์ส"
ความเคลื่อนไหวครั้งที่ของกูเกิล ทำให้มีภาษาอยู่ในระบบ Google Translate แล้วทั้งสิ้น 133 ภาษา
สำหรับภาษาใหม่ทั้ง 24 ภาษาที่ถูกเพิ่มเข้ามาใน Google Translate นั้น ประกอบด้วย
- Assamese มีผู้ใช้ 25 ล้านคนในอินเดียตะวันออกเฉียงเหนือ
- Aymara มีผู้ใช้ 2 ล้านในโบลิเวีย ชิลี และเปรู
- Bambara มีผู้ใช้ 14 ล้านคนในมาลี
- Bhojpuri มีผู้ใช้ 50 ล้านคนในอินเดียเหนือ เนปาล และฟิจิ
- Dhivehi มีผู้ใช้ 300,000 คนในมัลดีฟส์
- Dogri มีผู้ใช้ 3 ล้านคนในอินเดียเหนือ
- Ewe มีผู้ใช้ 7 ล้านคนในกานาและโตโก
- Guarani มีผู้ใช้ 7 ล้านคนในปารากวัย โบลิเวีย อาร์เจนตินา และบราซิล
- Ilocano มีผู้ใช้ 10 ล้านคนในฟิลิปปินส์เหนือ
- Konkani มีผู้ใช้ 2 ล้านคนในอินเดียกลาง
- Krio มีผู้ใช้ 4 ล้านคนในเซียร์ราลีโอน
- Kurdish (Sorani) มีผู้ใช้ 8 ล้านคน ส่วนมากอยู่ในอิรัก
- Lingala มีผู้ใช้ 45 ล้านคนในคองโก แอฟริกากลาง แองโกลา และซูดานใต้
- Luganda มีผู้ใช้ 20 ล้านคนในยูกันดาและรวันดา
- Maithili มีผู้ใช้ 34 ล้านคนในอินเดียเหนือ
- Meiteilon (Manipuri) มีผู้ใช้ 2 ล้านคนในอินเดียตะวันออกเฉียงเหนือ
- Mizo มีผู้ใช้ 830,000 คนในอินเดียตะวันออกเฉียงเหนือ
- Oromo มีผู้ใช้ 37 ล้านคนในเอธิโอเปียและเคนยา
- Quechua มีผู้ใช้ 10 ล้านคนในเปรู โบลิเวีย เอกวาดอร์ และประเทศข้างเคียง
- Sanskrit มีผู้ใช้ 20,000 คนในอินเดีย
- Sepedi มีผู้ใช้ 14 ล้านคนในแอฟริกาใต้
- Tigrinya มีผู้ใช้ 8 ล้านคนในเอริเทรียและเอธิโอเปีย
- Tsonga มีผู้ใช้ 7 ล้านคนในเอสวาตีนี โมซัมบิก แอฟริกาใต้ และซิมบับเว
- Twi มีผู้ใช้ 11 ล้านคนในกานา
จะพบว่า มีอยู่สิบกว่าภาษาเลยทีเดียวที่เป็นภาษาที่ใช้ในภูมิภาคแอฟริกา ส่วนที่เหลือเป็นภาษาในเอเชียและอเมริกาใต้
แคสเวลล์เสริมว่า ภาษาที่เพิ่มเข้าไปใหม่เหล่านี้ยังแสดงถึงก้าวสำคัญทางเทคโนโลยี โดยอธิบายว่า กูเกิลได้ใช้ Zero-Shot Machine Translation หรือการที่ระบบที่พัฒนาขึ้น เรียนรู้ที่จะ “แปลข้อความจากภาษาหนึ่งเป็นภาษาอื่นโดยที่ไม่เคยเห็นตัวอย่างมาก่อน”
ระบบนี้มีประโยชน์สำหรับภาษาที่ไม่มีชุดข้อมูลการแปลโดยมนุษย์ที่ใหญ่มากพอให้คอมพิวเตอร์ได้เรียนรู้ฝึกฝน อย่างไรก็ตาม กูเกิลยอมรับว่า เทคโนโลยียังไม่สมบูรณ์แบบ
“แม้แต่ภาษาที่ใหญ่ที่สุดในแอฟริกาที่เรามี เช่น โยรูบา อิกโบ การแปลนั้นยังไม่ดีนัก ระบบจะเข้าใจความคิดทั่วไปได้ แต่มักจะสูญเสียความละเอียดอ่อนของภาษาไปมาก” แคสเวลล์กล่าว
แต่เขาบอกว่า กูเกลิจะยังคงพัฒนาระบบนี้ต่อไป เพื่อให้ผู้ใช้มีประสบการณ์การแปลภาษาที่ลื่นไหลเหมือนการแปลภาษาอังกฤษ สเปน หรือเยอรมัน
ครั้งล่าสุดที่มีการเพิ่มภาษาใหม่ลงในระบบ Google Translate คือเมื่อปี 2020 โดยครั้งนั้นเพิ่มเข้าไปใหม่ 5 ภาษา
ภาพจาก Getty Image