SCB 10X เปิดตัว "ไต้ฝุ่น" โมเดล AI ภาษาไทย ที่เทียบเท่า GPT-3.5


โดย PPTV Online

เผยแพร่




SCB 10X เปิดตัวโมเดลภาษาขนาดใหญ่ "ไต้ฝุ่น" (Typhoon) โมเดล AI เพื่อภาษาไทยโดยเฉพาะ ระบุ ความสามารถเทียบเท่า GPT-3.5 ของ OpenAI

SCB 10X ยูนิตใหม่ในเครือบริษัท SCBX Group เปิดตัวโมเดลภาษาขนาดใหญ่ที่พัฒนาเองอย่าง “ไต้ฝุ่น” (Typhoon) โดยพัฒนาขึ้นสำหรับการใช้งานภาษาไทยโดยเฉพาะ ซึ่ง SCB 10X ระบุว่ามีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ของ OpenAI

ซึ่งโมเดลภาษาขนาดใหญ่ หรือ LLM คือ เป็นรูปแบบของ AI ชนิดหนึ่งที่ตัวโมเดลถูกป้อนข้อมูลมากมายมหาศาลจากอินเทอร์เน็ต จนสร้างเป็นโมเดลภาษา ให้สามารถมีความเข้าใจความหมายข้อความตามบริบท และสร้างข้อความที่สอดคล้องออกมาได้

Apple อาจเปิดตัว Siri โฉมใหม่ ที่นำ AI มาใช้งาน ในเดือน มิ.ย. นี้

เปิดตัว "GPT Store" มาร์เก็ตเพลส AI ที่มีให้เลือกใช้มากกว่า 3 ล้านแบบ!

Google Chrome เพิ่ม 3 ฟีเจอร์ใหม่ ใช้ AI ช่วยทำงาน

 

 

ภาพกราฟิกโปรโมต Typhoon โมเดลภาษาขนาดใหญ่ เพื่อภาษาไทยโดยเฉพาะ SCB 10X
กราฟิกโปรโมต Typhoon โมเดลภาษาขนาดใหญ่ เพื่อภาษาไทยโดยเฉพาะ

โดย SCB 10X ออกแบบ ไต้ฝุ่น เพื่อแก้ปัญหาช่องว่างทางภาษา ที่โมเดลส่วนใหญ่ในปัจจุบันถูกฝึกฝนด้วยภาษาอังกฤษเป็นหลัก รวมถึงข้อจำกัดด้านทรัพยากรของภาษาไทยที่ไม่มีข้อมูลมากเพียงพอ ซึ่งจะรวบรวมข้อมูลมาจากข้อสอบภาษาไทย ระดับความยากเทียบเท่าข้อสอบมัธยมปลาย และข้อสอบมาตรฐานอื่น ๆ ในประเทศไทย

ไต้ฝุ่น ถูกพัฒนา 2 เวอร์ชั่น ได้แก่

  • Pretrained Model เปรียบเสมือนการสอนให้โมเดลเรียนรู้ภาษาไทย ไม่ว่าจะเป็นคลังคำศัพท์ บริบท หรือวัฒนธรรมของภาษาไทย รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก
  • Instruction-tuned Model เปรียบเสมือนการสอนต่ออีกขั้นหนึ่ง ให้โมเดลสามารถสื่อสารสิ่งที่เข้าใจจากเวอร์ชันแรก ตามคำสั่งที่ป้อนเข้าไปได้ เช่น การแปล การสรุปความ หรือการตอบคำถาม เป็นต้น

SCB 10X เผยว่า ผลการทดลองในชุดข้อสอบภาษาไทย แสดงให้เห็นว่า ไต้ฝุ่น มีประสิทธิภาพเหนือกว่าโมเดลภาษาไทยที่เผยแพร่สาธารณะอยู่ทั้งหมด และมีประสิทธิภาพเทียบเท่ากับ GPT-3.5 ในภาษาไทย ซึ่งเป็นโมเดลที่อยู่เบื้องหลัง ChatGPT โดยมีพารามิเตอร์เพียง 7 พันล้านพารามิเตอร์ และมีประสิทธิภาพมากกว่า 2.62 เท่าในการอ่านข้อความภาษาไทย

โดย SCB 10X เปิดให้ทดลองใช้โมเดล Typhoon-7B ในเวอร์ชัน Pretrained model และเวอร์ชัน Instruction-tuned model ผ่านบริการ API แบบไม่มีค่าใช้จ่าย เพื่อเพิ่มขีดความสามารถด้านการแข่งขันให้แก่อุตสาหกรรม AI ของไทย สามารถดาวน์โหลดได้ที่ https://huggingface.co/scb10x/typhoon-7b มีรายงานเชิงเทคนิคประกอบ สามารถอ่านเพิ่มเติมได้ที่ https://arxiv.org/abs/2312.13951 และสามารถลงทะเบียนเพื่อรอทดลองใช้งานโมเดล Instruction-tuned เวอร์ชันเริ่มต้นในรูปแบบของ API ได้เร็ว ๆ นี้ ที่ https://opentyphoon.ai

ผลบอลเอเชียน คัพ 2023 ออสเตรเลีย-ทาจิกิสถาน เข้ารอบ 8 ทีมสุดท้าย

สยองกลางโรงเรียนย่านพัฒนาการ นักเรียนแทงเพื่อนหลังเลิกแถวหน้าเสาธง เสียชีวิต 1 ราย

มารู้จัก "เจ๋ง ดอกจิก" ตัวละครเอี่ยว "ศรีสุวรรณ" ขู่เรียกรับสินบน

PR-โปรแกรมผลบอล_B PR-โปรแกรมผลบอล_B
TOP ไอที
วิดีโอยอดนิยม
เรื่องที่คุณอาจพลาด

วิดีโอยอดนิยม

ข่าวเด่นในรอบสัปดาห์

เพิ่ม PPTVHD36
ลงในหน้าจอหลักของคุณ