เรื่องของแชตบอตปัญญาประดิษฐ์อัจฉริยะ “ChatGPT” ยังคงเป็นที่พูดถึงอย่างต่อเนื่องทั่วทั้งโลก บุคคลากรในแวดวงการศึกษาและวิชาชีพต่าง ๆ เริ่มออกมาสำรวจและทดสอบศักยภาพของมัน เพื่อพิจารณาว่า เจ้าแชตบอตตัวนี้ กำลังเป็นภัยคุกคามต่อวงการของพวกเขาหรือไม่
ในที่นี้เราจะไม่พูดถึงภัยคุกคามของ ChatGPT ที่มีต่อวงการเทคโนโลยีหรือปัญญาประดิษฐ์ แต่จะโฟกัสเรื่องของการทำการบ้าน ทำข้อสอบ และบทบาทในแวดวงวิชาชีพต่าง ๆ ที่ในอนาคตเจ้าแชตบอตอาจแทรกตัวเข้าไปมีบทบาทได้
ทุ่มพันล้านดอลลาร์! ไมโครซอฟต์จับมือ OpenAI ผู้พัฒนา “ChatGPT”
หวังแข่งกูเกิล ไมโครซอฟต์เล็งนำ “ChatGPT” มาใช้ในเสิร์ชเอนจิ้น
นี่มันอับดุลชัด ๆ ทำความรู้จัก “ChatGPT” แจ็คที่อาจมาฆ่ายักษ์ “กูเกิล”
เริ่มกันที่วงการกฎหมาย ซึ่งเป็นศาสตร์ที่ต้องแม่นในเรื่องของข้อกฎหมาย และความสามารถในการนำมาประยุกต์ใช้กับคดีความต่าง ๆ ซึ่งทางคณะนิติศาสตร์ มหาวิทยาลัยมินนิโซตา ได้ทดลองให้ ChatGPT ทำข้อสอบกฎหมาย โดยเป็นโจทย์ปรนัยเลือกชอยส์คำตอบ 95 ข้อ และโจทย์อัตนัยเขียนตอบความเรียง 12 ข้อ
ผลการตรวจข้อสอบออกมาว่า มันสามารถทำคะแนนไปได้ในระดับเทียบเท่ากับนักเรียนที่ได้เกรด C+ เป็นการสอบผ่านที่ไม่ถึงกับชวนว้าว แต่ก็ถือว่าสอบผ่าน
จอน ชอย อาจารย์กฎหมายมหาวิทยาลัยมินนิโซตา กล่าวว่า เป้าหมายของการทดสอบคือเพื่อสำรวจศักยภาพของ ChatGPT ในการช่วยนักกฎหมายในการปฏิบัติงาน และช่วยนักเรียนในการสอบ ไม่ว่าอาจารย์จะอนุญาตหรือไม่ก็ตาม เนื่องจากคำถามมักจะเลียนแบบการเขียนคำฟ้องหรือเอกสารต่าง ๆ ที่ทนายความต้องทำในชีวิตจริง
“ChatGPT มีปัญหากับองค์ประกอบคลาสสิกที่สุดของการสอบวิชากฎหมาย เช่น การระบุประเด็นข้อกฎหมาย และการวิเคราะห์เชิงลึกโดยใช้กฎหมายมาจับกับข้อเท็จจริงของคดีความต่าง ๆ ... แต่ ChatGPT อาจมีประโยชน์มากในการดราฟต์หรือสร้างร่างแรก ที่นักเรียนกฎหมายสามารถนำมาปรับแต่งได้” ชอยกล่าว
เขาระบุว่า สำหรับงานวงการกฎหมาย ที่ทางของ ChatGPT ที่เป็นไปได้มากที่สุดคือ การทำงานร่วมระหว่างมนุษย์กับแชตบอต โดยที่แชตบอตจะไม่สามารถแทนที่นักกฎหมายจริง ๆ ได้
“ลางสังหรณ์ของผมคิดว่า ผู้ช่วยปัญญาประดิษฐ์จะกลายเป็นเครื่องมือสำหรับนักกฎหมายในอนาคตอันใกล้ และโรงเรียนกฎหมายควรเตรียมนักเรียนให้พร้อมสำหรับเหตุการณ์นั้น” เขากล่าว
ชอยเสริมว่า “แน่นอนว่า หากอาจารย์กฎหมายต้องการทดสอบการจำข้อกฎหมายและหลักการทางกฎหมาย พวกเขาจำเป็นต้องวางข้อจำกัด เช่น การห้ามใช้อินเทอร์เน็ตในระหว่างการสอบ”
แม้ ChatGPT ดูจะทำได้ไม่ดีนักสำหรับวิชากฎหมาย แต่กับวิชาการบริหารธุรกิจ ถือว่าทำได้ค่อนข้างดี โดยวิทยาลัยวอร์ตัน ซึ่งเป็นคณะบริหารธุรกิจของมหาวิทยาลัยเพนซิลเวเนีย ได้ลองให้เจ้าแชตบอตทำข้อสอบ
น่าสนใจที่ว่า ChatGPT ได้เกรดประมาณ B- ถึง B เลยทีเดียว คริสเตียน เทอร์วีช ศาสตราจารย์ที่วาร์ตัน บอกว่า เจ้าแชตบอตทำได้ “ยอดเยี่ยมมาก” ในการตอบคำถามเชิงการจัดการการดำเนินงานขั้นพื้นฐานและการวิเคราะห์กระบวนการต่าง ๆ แต่ประสบปัญหากับการจัดการขั้นสูง และมีข้อผิดพลาดในด้านคณิตศาสตร์พื้นฐาน ซึ่งน่าแปลกใจอย่างมากสำหรับปัญญาประดิษฐ์ “ความผิดพลาดเหล่านี้อาจเป็นเรื่องใหญ่มากในชีวิตจริง”
เทอร์วีชบอกว่า แชตบอตนั้น “เก่งมาก” ในการปรับเปลี่ยนคำตอบตามคำแนะนำของมนุษย์ เช่น การแก้ไขคำตอบหลังจากชี้ให้เห็นข้อผิดพลาด และเห็นไปในทิศทางเดียวกับชอยว่า ChatGPT มีศักยภาพที่จะทำงานร่วมกับผู้คน และในแง่การทำข้อสอบ ก็ควรมีข้อจำกัดสำหรับนักเรียนบริหารธุรกิจด้วยเช่นกัน
“จำเป็นต้องมีข้อจำกัด ... ท้ายที่สุดแล้ว มันเหมือนกับเมื่อคุณให้ปริญญากับแพทย์ คุณต้องการให้พวกเขารู้จักยา ไม่ใช่วิธีการใช้บอต เช่นเดียวกับการรับรองทักษะอื่น ๆ รวมถึงกฎหมายและธุรกิจ” เทอร์วีชกล่าว
และเมื่อพูดถึงการแพทย์ คนในแวดวงแพทย์เองก็ได้ลองทดสอบความสามารถของเจ้า ChatGPT เช่นกัน
วิกเตอร์ เจิง รองประธานและผู้อำนวยการด้านการแพทย์ของ Ansible Health บริษัทการแพทย์ผู้เชี่ยวชาญด้านโรคปอดเรื้อรัง ต้องการศึกษาว่า ChatGPT จะนำมาใช้ในการยกระดับการดูแลผู้ป่วยได้หรือไม่
เจิงได้ทดลองให้ ChatGPT ทำข้อสอบใบอนุญาตประกอบวิชาชีพการแพทย์ในสหรัฐฯ (USMLE) ซึ่งเป็นคำถามแบบปรนัยหลายร้อยข้อ ที่เกี่ยวข้องกับการวินิจฉัยอาการและโรค แบ่งเป็น 3 ขั้นตอน
ขั้นตอนแรก ทีมวิจัยระบุสัญญาณและอาการของผู้ป่วยตามทฤษฎี และขอให้แชตบอตตอบอธิบายเกี่ยวกับสิ่งที่อาจเป็นสาเหตุหรือวินิจฉัยโรคที่ถูกต้อง
จากนั้นในขั้นตอนที่สอง นักวิจัยได้รีเฟรช ChatGPT เพื่อขจัดอคติที่อาจเกิดขึ้นจากข้อมูลใด ๆ ที่เกิดจากข้อสอบก่อนหน้า แล้วถามคำถามจากข้อสอบที่ยากขึ้น
ขั้นตอนสุดท้ายทีมวิจัยรีเฟรช ChatGPT อีกครั้ง แต่ครั้งนี้นักวิจัยขอให้ ChatGPT “โปรดอธิบายว่าเหตุใดคำตอบที่ถูกต้องจึงถูกต้อง และเหตุใดคำตอบที่ไม่ถูกต้องจึงไม่ถูกต้อง”
คำตอบได้รับการตรวจสอบและให้คะแนนโดยแพทย์ 3 คนที่ได้รับใบอนุญาตและได้รับการรับรองจากคณะกรรมการฯ
ความแม่นยำของ ChatGPT สำหรับขั้นตอนที่ 1 อยู่ที่ราว 43-68% ส่วนขั้นตอนที่ 2 อัตราการตอบถูกอยู่ที่ 51-58% และสำหรับขั้นตอนที่ 3 อยู่ที่ 56-62%
จากนั้นนำไปเทียบกับอัตราการผ่านของนักเรียนแพท์ที่เป็นคนจริง ๆ เมื่อปี 2021 ซึ่งจะแตกต่างกันไป ขึ้นอยู่กับว่าเป็นการสอบครั้งแรกหรือการสอบซ้ำ และผู้สอบมีทั้งที่มาจากสหรัฐฯ และประเทศอื่น
สำหรับขั้นตอนที่ 1 อัตราการผ่านของนักเรียนแพทย์จะอยู่ในช่วง 45-96% ขั้นตอนที่ 2 อยู่ที่ 62-99% และขั้นตอนที่ 3 อยู่ที่ 62-98%
“สิ่งที่น่าทึ่งคือ ในขั้นตอนที่ 2 และ 3 ซึ่งเป็นวิชาทางคลินิกขั้นสูงมากขึ้น ChatGPT ตอบคำถามคลุมเครือ (ตอบนอกเหนือชอยส์ หรือตอบไม่ได้) แค่ประมาณ 10% เท่านั้น” เจิงกล่าว
จากข้อมูลจะเห็นว่า แม้คะแนนของ ChatGPT จะต่ำกว่าคะแนนของนักเรียนแพทย์ประมาณหนึ่ง แต่ก็อยู่ในเกณฑ์ผ่านครึ่ง
เจิงบอกว่า “ผลลัพธ์ที่ได้ทำให้เราตกใจมาก จนเราต้องรีบเร่งตีพิมพ์ผลการศึกษาออกมา” โดยเผยแพร่ในระบบตีพิมพ์ล่วงหน้าบน medRxiv และใช้ ChatGPT เป็นผู้เขียนบทคัดย่อและผลลัพธ์การศึกษา
ด้าน อเล็กซ์ เมคาเบอร์ รองประธานการทดสอบ USMLE กล่าวว่า ไม่แปลกใจกับผลการศึกษา “ส่วนหนึ่งเป็นเพราะข้อมูลที่ป้อนเข้าไปให้ ChatGPT เป็นความรู้ทางการแพทย์เป็นส่วนใหญ่ ... ประกอบกับปัญญาประดิษฐ์มักจะประสบความสำเร็จกับคำถามที่เป็นปรนัย”
เจ้าหน้าที่ยังได้สอบถามตัวแชตบอตด้วยว่า ตัวมันจะเป็นภัยต่อการสอบ USMLE หรือไม่
มันตอบว่า “ChatGPT เป็นเครื่องมือที่น่าประทับใจสำหรับการประมวลผล แต่ไม่สามารถแทนที่ความรู้เฉพาะทาง การคิดเชิงวิพากษ์ และข้อพิจารณาด้านจริยธรรมที่จำเป็นต่อการปฏิบัติงานด้านการแพทย์ได้ ... USMLE ยังคงเป็นวิธีที่สำคัญและถูกต้องในการประเมินความรู้และความสามารถของแพทย์”
จากการศึกษาเหล่านี้ทำให้เห็นว่า เจ้า ChatGPT นี้ มีความสามารถในการประมวลผลเพื่อตอบคำถามเฉพาะทางได้ในระดับหนึ่ง ซึ่งอาจเป็นประโยชน์ในฐานะผู้ช่วย แต่ยังคงไม่สามารถเข้ามาแทนที่วิชาชีพเฉพาะทางได้
อย่างไรก็ดี ในแง่ของการทำข้อสอบหรือทำการบ้าน ก็ต้องยอมรับว่ามันเป็นเครื่องมือที่น่ากลัว ซึ่งแวดวงการศึกษาต้องหาวิธีในการรับมือ โดยขณะนี้มีโรงเรียนหลายแห่งในกรุงนิวยอร์กและนครซีแอตเทิลในสหรัฐฯ รวมถึงรัฐนิวเซาธ์เวลส์ ควีนส์แลนด์ และทัสมาเนียของออสเตรเลีย ประกาศสั่งห้ามไม่ให้นักเรียนมีการใช้ ChatGPT ในเครือข่ายของโรงเรียนและบนอุปกรณ์โดยเด็ดขาด
ภาพจาก AFP