Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
KBANK เปิดบริการสแกนจ่าย QR ครอบคลุมกลุ่มอาเซียน - ADVANC โบรกฯ เคาะเป้า 315 บ.
MAI
MPJ รุกเปิดพื้นที่ลานตู้คอนเทนเนอร์ 'ลาดกระบัง-แหลมฉบัง'
IPO
6 โบรกฯ ฟันธง! ATLAS หุ้นเด่นอนาคตไกล เคาะเป้าสูง 5.20 บ.
บล./บลจ
ออร์บิกซ์ คว้า 2 รางวัลระดับนานาชาติ
เศรษฐกิจ-การเงิน-การคลัง
BAY วางกรอบเงินบาท 32.10-32.75 มองภาษีทรัมป์กดดันตลาดการเงินโลก
การค้า - พาณิชย์
พาณิชย์ เดินสายโซนตะวันออกจัดสัมมนาเชิงเทคนิค ครั้งที่ 2
พลังงาน - อุตสาหกรรม
TSE คว้ารางวัลพลังงานยอดเยี่ยม Thailand Energy Award 2 ปีซ้อน
คมนาคม - โลจิสติกส์
SJWD ชูโซลูชันโลจิสติกส์ รับมือปิดด่านเขมร
แบงก์ - นอนแบงก์
LH Bank รุกกลุ่มลูกค้าไต้หวัน-ตปท. อัดโปรฯโอนเงินฟรีค่าธรรมเนียม
ไฟแนนซ์ - ลิสซิ่ง
กรุงศรี ออโต้ เปิดพฤติกรรมผู้ใช้รถใหม่ทั่วภูมิภาคของไทย
SMEs - Startup
SCB TechX ตั้ง ‘สุทธิพงศ์’ นั่งแท่น CEO คนใหม่
ประกันภัย - ประกันชีวิต
เมืองไทยประกันชีวิต มอบรางวัลเกียรติยศ รพ.คู่สัญญา
รถยนต์
นิสสัน ปรับปรุงสายการผลิตในไทย เสริมแกร่งการแข่งขันด้านต้นทุน
ท่องเที่ยว
VRANDA ชี้ท่องเที่ยวส่งสัญญาณฟื้นตัว เด้งรับ ‘เที่ยวคนละครึ่ง’
อสังหาริมทรัพย์
SAM ยกทรัพย์กว่า 4,000 รายการ พร้อมโปรโมชั่นเอาใจลูกค้าหาดใหญ่
การตลาด
Shopee ผนึกพันธมิตร คว้าวง ENHYPEN เขย่าหัวใจแฟนคลับชาวไทย
CSR
SCB TechX ตั้ง ‘สุทธิพงศ์’ นั่งแท่น CEO คนใหม่
Information
ไทยประกันชีวิต-แอทเลติโก้ มอบทุน 3 เยาวชนกอล์ฟหญิง
Gossip
SM ปล่อยหมัดเด็ดอัพยอดขายครึ่งปีหลัง
Entertainment
ศุภาลัย กับ “ความเชื่อมั่น”
สกุ๊ป พิเศษ
PTG แกร่งทุกมิติ ชู Non-Oil เรือธง
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
313
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
KBANK เปิดบริการสแกนจ่าย QR ครอบคลุมกลุ่มอาเซียน - ADVANC โบรกฯ เคาะเป้า 315 บ.
ตลท. ดัชนีหุ้นไทยเดือน มิ.ย. 68 ปิดที่ 1,089.56 จุด
ADVICE เปิดเกมรุกไอทีพรีเมียม - CFARM เร่งเครื่องครึ่งปีหลัง ขยายธุรกิจไก่ไข่
A5 ยื่นไฟลิ่ง ลุยคลอดหุ้นกู้ ชูดอกเบี้ยสูงสุด 7.50%
COCOCO เอ็มโอยู 2 หน่วยงาน เสริมแกร่งด้าน ESG
ORN Backlog แตะ 2.6 พันล. ลุยเปิด 2 โปรเจ็กต์ใหม่ - TWPC ดันผลงานโต 2 หลัก