Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
ADVANC คาด Q2/69 กำไร 1.33 หมื่นล. - SVT วางหมากดึง AI หนุนธุรกิจ
MAI
DOD ผนึก 2 ยักษ์ใหญ่นิวซีแลนด์ นำเข้าสารสกัด
IPO
ก.ล.ต. นับหนึ่งไฟลิ่ง PHAT ลุยเข้า mai
บล./บลจ
“ศรพล” นั่งแท่น เลขาธิการ กบข. คนที่ 8
เศรษฐกิจ-การเงิน-การคลัง
SCB EIC อัพเป้าจีดีพีโต 2% รับแรงส่งมาตรการรัฐ – ราคาน้ำมันลด
การค้า - พาณิชย์
พาณิชย์เปิดโครงการ “Boost up SMEs สู่ตลาด FTA”
พลังงาน - อุตสาหกรรม
BANPU เปิดตัว 2 โครงการดักจับและกักเก็บคาร์บอนในสหรัฐฯ
คมนาคม - โลจิสติกส์
i-Store ปิดดีล REIT รายแรก หนุนอุตสาหกรรมก้าวสู่ตลาดทุน
แบงก์ - นอนแบงก์
ไทยพาณิชย์ ส่งแคมเปญ “SCB ออมลิมปิก” ชูแนวคิด “การออมเหมือนกีฬา”
ไฟแนนซ์ - ลิสซิ่ง
“มีที่ มีเงิน” ปรับเงื่อนไขสินเชื่อใหม่ หนุน SMEs เข้าถึงแหล่งทุน
SMEs - Startup
Orbix Technology จับมือ SKILLKAMP เติมเต็มประสบการณ์ดิจิทัลแก่เยาวชน
ประกันภัย - ประกันชีวิต
ไทยประกันชีวิต ร่วมยกระดับการวางแผนสุขภาพ-การเงิน
รถยนต์
Autoclik จัดโปรโมชั่นพิเศษ “Mid Year Sale 2026”
ท่องเที่ยว
“CardX” จับมือ “ONYX Hospitality Group” ปลุกตลาดท่องเที่ยวพรีเมียม
อสังหาริมทรัพย์
SAM ขนทัพบุกภาคใต้ เปิดทางเลือกแก้หนี้ครบวงจร
การตลาด
JAS และ MONOMAX เพิ่มทางเลือกผ่อนชําระ “ไม่มีบัตรเครดิตก็ผ่อนได้”
CSR
Orbix Technology จับมือ SKILLKAMP เติมเต็มประสบการณ์ดิจิทัลแก่เยาวชน
Information
INSET โชว์ศักยภาพเจาะลึก Data Center
Gossip
MOTHER จัดทัพ เสิร์ฟข้อมูลเด็ด-เจาะแผนโต ในงาน mai FORUM 2026
Entertainment
"พันธุ์ไทย" ให้เด็กรุ่นใหม่ได้ฉายแสง
สกุ๊ป พิเศษ
PTG ศักยภาพแข็งแกร่งระดับภูมิภาค
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
459
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
ADVANC คาด Q2/69 กำไร 1.33 หมื่นล. - SVT วางหมากดึง AI หนุนธุรกิจ
SYNEX ครึ่งปีหลังเข้าไฮซีซั่น ดันรายได้สู่เป้า 5.3 หมื่นลบ.
SVT เดินแผนดึง AI เสริมแกร่งธุรกิจ ปูทางสู่ “Smart Retail”
CIVIL ส่งมอบงาน 'ทางหลวง' - PTG ยืนหนึ่ง! SET100 - SET100FF
CIVIL ส่งมอบโครงการทางหลวง 3087 ราชบุรี-แก้มอ้น บุ๊กรายได้ 771 ล.
COCOCO ยกระดับ ESG สู่เติบโตยั่งยืน - MMM แจกวอร์แรนต์ชุดใหม่ XW 17 ก.ค. นี้