Phones
หน้าแรก
Stock
เศรษฐกิจมหภาค
แบงก์ - Finance
อสังหาริมทรัพย์ - Marketing
ประกัน - ท่องเที่ยว
Variety
สกู้ป พิเศษ
SET
FETCO ดัชนีเชื่อมั่นอยู่ในเกณฑ์ “ร้อนแรงอย่างมาก” - WP โชว์โรดแมพJUMP+
MAI
MPJ เพิ่มลานตู้คอนเทนเนอร์แหลมฉบัง รองรับลูกค้าโซน EEC
IPO
ก.ล.ต. นับหนึ่งไฟลิ่ง UNIX จ่อขายไอพีโอ 180 ล้านหุ้น
บล./บลจ
orbix INVEST ลดค่าธรรมเนียม ‘Orbix BTC Flagship’ เหลือ 0%
เศรษฐกิจ-การเงิน-การคลัง
SCB EIC ชี้ศก.ไทยปีม้าโตเพียง 1.5% ปัจจัยบวกหดหาย
การค้า - พาณิชย์
SME D Bank หนุนผู้ประกอบการใช้ AI ยกระดับธุรกิจ
พลังงาน - อุตสาหกรรม
SCB EIC แนะอุตฯอิเล็กทรอนิกส์ไทยรับมือความเสี่ยงภาษีชิป AI ของสหรัฐฯ
คมนาคม - โลจิสติกส์
WICE ยกระดับความยั่งยืน รับการประเมินระดับ “Silver” จาก EcoVadis
แบงก์ - นอนแบงก์
TTB เปิดแผน ‘Wealth Banking’ ตั้งเป้า AUM แตะ 7.5 แสนล.
ไฟแนนซ์ - ลิสซิ่ง
SAWAD แกร่ง! ฟิทช์คงอันดับเครดิตที่ระดับ ‘A-(tha)’
SMEs - Startup
TECHLEAD เข้าลงทุน Nestifly ยกระดับแพลตฟอร์มฟินเทค
ประกันภัย - ประกันชีวิต
เมืองไทยประกันชีวิต ปรับพอร์ตแนะนำยูนิตลิงค์ เพิ่มโอกาสรับผลตอบแทน
รถยนต์
กรุงศรี ออโต้ ชวน เช็ก 5 ข้อก่อน(เช่า)ซื้อ มอเตอร์ไซค์อีวี
ท่องเที่ยว
TAGTHAi จับมือ BEM หนุนเส้นทางท่องเที่ยวเชิงวัฒนธรรม
อสังหาริมทรัพย์
A5 โชว์การเงินแกร่ง ไม่ Roll Over หุ้นกู้ พร้อมลุยธุรกิจใหม่
การตลาด
CardX จับมือ JCB เปิดแคมเปญ “JAPAN CASHBACK ให้ความสุขในทุกดีล”
CSR
TECHLEAD เข้าลงทุน Nestifly ยกระดับแพลตฟอร์มฟินเทค
Information
LH Bank จัดสัมมนา “Gallop into 2026 Blueprint” สร้างโอกาสการลงทุนโลกการเงิน
Gossip
STARM จัดแคมเปญพิเศษ มอบส่วนลดสุดคุ้ม!
Entertainment
ThaiCBN จับมือกรมลดโลกร้อน เร่งเครื่อง NDC 3.0
สกุ๊ป พิเศษ
ภาวะธุรกิจที่อยู่อาศัยปี 2568-2569
SCB 10X จับมือพันธมิตรเปิดตัว ThaiExam Leaderboard HELM
2024-10-08 20:21:05
401
sharer
นิวส์ คอนเน็คท์ – SCB 10X และ SCBX ร่วมกับ Stanford CRFM เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM หวังช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
เมื่อวันที่ 8 ตุลาคม 2567 นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) เปิดเผยว่า SCB 10X และ SCBX ได้ร่วมมือกับศูนย์วิจัยสแตนฟอร์ดด้านโมเดลโครงสร้างพื้นฐาน (Stanford CRFM) เปิดตัว ThaiExam leaderboard ซึ่งเป็นมาตรฐานที่ออกแบบมาเพื่อประเมินโมเดลภาษาขนาดใหญ่ (LLM) ในบริบทภาษาไทย โดยใช้กรอบการประเมินของ HELM (Holistic Evaluation of Language Models) ผู้นำด้านการออกแบบการประเมินโมเดลภาษาขนาดใหญ่ โดยความร่วมมือในครั้งนี้ช่วยให้การประเมินโมเดลครอบคลุมมากขึ้นโดยเน้นภาษาไทยเป็นหลัก
สำหรับ ThaiExam Leaderboard ออกแบบมาเพื่อประเมินโมเดลภาษาไทยขนาดใหญ่ ซึ่งได้มาจากการสอบวัดความรู้เชิงวิชาการระดับชั้นมัธยมศึกษาและการสอบวิชาชีพทางการเงิน เช่น ONET, TGAT, A-Level และการสอบผู้แนะนำการลงทุน (IC) เพื่อประเมินโมเดลภาษาไทยชั้นนำต่างๆ รวมถึง “ไต้ฝุ่น” (Typhoon) โดยให้ความโปร่งใสอย่างเต็มรูปแบบตั้งแต่การตั้งคำถาม หรือ โจทย์โดยโมเดลสาธารณะที่ใช้กรอบการประเมินของ HELM โครงการนี้เป็นการเปิดตัว leaderboard ในรูปแบบสาธารณะ และเป็นครั้งแรกที่ออกแบบมาโดยเฉพาะสำหรับการประเมินภาษาไทย มีวัตถุประสงค์เพื่อขับเคลื่อนการพัฒนาและการประเมินโมเดลภาษาไทย
“ความร่วมมือกับ Stanford CRFM ในครั้งนี้ตอกย้ำถึงความมุ่งมั่นของเราในการพัฒนา NLP ภาษาไทยและกำหนดมาตรฐานสำหรับการประเมินโมเดลภาษาหลายภาษาเรามั่นใจเป็นอย่างยิ่งว่า ThaiExam Leaderboard จะสามารถกระตุ้นการพัฒนาโมเดลภาษาไทยและส่งเสริมความร่วมมือในชุมชนวิจัย AI เพื่อสนับสนุนภาษาเฉพาะถิ่นที่ไม่ได้เป็นภาษาสากลและเป็นภาษาที่มีข้อมูลจำกัด” นายกสิมะ กล่าว
ทั้งนี้ แม้ว่าโมเดลขั้นสูง เช่น GPT-4 และ Claude 3 จะมีความสามารถหลายภาษา แต่กรอบการประเมินจะมุ่งเน้นการประเมินเป็นภาษาอังกฤษส่วนใหญ่ อย่างไรก็ตามThaiExam leaderboard จะเป็นกรอบการประเมินของ HELM ซึ่งมีวัตถุประสงค์เพื่อเติมเต็มช่องว่างที่สำคัญ กล่าวคือมอบระบบการประเมินที่ถูกปรับแต่งสำหรับภาษาไทยโดยเฉพาะ ซึ่งเป็นภาษาที่ซับซ้อนที่มีลักษณะทางภาษาที่ไม่เหมือนใคร ผ่านวิธีการที่เข้มงวดของ HELM นักวิจัยและนักพัฒนาสามารถประเมินประสิทธิภาพของโมเดลในภาษาไทยได้อย่างแม่นยำและโปร่งใส ด้วยข้อความภาษาไทยดั้งเดิมและชุดการประเมินที่ครอบคลุม โครงการนี้เสนอมาตรฐานที่จำเป็นสำหรับการทำความเข้าใจว่าโมเดลภาษาทำงานได้ดีแค่ไหนในบริบทภาษาไทย
สำหรับ ThaiExam Leaderboard ได้ประเมิน โมเดลภาษาไทยที่โดดเด่น 34 โมเดล โดยหนึ่งในนั้นมีโมเดลของ Typhoon ซึ่งผลจากการประเมินระบุว่า Typhoon 1.5X Instruct (70B) มีประสิทธิภาพเหนือกว่าโมเดลปิด เช่น GPT-4 Turbo และ Claude 3 Sonnet ที่เน้นความสามารถด้านภาษาไทยที่แข็งแกร่งด้วยความแม่นยำ 61.7% แม้แต่โมเดล Typhoon ขนาดเล็ก (8B) ก็ยังเหนือกว่า GPT-3.5 Turbo ในขณะที่โมเดล เช่น Claude 3 Haiku และ Llama 3 (70B) ก็แสดงผลลัพธ์ที่น่าสนใจ แม้จะไม่ได้รับการฝึกอบรมโดยเฉพาะสำหรับภาษาไทย ผลลัพธ์เหล่านี้เน้นย้ำถึงพลังของการปรับแต่งภาษาไทยที่เน้นภาษาไทยในการเพิ่มประสิทธิภาพภาษาท้องถิ่น
ทั้งนี้ SCB 10X มุ่งมั่นที่จะส่งเสริมนวัตกรรม AI ผ่านการร่วมมือเชิงกลยุทธ์กับบริษัท AI และสถาบันชั้นนำทั่วเอเชียตะวันออกเฉียงใต้และทั่วโลก ด้วยการทำงานอย่างใกล้ชิดกับผู้เล่น AI ที่โดดเด่น SCB 10X ใช้ประโยชน์จากความเชี่ยวชาญร่วมกันเพื่อขับเคลื่อนนวัตกรรมในระบบนิเวศ LLM ของไทย ซึ่งยกระดับคุณภาพและความเกี่ยวข้องของโซลูชัน AI ที่ปรับแต่งมาโดยเฉพาะสำหรับตลาดเอเชียตะวันออกเฉียงใต้ โครงการที่โดดเด่น ได้แก่ การเปิดตัว “ThaiLLM Leaderboard” ร่วมกับ VISTEC และ SEACrowd Project ซึ่งประเมิน LLM โดยใช้ 10 ชุดข้อมูลในงานหลักเพื่อส่งเสริมการเติบโตของงานวิจัย NLP ภาษาไทย
นอกจากนี้ SCB 10X ยังร่วมมือกับสถาบันระหว่างประเทศ เช่น มหาวิทยาลัยเคมบริดจ์ (University of Cambridge) และมหาวิทยาลัยทิงหัว (Tsinghua University) เกี่ยวกับการตรวจจับภาพลวงตาหลายรูปแบบด้วย "CrossCheckGPT" และกับมหาวิทยาลัยมหิดลเพื่อใช้ประโยชน์จาก AI สำหรับการพัฒนาทั้งส่วนบุคคลและระดับชาติ อีกทั้ง SCB 10X ยังเป็นผู้มีส่วนร่วมในโครงการ เช่น SEA-LION v2 และ Project SEALD ร่วมกับ AI Singapore (AISG) เพื่อส่งเสริมโมเดลภาษาสำหรับภูมิภาค ความพยายามเหล่านี้ทำให้ประเทศไทยมีบทบาทอย่างแข็งขันในการพัฒนาเทคโนโลยี AI ทั่วโลก
FETCO ดัชนีเชื่อมั่นอยู่ในเกณฑ์ “ร้อนแรงอย่างมาก” - WP โชว์โรดแมพJUMP+
WP เปิดแผนธุรกิจ JUMP+ ปักธงรายได้โตแกร่ง
FETCO ดัชนีเชื่อมั่นนักลงทุน 3 เดือนหน้าอยู่ที่ 165.37
PTECH ไฟเขียวเพิ่มทุน ขาย RO อัตรา 2:1 ราคา 2 บ./หุ้น
BANPU เดินหน้ากลยุทธ์ Energy Symphonics - NER โบรกฯ เชียร์ 'ซื้อ' เป้า 6.20 บ.
WHAUP ผนึกกำลัง “รีเอ็กซ์ โปรดักส์” หนุนสู่ Green Factory