อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ให้กับวงการ Open-Source AI ด้วยความสามารถแบบ Hybrid Reasoning

ข่าวประชาสัมพันธ์ »

อาลีบาบา สร้างมาตรฐานใหม่ให้กับนวัตกรรมด้าน AI เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์สของบริษัทฯ

อาลีบาบาเปิดตัว Qwen3 สร้างมาตรฐานใหม่ให้กับวงการ Open-Source AI ด้วยความสามารถแบบ Hybrid Reasoning

ซีรีส์ Qwen3 ประกอบด้วยหก dense model และสอง Mixture-of-Experts (MoE) model ซึ่งช่วยให้ผู้พัฒนาซอฟต์แวร์สร้างแอปพลิเคชันยุคใหม่สำหรับอุปกรณ์เคลื่อนที่ แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่น ๆ อีกมากมายได้อย่างยืดหยุ่นโมเดล Qwen3 ทั้งหมด ปัจจุบันเปิดเป็นโอเพ่นซอร์สทั่วโลก ซึ่งรวมถึง dense models (ขนาดพารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B, และ 32B) และ MoE models (30B with 3B active, และ 235B with 22B active)

โมเดลการใช้เหตุผลแบบผสมผสาน (hybrid reasoning models) คือการผสานรวมโหมดการคิดเป็นขั้นเป็นตอน (thinking mode) และโหมดการใช้สัญชาตญาณ (non-thinking mode) ไว้ด้วยกัน

Qwen3 เป็น hybrid reasoning models แรกของอาลีบาบา เป็นการรวมความสามารถของ LLM แบบเดิม เข้ากับการใช้เหตุผลแบบไดนามิกที่ล้ำหน้า โมเดล Qwen3 สามารถสลับการใช้งานทั้งสองโหมดไปมา โดยใช้ thinking mode กับงานที่ซับซ้อนหลายขั้นตอน เช่น คณิตศาสตร์ การเขียนโค้ด การอนุมานเชิงตรรกะ และใช้ non-thinking mode เมื่อต้องการการตอบสนองที่รวดเร็วและตามวัตถุประสงค์อื่นทั่ว ๆ ไป

นักพัฒนาซอฟต์แวร์ที่เข้าใช้งาน Qwen3 ผ่าน API จะสามารถควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38K โทเค็น) ช่วยให้เกิดสมดุลระหว่างการดำเนินงานที่ชาญฉลาดและประสิทธิภาพในการประมวลผล โดยเฉพาะ Qwen3-235B-A22B MoE model ที่ช่วยลดต้นทุนการติดตั้งใช้งานได้อย่างมากเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ เป็นการย้ำให้เห็นความมุ่งมั่นของอาลีบาบาที่มุ่งสร้าง AI สมรรถนะสูงที่ให้ทุกคนเข้าใช้งานได้

ความก้าวหน้าครั้งสำคัญด้านทักษะหลายภาษา, ความสามารถของเอเจนต์, การใช้เหตุผล และความสอดคล้องทางความคิดและพฤติกรรมของมนุษย์

Qwen3 ได้รับการเทรนจากชุดข้อมูลขนาดใหญ่จำนวน 36 ล้านล้านโทเค็น ซึ่งมากกว่า Qwen2.5 ซึ่งเป็นรุ่นก่อนหน้าถึงสองเท่า จึงมีประสิทธิภาพล้ำหน้าอย่างมากทั้งด้านการใช้เหตุผล การทำตามคำสั่ง การใช้เครื่องมือและงานที่เป็นภาษาต่าง ๆ หลายภาษา

ความสามารถสำคัญ ๆ ได้แก่

  • เชี่ยวชาญหลายภาษา: รองรับ 119 ภาษาหลักและภาษาถิ่น มีความสามารถในการแปลและปฏิบัติตามคำสั่งได้หลายภาษาด้วยประสิทธิภาพสูง
  • สามารถผสานรวมเอเจนต์ประสิทธิภาพสูง: รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชันหรือการเรียกใช้เครื่องมือที่ทรงประสิทธิภาพ นับเป็นโมเดลโอเพ่นซอร์สระดับแนวหน้าเพื่องานที่ต้องใช้เอเจนต์ที่ซับซ้อน
  • มีการใช้เหตุผลที่เหนือกว่า: เหนือกว่าโมเดล Qwen รุ่นก่อนหน้านี้ (QwQ ใช้ thinking mode และ Qwen2.5 ใช้ non-thinking mode) ในด้านการวัดประสิทธิภาพทางคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะ
  • สอดคล้องกับความคิดและพฤติกรรมของมนุษย์มากขึ้น: สามารถมอบการเขียนเชิงสร้างสรรค์ การแสดงบทบาทสมมติ และการสนทนาโต้ตอบไปมา เพื่อทำให้การสนทนาเป็นธรรมชาติและน่าสนใจมากขึ้น

ความก้าวหน้าทางสถาปัตยกรรมของโมเดล ปริมาณข้อมูลการเทรนที่เพิ่มขึ้น และวิธีการเทรนที่มีประสิทธิภาพมากขึ้น ช่วยให้ Qwen3 สามารถทำผลงานได้อย่างโดดเด่นในการทดสอบระดับมาตรฐานอุตสาหกรรมต่าง ๆ เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความสามารถในการเขียนโค้ด), BFCL (ความสามารถในการใช้เครื่องมือและการเรียกใช้ฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสำหรับ LLM ที่สามารถปรับแต่งเพื่อให้เข้าใจและทำตามคำสั่งเฉพาะได้)

นอกจากนี้ ได้มีการนำกระบวนการเทรนสี่ขั้นตอนมาใช้เพื่อพัฒนา hybrid reasoning model ประกอบด้วย การเริ่มต้นการเทรนให้มีความสามารถในการใช้เหตุผลแบบเป็นขั้นตอน โดยใช้ห่วงโซ่การคิดที่เป็นลำดับในปริมาณจำกัดตั้งแต่ระยะแรกของการเทรน (long chain-of-thought cold start), การเรียนรู้แบบเสริมแรงโดยใช้เหตุผล (reasoning-based reinforcement learning: RL), การผสานผสาน thinking mode (thinking mode fusion) และ การเรียนรู้แบบเสริมแรงทั่วไป (general RL)

เปิดให้เข้าถึงเพื่อขับเคลื่อนนวัตกรรม

โมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีแล้วบน Hugging Face, Github, ModelScope และสามารถทดลองใช้ได้ที่ chat.qwen.ai สำหรับการเข้าใช้ผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มสำหรับการพัฒนาโมเดล AI ของอาลีบาบาจะเปิดให้เข้าใช้ได้เร็ว ๆ นี้ นอกจากนี้ Qwen3 ยังเป็นโมเดลที่ขับเคลื่อน Quark ซึ่งเป็นแอปพลิเคชันผู้ช่วยอัจฉริยะ AI สำคัญของอาลีบาบาอีกด้วย

นับแต่เปิดตัว โมเดลในตระกูล Qwen มียอดดาวน์โหลดแล้วมากกว่า 300 ล้านครั้งทั่วโลก นักพัฒนาซอฟต์แวร์ได้สร้างโมเดลต่อยอดจาก Qwen มากกว่า 100,000 โมเดลบน Hugging Face ทำให้ Qwen กลายเป็นหนึ่งใน ซีรีส์โมเดล open-source AI ที่มีการนำไปใช้อย่างแพร่หลายที่สุดในโลก


ข่าวพัฒนาซอฟต์แวร์+ซอฟต์แวร์วันนี้

กรุงศรี จับมือ ผู้ผลิตระบบบัญชี Express นำเสนอบริการ Krungsri Bill Payment Online ให้ SME เข้าถึงเทคโนโลยีการรับชำระเงินได้ง่ายๆ ปลอดภัย ลดต้นทุนด้านไอที

กรุงศรี (ธนาคารกรุงศรีอยุธยา จำกัด (มหาชน)) ร่วมกับ บริษัท เอ็กซ์เพรสซอฟท์แวร์กรุ๊ป จำกัด ผู้พัฒนาซอฟต์แวร์บัญชีสำเร็จรูป เปิดให้บริการ Krungsri Bill Payment Online ที่เชื่อมต่อระบบการรับชำระเงินเข้ากับซอฟต์แวร์บัญชี เพื่อให้ธุรกิจ SME สามารถรับชำระเงินได้ง่าย ๆ ลูกค้าจ่ายเงินได้อย่างสะดวกและปลอดภัย ที่สำคัญ SME สามารถใช้ได้ทันที ลดต้นทุนในการพัฒนาระบบไอที นางสาวนิลวรรณ จีระบุญ ประธานคณะเจ้าหน้าที่ด้านธุรกรรมการเงิน ธนาคารกรุงศรีอยุธยา จำกัด (มหาชน) กล่าวว่า "กรุงศรี และ เอ็กซ์เพรสซอฟท์แวร์กรุ๊ป

ความร่วมมือเชิงกลยุทธ์นี้เป็นการผสานรวม E... Amity Solutions จับมือ Databricks เปิดตัวนวัตกรรมแพลตฟอร์มสืบค้นข้อมูลด้วยภาษาธรรมชาติ — ความร่วมมือเชิงกลยุทธ์นี้เป็นการผสานรวม EkoAI เข้ากับ Databricks ...

คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยศรีปทุม จ... คณะเทคโนโลยีสารสนเทศ ม.ศรีปทุม ปั้นนักเทคโนโลยีรุ่นใหม่ สู้ศึกดิจิทัล! ผ่านโครงการ Tech Talk #4 — คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยศรีปทุม จัดโครงการอบรมหล...

เรียนรู้ "Prompt Engineer" อาชีพใหม่ไฟแรง... เรียนรู้ Prompt Engineering ที่ SPU พร้อมก้าวสู่ตลาดงานระดับโลก — เรียนรู้ "Prompt Engineer" อาชีพใหม่ไฟแรงในยุค AI กับ อาจารย์เบวล์ คณะเทคโนโลยีสารสนเทศ ...

คำบรรยายภาพ: Keng Teik Koay ประธานเจ้าหน้... Amity Solutions คว้ารางวัล "The Sauciest Startup" จากงาน Techsauce Awards 2024 — คำบรรยายภาพ: Keng Teik Koay ประธานเจ้าหน้าที่บริหารกลุ่มบริษัท และ ทัชพล ...

การรวมหน่วยควบคุมอิเล็กทรอนิกส์เสมือนจริง... คอนติเนนทอล จับมือ Synopsys นำเทคโนโลยี Digital Twin สู่ยานยนต์เร่งการพัฒนาซอฟต์แวร์ — การรวมหน่วยควบคุมอิเล็กทรอนิกส์เสมือนจริงจาก Synopsys และชุดฮาร์ดแว...