อาลีบาบา สร้างมาตรฐานใหม่ให้กับนวัตกรรมด้าน AI เปิดตัว Qwen3 ซึ่งเป็นรุ่นล่าสุดของตระกูลโมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์สของบริษัทฯ
ซีรีส์ Qwen3 ประกอบด้วยหก dense model และสอง Mixture-of-Experts (MoE) model ซึ่งช่วยให้ผู้พัฒนาซอฟต์แวร์สร้างแอปพลิเคชันยุคใหม่สำหรับอุปกรณ์เคลื่อนที่ แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่น ๆ อีกมากมายได้อย่างยืดหยุ่นโมเดล Qwen3 ทั้งหมด ปัจจุบันเปิดเป็นโอเพ่นซอร์สทั่วโลก ซึ่งรวมถึง dense models (ขนาดพารามิเตอร์ 0.6B, 1.7B, 4B, 8B, 14B, และ 32B) และ MoE models (30B with 3B active, และ 235B with 22B active)
โมเดลการใช้เหตุผลแบบผสมผสาน (hybrid reasoning models) คือการผสานรวมโหมดการคิดเป็นขั้นเป็นตอน (thinking mode) และโหมดการใช้สัญชาตญาณ (non-thinking mode) ไว้ด้วยกัน
Qwen3 เป็น hybrid reasoning models แรกของอาลีบาบา เป็นการรวมความสามารถของ LLM แบบเดิม เข้ากับการใช้เหตุผลแบบไดนามิกที่ล้ำหน้า โมเดล Qwen3 สามารถสลับการใช้งานทั้งสองโหมดไปมา โดยใช้ thinking mode กับงานที่ซับซ้อนหลายขั้นตอน เช่น คณิตศาสตร์ การเขียนโค้ด การอนุมานเชิงตรรกะ และใช้ non-thinking mode เมื่อต้องการการตอบสนองที่รวดเร็วและตามวัตถุประสงค์อื่นทั่ว ๆ ไป
นักพัฒนาซอฟต์แวร์ที่เข้าใช้งาน Qwen3 ผ่าน API จะสามารถควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38K โทเค็น) ช่วยให้เกิดสมดุลระหว่างการดำเนินงานที่ชาญฉลาดและประสิทธิภาพในการประมวลผล โดยเฉพาะ Qwen3-235B-A22B MoE model ที่ช่วยลดต้นทุนการติดตั้งใช้งานได้อย่างมากเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ เป็นการย้ำให้เห็นความมุ่งมั่นของอาลีบาบาที่มุ่งสร้าง AI สมรรถนะสูงที่ให้ทุกคนเข้าใช้งานได้
ความก้าวหน้าครั้งสำคัญด้านทักษะหลายภาษา, ความสามารถของเอเจนต์, การใช้เหตุผล และความสอดคล้องทางความคิดและพฤติกรรมของมนุษย์
Qwen3 ได้รับการเทรนจากชุดข้อมูลขนาดใหญ่จำนวน 36 ล้านล้านโทเค็น ซึ่งมากกว่า Qwen2.5 ซึ่งเป็นรุ่นก่อนหน้าถึงสองเท่า จึงมีประสิทธิภาพล้ำหน้าอย่างมากทั้งด้านการใช้เหตุผล การทำตามคำสั่ง การใช้เครื่องมือและงานที่เป็นภาษาต่าง ๆ หลายภาษา
ความสามารถสำคัญ ๆ ได้แก่
ความก้าวหน้าทางสถาปัตยกรรมของโมเดล ปริมาณข้อมูลการเทรนที่เพิ่มขึ้น และวิธีการเทรนที่มีประสิทธิภาพมากขึ้น ช่วยให้ Qwen3 สามารถทำผลงานได้อย่างโดดเด่นในการทดสอบระดับมาตรฐานอุตสาหกรรมต่าง ๆ เช่น AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความสามารถในการเขียนโค้ด), BFCL (ความสามารถในการใช้เครื่องมือและการเรียกใช้ฟังก์ชัน) และ Arena-Hard (เกณฑ์มาตรฐานสำหรับ LLM ที่สามารถปรับแต่งเพื่อให้เข้าใจและทำตามคำสั่งเฉพาะได้)
นอกจากนี้ ได้มีการนำกระบวนการเทรนสี่ขั้นตอนมาใช้เพื่อพัฒนา hybrid reasoning model ประกอบด้วย การเริ่มต้นการเทรนให้มีความสามารถในการใช้เหตุผลแบบเป็นขั้นตอน โดยใช้ห่วงโซ่การคิดที่เป็นลำดับในปริมาณจำกัดตั้งแต่ระยะแรกของการเทรน (long chain-of-thought cold start), การเรียนรู้แบบเสริมแรงโดยใช้เหตุผล (reasoning-based reinforcement learning: RL), การผสานผสาน thinking mode (thinking mode fusion) และ การเรียนรู้แบบเสริมแรงทั่วไป (general RL)
เปิดให้เข้าถึงเพื่อขับเคลื่อนนวัตกรรม
โมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีแล้วบน Hugging Face, Github, ModelScope และสามารถทดลองใช้ได้ที่ chat.qwen.ai สำหรับการเข้าใช้ผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มสำหรับการพัฒนาโมเดล AI ของอาลีบาบาจะเปิดให้เข้าใช้ได้เร็ว ๆ นี้ นอกจากนี้ Qwen3 ยังเป็นโมเดลที่ขับเคลื่อน Quark ซึ่งเป็นแอปพลิเคชันผู้ช่วยอัจฉริยะ AI สำคัญของอาลีบาบาอีกด้วย
นับแต่เปิดตัว โมเดลในตระกูล Qwen มียอดดาวน์โหลดแล้วมากกว่า 300 ล้านครั้งทั่วโลก นักพัฒนาซอฟต์แวร์ได้สร้างโมเดลต่อยอดจาก Qwen มากกว่า 100,000 โมเดลบน Hugging Face ทำให้ Qwen กลายเป็นหนึ่งใน ซีรีส์โมเดล open-source AI ที่มีการนำไปใช้อย่างแพร่หลายที่สุดในโลก
"รักเหมา" แพลตฟอร์มจัดซื้อวัสดุก่อสร้าง เดินหน้าสู่ปีที่ 4 ด้วยการประกาศความร่วมมือเชิงกลยุทธ์กับ "Mango ERP" ผู้พัฒนาซอฟต์แวร์ ERP (Enterprise Resource Planning) สัญชาติไทย ที่มีความเชี่ยวชาญเฉพาะทางในการออกแบบระบบการจัดการโครงการสำหรับธุรกิจรับเหมา ก่อสร้าง และพัฒนาอสังหาริมทรัพย์ และ "สินเชื่อไวเวอร์" วงเงินซื้อวัสดุก่อสร้างพร้อมใช้ เพื่อส่งมอบโซลูชันครบวงจรด้านการจัดซื้อ การบริหารโครงการ และการเข้าถึงแหล่งเงินทุน ให้แก่ผู้รับเหมาและผู้ประกอบการในธุรกิจก่อสร้างทั่วประเทศ ความร่วมมือในครั้งนี้
คณะเทคโนโลยีสารสนเทศ SPU โชว์นวัตกรรม AI Assistant ฝีมือนักศึกษา ในเวที Education Next Forum 2025
—
คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยศรีปทุม นำโดย ผศ.ดร.ปร...
Nutanix เปิดตัว Cloud Native AOS ขยายการใช้งาน Data Platform ขององค์กรไปยัง Kubernetes ใดก็ได้
—
โซลูชันใหม่นี้ช่วยให้นักพัฒนาซอฟต์แวร์สร้าง cloud-native ...
กรุงศรี จับมือ ผู้ผลิตระบบบัญชี Express นำเสนอบริการ Krungsri Bill Payment Online ให้ SME เข้าถึงเทคโนโลยีการรับชำระเงินได้ง่ายๆ ปลอดภัย ลดต้นทุนด้านไอที
—
กรุงศรี (ธน...
อาลีบาบา คลาวด์ วางตลาดโมเดล เครื่องมือและโครงสร้างพื้นฐาน รุ่นล่าสุดสำหรับ AIมุ่งเสริมประสิทธิภาพที่แข็งแกร่งให้กับชุมชน AI ทั่วโลก
—
ธุรกิจด้านเทคโนโลยี...
เอเซอร์หนุนอุตสาหกรรมอีสปอร์ตไทย โตต่อเนื่อง ปั้นนักศึกษาในโครงการ "Esports Internship Program" เปิดโอกาสงานด้านอีสปอร์ตให้กลุ่มคนพิการ
—
เอเซอร์คาดการณ์ว...
Amity Solutions จับมือ Databricks เปิดตัวนวัตกรรมแพลตฟอร์มสืบค้นข้อมูลด้วยภาษาธรรมชาติ
—
ความร่วมมือเชิงกลยุทธ์นี้เป็นการผสานรวม EkoAI เข้ากับ Databricks ...
คณะเทคโนโลยีสารสนเทศ ม.ศรีปทุม ปั้นนักเทคโนโลยีรุ่นใหม่ สู้ศึกดิจิทัล! ผ่านโครงการ Tech Talk #4
—
คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยศรีปทุม จัดโครงการอบรมหล...
เรียนรู้ Prompt Engineering ที่ SPU พร้อมก้าวสู่ตลาดงานระดับโลก
—
เรียนรู้ "Prompt Engineer" อาชีพใหม่ไฟแรงในยุค AI กับ อาจารย์เบวล์ คณะเทคโนโลยีสารสนเทศ ...