สรุปสั้น
28 พฤษภาคม 2026 Anthropic เปิดตัว Claude Opus 4.8 ทวงตำแหน่ง #1 บน Artificial Analysis Intelligence Index ที่ 61.4 แต้ม เพิ่มจาก Opus 4.7 ที่ 57.3 แต้ม และนำหน้า GPT-5.5 (xhigh) ที่ 60.2 แต้ม
ตัวเลขที่น่าสนใจสำหรับทีม developer SWE-Bench Pro 69.2% เหนือ GPT-5.5 และ Gemini 3.1 Pro Online-Mind2Web 84% สำหรับ browser agent และ Legal Agent Benchmark เป็นโมเดลแรกที่ทะลุ 10% บน all-pass standard
ฟีเจอร์ใหม่ที่ใหญ่ที่สุด Dynamic Workflows ใน Claude Code ที่รัน subagent หลายร้อยตัวพร้อมกันในเซสชันเดียว และทำ codebase migration ระดับหลายแสนบรรทัดได้ พร้อม Effort Control ที่ปรับระดับ effort ของ response ได้เอง และ Messages API ที่รับ system entry กลางทาง task โดยไม่ต้องล้าง prompt cache
ราคาคงเดิมจาก Opus 4.7 ที่ 5 เหรียญต่อล้าน input token และ 25 เหรียญต่อล้าน output token Fast Mode 10/50 เหรียญถูกลง 3 เท่าจากรุ่นก่อน
สำหรับทีมที่ใช้ Claude Code เป็นเครื่องมือทำงานทุกวัน เช่น Enersys รุ่นนี้คือการขยับเชิงโครงสร้าง ไม่ใช่ incremental update
เกิดอะไรขึ้นวันที่ 28 พฤษภาคม 2026
Anthropic ประกาศเปิดตัว Claude Opus 4.8 ผ่าน newsroom อย่างเป็นทางการ และเข้าใช้งานได้ทันทีผ่าน Claude API ในชื่อ model claude-opus-4-8
TechCrunch รายงานว่าการเปิดตัวรอบนี้ มาพร้อมเครื่องมือใหม่ Dynamic Workflows ใน Claude Code ที่ Anthropic เรียกว่าการเพิ่ม "research preview" สำหรับ Enterprise, Team และ Max plan ของลูกค้าที่ใช้ Claude Code อยู่แล้ว
Artificial Analysis publication อิสระที่ track AI model benchmark ระบุชัดในวันถัดมาว่า Opus 4.8 ทวงตำแหน่ง #1 บน Intelligence Index ที่บริษัทดูแล จากเดิม GPT-5.5 (xhigh) ถือตำแหน่งอยู่นานหลายเดือน
ตัวเลข Benchmark ที่สำคัญ
ตัวเลขที่ Anthropic และ Artificial Analysis รายงาน
Artificial Analysis Intelligence Index 61.4 แต้ม นำ Opus 4.7 อยู่ 4.1 แต้ม และนำ GPT-5.5 อยู่ 1.2 แต้ม
SWE-Bench Pro 69.2% benchmark ที่ทดสอบความสามารถในการแก้ bug จริงใน codebase แบบ end-to-end Opus 4.8 ชนะ GPT-5.5 และ Gemini 3.1 Pro แต่ GPT-5.5 ยังนำใน terminal-coding benchmark เฉพาะ
GDPval-AA 1,890 Elo สำหรับ agentic performance บน knowledge work task implied win rate ราว 67% เทียบ GPT-5.5
Online-Mind2Web 84% สำหรับ browser agent performance
Legal Agent Benchmark Opus 4.8 เป็นโมเดลแรกที่ทะลุ 10% บน all-pass standard
Super-Agent benchmark เป็นโมเดลเดียวที่ทำได้ครบทุก case แบบ end-to-end
ตัวเลขเหล่านี้สำคัญสำหรับเลือก model ในงานเฉพาะ แต่อย่ายึดเดี่ยว benchmark ไม่ได้สะท้อนงานทุกประเภทที่ทีมทำจริง
Dynamic Workflows คือฟีเจอร์ใหญ่ที่สุด
ในรอบ Claude Code research preview Anthropic เปิด Dynamic Workflows ที่เปลี่ยนวิธีทำงานของ Claude Code อย่างมีนัยสำคัญ
ก่อน Dynamic Workflows Claude Code ทำงานเป็น single agent ที่ run task ทีละขั้น มี subagent ได้แต่จำกัด และไม่ได้ orchestrate ในระดับ workflow
ตอนนี้ Anthropic ระบุว่า Dynamic Workflows "enable Claude to run hundreds of parallel subagents in a single session" และจัดการ "codebase-scale migrations across hundreds of thousands of lines of code"
ความหมายในมุมของ developer
หนึ่ง งานที่เป็น parallel โดยธรรมชาติ เช่น migration ที่ apply pattern เดิมในหลายไฟล์ จะเร่งเวลาได้มาก จากการรอ Claude ทำทีละไฟล์ เป็นการ orchestrate ให้ subagent ทำงานพร้อมกัน
สอง งานที่ต้องการ exploration หลายทิศ เช่น refactor option ที่ต้องลองหลายแบบ ทำได้พร้อมกันใน subagent คนละตัว
สาม การ verify cross-cutting concern เช่น security audit หรือ test coverage ระดับ repo ทำได้ในเซสชันเดียว
จุดที่ต้องระวัง subagent แต่ละตัวกิน token แยก ค่าใช้จ่ายของ session ที่ใช้ Dynamic Workflows อาจสูงกว่า single agent หลายเท่า การวาง budget และ approval workflow ใน enterprise setting เป็นเรื่องที่ต้องคิดก่อน rollout ทีมใหญ่
Effort Control ปรับ quality กับ cost
ฟีเจอร์ที่สอง Effort Control เพิ่มใน claude.ai และ Cowork
ผู้ใช้เลือก effort level ของ response ได้เอง balance ระหว่าง quality, token usage และ speed ในกรณีที่งานเป็น exploration หรือ Q&A เร็ว ๆ ลด effort ลงเพื่อประหยัด token ในกรณีที่งานเป็น critical task เช่น production code change ที่ต้องคิดรอบคอบ เพิ่ม effort ขึ้น
ในมุมของ enterprise admin ฟีเจอร์นี้เป็นเครื่องมือควบคุม cost ที่ไม่ต้องลงไปแก้ prompt หรือเปลี่ยน model
Messages API รับ system entry กลางทาง
ฟีเจอร์ที่สามอาจดูเล็กในระดับ user แต่ใหญ่ในระดับ developer integration
Messages API รุ่นใหม่ รับ system entry ภายใน messages array ในกรณีที่ระบบต้องการ inject instruction กลาง task ตัวอย่างเช่น เมื่อ user เปลี่ยน context ของ project หรือเมื่อ orchestrator ต้องการ adjust behavior ของ agent กลางทาง
จุดสำคัญที่ Anthropic เน้น mid-task system update ไม่ทำลาย prompt cache สำหรับทีมที่จ่ายค่า cached input token (ราคาถูกกว่ามากเทียบ uncached) ฟีเจอร์นี้ลด cost ระยะยาวอย่างมีนัยสำคัญ
ตัวเลขด้านความปลอดภัยที่น่าสนใจ
Anthropic เน้นใน announcement ว่า Opus 4.8 "ราว 4 เท่า less likely than its predecessor to allow flaws in code it has written to pass unremarked"
ตัวเลขนี้สำคัญเพราะปัญหา code flaw ที่ AI generate และ ship เข้า production คือต้นเหตุของ technical debt และ security incident ในหลายองค์กร alignment assessment ของ Anthropic ยังระบุว่ารุ่นนี้ "reaches new highs on our measures of prosocial traits" และ "substantially lower" rates of misaligned behavior เทียบ Opus 4.7
ในการใช้งานจริง การลด code flaw 4 เท่า แปลว่า review effort ของทีมลดลง โอกาส ship bug ลดลง และ trust ในการใช้ AI-generated code เพิ่มขึ้น
แม้กระนั้น human review ในขั้นตอน critical ยังเป็น discipline ที่ต้องคงไว้ Karpathy ในการสัมภาษณ์ Sequoia เดือนเมษายน 2026 ยังย้ำว่า AI agent = intern entities ที่ต้อง mentor และ Opus 4.8 ที่เก่งขึ้น ไม่ได้ตัด requirement นี้ออก
ราคาและ access
ราคาคงเดิมจาก Opus 4.7
- ราคาปกติ 5 เหรียญต่อล้าน input token, 25 เหรียญต่อล้าน output token
- Fast Mode 10 เหรียญต่อล้าน input token, 50 เหรียญต่อล้าน output token ลดลง 3 เท่าเทียบ Fast Mode ของรุ่นก่อน
- Context 1 ล้าน token by default
- Max output 128k token
- Adaptive thinking + mid-conversation system messages
- Workflows (planning + parallel subagents) ใน Claude Code research preview สำหรับ Enterprise, Team, Max plan
API name claude-opus-4-8
ความหมายต่อทีม Enersys
Enersys ใช้ Claude Code เป็นเครื่องมือหลักในงาน development ทุกวัน Opus 4.8 รุ่นใหม่ส่งผลในสามมิติของบริษัท
Velocity เพิ่ม Dynamic Workflows เปิดทางให้งาน parallel ที่เคยใช้เวลาหลายวัน เช่น codebase-scale refactor หรือ migration ทำเสร็จในเซสชันเดียว สำหรับโปรเจกต์ ERP migration ของลูกค้าที่ระบบเดิมมีหลายแสนบรรทัด นี่เป็น tool ที่เปลี่ยนเศรษฐกิจของงาน
Code quality สูงขึ้น ตัวเลข 4 เท่าลด flaw ที่ Anthropic ระบุ ลด review burden ของ senior developer ทีมสามารถใช้เวลากับ architecture decision มากขึ้น และน้อยลงกับการตรวจ syntax issue ที่ AI สร้างเอง
Cost predictability ดีกว่า Effort Control + cached input ผ่าน Messages API ให้ admin วาง budget ของ developer ทั้งทีมได้แม่นขึ้น
ในเซสชัน steering committee รอบหน้า ทีม Enersys จะทบทวน budget สำหรับ Claude API ของไตรมาส ที่จะมาถึง พร้อมประเมินว่างานประเภทไหนของลูกค้า ควรย้ายไปใช้ Dynamic Workflows เป็นค่าเริ่มต้น
ปิดท้าย
Claude Opus 4.8 ไม่ใช่แค่ benchmark ที่ขยับ แต่เป็น tool category ที่เปลี่ยน Dynamic Workflows เปิดทางให้ Claude Code รับงาน scale ใหญ่ ที่ก่อนหน้านี้ต้องใช้คนวาง orchestration เอง
สำหรับทีมที่ใช้ Claude Code ทุกวัน นี่คือเวลาเริ่มทดลอง Dynamic Workflows กับงานที่ parallel ได้โดยธรรมชาติ และวัด velocity gain เทียบ cost เพิ่ม สำหรับองค์กรที่กำลังประเมิน AI coding tool ใหม่ Opus 4.8 ทวงตำแหน่ง #1 บน AA Intelligence Index และตัวเลขด้าน code quality ที่สูงขึ้น 4 เท่า เป็นจุดที่ควรใส่ในการพิจารณา
แหล่งข้อมูล