Mới đây, Anthropic đã chính thức giới thiệu phiên bản nâng cấp Claude Opus 4.8, tiếp nối những bước tiến từ Opus 4.7 mà không tăng giá thành sử dụng. Phiên bản này tập trung chủ yếu vào việc cải thiện tính trung thực của trí tuệ nhân tạo, giúp AI tự nhận biết được khi nào nó chưa đủ chắc chắn thay vì đưa ra các kết luận thiếu chính xác hoặc báo cáo hoàn thành sớm hơn thực tế. Đây là điểm khác biệt lớn nhất so với các bản trước, góp phần nâng cao độ tin cậy và giảm thiểu sai sót trong các tác vụ phức tạp như viết code.
Một trong những thách thức phổ biến đối với các mô hình AI hiện nay là xu hướng thể hiện sự tự tin quá mức khi xử lý dữ liệu hoặc giải quyết nhiệm vụ. Thực tế cho thấy, AI đôi khi kết thúc công việc khi vẫn còn lỗi tồn đọng hoặc tự tin khẳng định một điều chưa có bằng chứng thuyết phục. Để khắc phục tình trạng này, Anthropic đã tập trung cải tiến Opus 4.8 nhằm nâng cao khả năng nhận dạng và thông báo các điểm chưa chắc chắn hay lỗi tiềm ẩn, thay vì giả vờ hoàn tất nhiệm vụ.

Giao diện mô hình Claude Opus 4.8
Theo đánh giá nội bộ của Anthropic, Opus 4.8 đã giảm thiểu tình trạng bỏ qua lỗi trong mã lập trình gấp khoảng bốn lần so với phiên bản tiền nhiệm Opus 4.7. Khi gặp phải điểm không chắc chắn, phiên bản mới có xu hướng dừng lại và gắn nhãn cảnh báo để người dùng dễ dàng theo dõi và kiểm tra, thay vì tiếp tục vận hành một cách mù quáng. Điều này nâng cao đáng kể tính minh bạch và sự tin cậy khi sử dụng công nghệ AI trong các dự án yêu cầu độ chính xác cao.
Ngoài tính trung thực được cải thiện, nhóm phát triển Anthropic cũng ghi nhận sự tiến bộ vượt bậc của Opus 4.8 trên các tiêu chí về hỗ trợ người dùng và bảo vệ quyền tự quyết cá nhân. Tỷ lệ phản hồi có hành vi sai lệch như gian lận hay hỗ trợ cho các yêu cầu có mục đích xấu giảm mạnh so với Opus 4.7, giúp phiên bản mới đạt mức căn chỉnh tương đương với Claude Mythos Preview – mô hình được đánh giá là đi đầu về mặt căn chỉnh hành vi an toàn tại thời điểm hiện nay.
Một điểm đáng chú ý khác trong lần cập nhật này là chế độ Fast Mode được tích hợp cùng Opus 4.8, hoạt động nhanh hơn khoảng 2,5 lần so với tốc độ mặc định của mô hình. Chế độ này rất thích hợp cho những tác vụ cần phản hồi tức thời hoặc xử lý luồng dữ liệu bất đồng bộ liên tục mà vẫn đảm bảo chất lượng đầu ra.
Đáng chú ý, mức giá cho Fast Mode của phiên bản mới được giảm sâu đến ba lần so với các phiên bản trước đó, chỉ còn 10 đô la Mỹ cho mỗi triệu token đầu vào và 50 đô la Mỹ cho mỗi triệu token đầu ra. Trong khi đó, giá dịch vụ tiêu chuẩn vẫn giữ nguyên ở mức 5 đô la Mỹ cho mỗi triệu token đầu vào và 25 đô la Mỹ cho mỗi triệu token đầu ra, mang lại lựa chọn kinh tế hơn cho người dùng tùy thuộc vào nhu cầu sử dụng.

Chi phí tối ưu của Fast Mode trên Opus 4.8
Cùng với đó, Anthropic bổ sung tính năng Effort Control giúp người dùng linh hoạt điều chỉnh mức độ nỗ lực mà AI dành cho mỗi phản hồi. Khi đặt ở mức cao hơn, mô hình sẽ phân tích kỹ lưỡng hơn để đưa ra kết quả chất lượng tốt nhưng sẽ tiêu hao nhiều token và thời gian chờ lâu hơn. Ngược lại, mức nỗ lực thấp đem lại tốc độ phản hồi nhanh cùng chi phí sử dụng tiết kiệm hơn nhưng đổi lại hiệu quả có thể giảm nhẹ.
Phiên bản Opus 4.8 mặc định chạy ở mức nỗ lực cao nhằm đảm bảo chất lượng đầu ra tối ưu mà không tăng đáng kể số lượng token tiêu thụ so với phiên bản trước đó trong những tác vụ lập trình phổ biến. Tính năng Effort Control hiện đã được triển khai rộng rãi trên toàn bộ các gói dịch vụ thuộc nền tảng trí tuệ nhân tạo mà Anthropic cung cấp.
Về kế hoạch phát triển tương lai, Anthropic đang ráo riết hoàn thiện các cơ chế bảo đảm an toàn để sớm phát hành rộng rãi dòng sản phẩm Claude Mythos – thế hệ mô hình AI tiên tiến vượt trội so với toàn bộ chuỗi Opus hiện tại. Hiện tại, một số tổ chức đã thử nghiệm Mythos Preview trong lĩnh vực an ninh mạng qua dự án Project Glasswing và dự kiến sẽ mở rộng đến toàn bộ khách hàng trong vòng vài tuần tới.