Anthropic đã vô hiệu hóa quyền truy cập toàn cầu vào Fable 5 và Mythos 5 theo chỉ thị kiểm soát xuất khẩu của chính phủ Mỹ.
Lệnh được nhận lúc 5:21 chiều ET (4:21 sáng ngày hôm sau giờ VN), trích dẫn các lo ngại an ninh quốc gia liên quan đến một phương thức jailbreak được báo cáo. Tất cả các mô hình khác của Anthropic vẫn hoạt động bình thường.
Công ty cho biết đang tuân thủ chỉ thị trong khi vẫn phản bác cơ sở kỹ thuật của quyết định này.
Chính phủ Mỹ đã ban hành chỉ thị mà không tiết lộ các chi tiết an ninh quốc gia cụ thể bằng văn bản. Các quan chức đã thông báo bằng lời rằng họ đã biết về một phương thức có khả năng vượt qua các biện pháp bảo vệ của Fable 5.
Anthropic đã xem xét một bản trình diễn kỹ thuật này và nhận thấy nó chỉ để lộ các lỗ hổng nhỏ đã được biết đến trước đây.
Công ty đã xem xét những gì họ cho là báo cáo đằng sau quyết định của chính phủ. Anthropic tuyên bố rằng mức độ khả năng được thể hiện "có sẵn rộng rãi từ các mô hình khác, bao gồm GPT-5.5 của OpenAI, và được những người bảo vệ hệ thống an toàn sử dụng hàng ngày." Quá trình xem xét đó không tìm thấy bất kỳ sự nâng cấp nào đặc thù cho Fable trong các kết quả.
Jailbreak được báo cáo về cơ bản liên quan đến việc yêu cầu mô hình đọc một codebase và xác định các lỗ hổng phần mềm. Anthropic xác nhận rằng họ "thậm chí chưa nhận được thông báo về một jailbreak tiềm năng không phổ quát đáng lo ngại dẫn đến kết quả gây hại." Các jailbreak tiềm năng được tiết lộ hoặc hoàn toàn vô hại hoặc được phân loại là phát hiện nhỏ.
Chỉ thị yêu cầu đình chỉ quyền truy cập đối với tất cả công dân nước ngoài, bao gồm cả nhân viên Anthropic có tư cách công dân nước ngoài, cả trong và ngoài Hoa Kỳ. Công ty cho biết việc tuân thủ đồng nghĩa với việc vô hiệu hóa các mô hình đối với tất cả khách hàng để tránh vi phạm lệnh.
Anthropic đã ra mắt Fable 5 với chiến lược phòng thủ theo chiều sâu, kết hợp khả năng kháng jailbreak có chọn lọc với giám sát thời gian thực và chính sách lưu giữ dữ liệu bắt buộc 30 ngày.
Công ty đã thừa nhận trong buổi ra mắt rằng "khả năng kháng jailbreak hoàn hảo hiện không thể thực hiện được đối với bất kỳ nhà cung cấp mô hình nào."
Chính sách lưu giữ dữ liệu 30 ngày là một sự đánh đổi có chủ ý. Nó vấp phải sự phản đối từ khách hàng nhưng cho phép Anthropic phát hiện, nghiên cứu và phản hồi các nỗ lực jailbreak một cách nhanh chóng.
Anthropic mô tả điều này là làm cho các jailbreak "hoặc có phạm vi hẹp hoặc rất tốn kém để tạo ra," giữ mức độ rủi ro tương đương với các mô hình đã triển khai khác trong ngành.
Về thẩm quyền hành động của chính phủ, Anthropic cho biết họ "tin rằng chính phủ nên có khả năng ngăn chặn các triển khai không an toàn, như một phần của quy trình pháp lý minh bạch, công bằng, rõ ràng và dựa trên sự thật kỹ thuật." Công ty lập luận rằng chỉ thị này không đáp ứng các tiêu chuẩn đó.
Anthropic cảnh báo rằng việc áp dụng tiêu chuẩn thu hồi này một cách rộng rãi "về cơ bản sẽ ngăn chặn tất cả các triển khai mô hình mới đối với tất cả các nhà cung cấp mô hình tiên tiến."
Công ty cam kết sẽ công bố thêm các chi tiết kỹ thuật trong vòng 24 giờ và xác nhận tất cả các mô hình khác trong danh mục tiếp tục hoạt động mà không bị hạn chế.
Bài viết Anthropic đình chỉ Fable 5 và Mythos 5 sau khi chính phủ Mỹ ban hành chỉ thị kiểm soát xuất khẩu xuất hiện đầu tiên trên Blockonomi.


