Ngày 30 tháng 6 (Reuters) — Công ty Anthropic nói rằng hôm thứ Ba, Bộ Thương Mại Mỹ đã bỏ lệnh cấm xuất khẩu đối với hai mô hình AI mới nhất của họ, tên là Fable và Mythos. Việc này xảy ra chưa đầy ba tuần sau khi công ty bị yêu cầu tạm dừng cho người dùng truy cập, vì lo ngại về an ninh quốc gia.
Chính phủ Mỹ đang kiểm soát chặt hơn các mô hình AI mới. Họ lo rằng các mô hình AI mạnh có thể bị quân đội hoặc cơ quan tình báo ở Trung Quốc, Nga, hoặc các nước khác lợi dụng.
Ngày 12 tháng 6, chính phủ ra lệnh yêu cầu Anthropic phải chặn ngay người nước ngoài không được dùng Mythos 5 và Fable 5. Vì công ty không có cách nào kiểm tra quốc tịch người dùng theo thời gian thực, nên họ đã tắt cả hai mô hình cho tất cả mọi người.
Tuần trước, chính phủ Mỹ cho phép công ty mở lại Mythos 5, nhưng chỉ cho một số tổ chức Mỹ được tin cậy. Mythos 5 là mô hình dùng để tìm lỗi an ninh mạng. Trước đó, mô hình này đã được chia sẻ với nhiều công ty hơn, trong một chương trình tên là Glasswing.
Hôm thứ Ba, Anthropic nói rằng tất cả lệnh cấm xuất khẩu với hai mô hình này đã được bỏ, sau khi công ty thêm các biện pháp an toàn mới.
Công ty đang làm việc với chính phủ Mỹ để mở rộng quyền dùng Mythos 5 cho nhiều đối tác hơn, cả trong nước và quốc tế, trong chương trình Glasswing. Còn Fable 5 — mô hình dành cho công chúng, có biện pháp an toàn mạnh hơn — sẽ được mở lại từ thứ Tư.
HỢP TÁC VỚI CHÍNH PHỦ MỸ VÀ HƯỚNG TỚI TIÊU CHUẨN CHUNG CỦA NGÀNH
Trong năm nay, quan hệ giữa Anthropic và chính quyền Tổng thống Donald Trump không dễ dàng. Nhưng công ty nói họ đang hợp tác sâu hơn với chính phủ Mỹ, cho một số đối tác chính phủ được quyền dùng sớm cả hai mô hình.
Anthropic cũng đang làm việc với Amazon, Microsoft, Google và các đối tác khác trong chương trình Glasswing. Mục tiêu là cùng nhau đặt ra tiêu chuẩn chung để tìm và sửa các lỗ hổng AI, gọi là "jailbreak" (cách khiến AI bỏ qua luật an toàn). Họ cũng muốn có một hệ thống xếp hạng mức độ nguy hiểm của từng lỗ hổng.
Reuters đã xem một lá thư của Bộ trưởng Thương Mại Mỹ Howard Lutnick gửi cho Anthropic. Lá thư nói Anthropic đã đồng ý làm việc chăm chỉ với chính phủ về các quy tắc an toàn cho Mythos, Fable, và các mô hình sau này. Công ty cũng đồng ý báo cho chính phủ biết nếu phát hiện ai dùng AI với mục đích xấu.
Nhưng ông Lutnick cũng nói rằng bộ này "có quyền xem lại quyết định trong thư này, và có thể yêu cầu giấy phép lại, nếu tình hình thay đổi hoặc nếu Anthropic không giữ đúng cam kết."
NỖ LỰC NGĂN CHẶN CÁC LỖ HỔNG AI (JAILBREAK)
Anthropic nói lệnh cấm xuất khẩu ngày 12 tháng 6 xảy ra sau khi các nhà nghiên cứu của Amazon tìm ra cách vượt qua lớp an toàn của Fable 5. Cách đó khiến mô hình có thể tìm ra lỗ hổng phần mềm, và trong một trường hợp, còn viết ra đoạn mã cho thấy cách khai thác lỗ hổng đó.
Anthropic nói họ đã thêm một biện pháp an toàn mới để chặn hành vi này.
Nếu một yêu cầu bị chặn, nó sẽ được chuyển sang mô hình Opus 4.8 thay thế. Anthropic thừa nhận điều này có thể gây khó chịu cho người dùng, nhưng họ chấp nhận đánh đổi này để có thể mở rộng các khả năng khác của mô hình cho nhiều người dùng hơn.
Anthropic cảnh báo rằng việc làm cho một mô hình AI hoàn toàn không thể bị "jailbreak" là "gần như không thể." Họ cũng lo rằng có thể xuất hiện một kiểu jailbreak "vạn năng" — một cách duy nhất có thể mở khóa "cả một nhóm lớn các hành vi có hại."
Công ty nói: "Sẽ luôn có nhiều jailbreak nhỏ, và một số jailbreak gây hại trong phạm vi hẹp. Tính đến thời điểm này, chưa ai tìm ra jailbreak vạn năng cho Fable 5, nhưng các chuyên gia an toàn vẫn đang liên tục thử tấn công nó để tìm lỗi."
Ông Isaac Harris, giám đốc điều hành của Frontier Security Institute — một tổ chức phi lợi nhuận về AI và an ninh quốc gia — nói rằng giờ đây dường như đã có một quy trình rõ ràng cho tiêu chuẩn của các mô hình AI Mỹ.
Nhưng ông cũng nói thêm: "Vẫn còn một câu hỏi lớn: nếu Trung Quốc tạo ra công nghệ nguy hiểm tương đương nhưng ít luật an toàn hơn, chính quyền Mỹ sẽ xử lý việc đó thế nào trên thị trường Mỹ?"
OPENAI CŨNG BỊ HẠN CHẾ
Việc kiểm soát AI chặt hơn trong tháng này bắt đầu khi Tổng thống Donald Trump ký một sắc lệnh hành pháp. Sắc lệnh này tạo ra một khung quy định tự nguyện, cho phép các công ty AI đưa "các mô hình AI hàng đầu thuộc diện kiểm soát" cho chính phủ Mỹ xem trước, trong tối đa 30 ngày, trước khi đưa cho các đối tác tin cậy khác.
Cũng giống Anthropic, đối thủ OpenAI cũng bị hạn chế. Hôm thứ Sáu, OpenAI nói họ đã hoãn việc ra mắt công khai đầy đủ của mô hình GPT-5.6, theo yêu cầu của chính phủ Mỹ, và chỉ cho một nhóm nhỏ đối tác đã được kiểm tra kỹ được dùng.
Quan hệ giữa Anthropic và chính phủ Mỹ khá căng thẳng. Đầu năm nay, Lầu Năm Góc (Bộ Quốc phòng Mỹ) xếp Anthropic vào nhóm "rủi ro chuỗi cung ứng." Điều này có nghĩa là các nhà thầu quân sự không được dùng AI của Anthropic khi làm việc cho quân đội Mỹ. Lý do là Anthropic từ chối cho phép mô hình của mình được dùng để giám sát hàng loạt người dân trong nước, hoặc dùng trong vũ khí tự động hoàn toàn.
Cả OpenAI và Anthropic đều đã nộp hồ sơ xin phát hành cổ phiếu lần đầu ra công chúng (IPO) tại Mỹ, nhưng hồ sơ này chưa được công bố rộng rãi.
(Bài viết của Chris Thomas, Karen Freifeld, Deepa Seetharaman và Shubham Kalia; đóng góp thêm bởi Alexandra Alper, Costas Pitas, Ismail Shakil và Jaspreet Singh; biên tập bởi Paul Thomasch, Rashmi Aich, Stephen Coates và Edwina Gibbs)
June 30 (Reuters) - Anthropic said on Tuesday that the U.S. Commerce Department lifted export controls on its most advanced Fable and Mythos AI models, less than three weeks after the company was ordered to suspend their access over national security risks.
Washington has stepped up oversight of new model releases to identify potential threats amid concerns that advanced AI models could be misused by military intelligence in China, Russia or other countries of concern.
A June 12 order requiring Anthropic to immediately restrict access for Mythos 5 and Fable 5 to foreign nationals prompted the company to disable both models for all users as there was no way to verify nationality in real time.
Last week, the U.S. government allowed the company to release Mythos 5 but only to some "trusted" U.S. organizations. The model — designed to detect cybersecurity vulnerabilities — had earlier been made available to a broader group of companies as part of its Glasswing project.
Anthropic said on Tuesday that all export controls on the models have now been lifted after the implementation of safeguards.
It is working with the U.S. government to expand access to Mythos 5 to the broader set of domestic and international partners in the Glasswing program, it said in a blog post. Fable 5, which is intended for the general public and has stronger safeguards, will be available from Wednesday.
US GOVERNMENT COLLABORATION AND MOVE TO INDUSTRY STANDARDS
Anthropic, which has had a rocky relationship with U.S. President Donald Trump's administration this year, also said it was deepening its collaboration with the U.S. government, giving designated government partners expanded early access to both its models.
It is also working with Amazon, Microsoft, Google and other Glasswing partners to develop shared common standards to assess and fix potential AI jailbreaks (techniques that bypass safeguards), including a system to rank the severity of such jailbreaks.
A letter to Anthropic from U.S. Commerce Secretary Howard Lutnick that was seen by Reuters said Anthropic had agreed to work diligently with the U.S. government on protocols for Mythos, Fable and future models and to inform the U.S. government of any malicious activity.
Lutnick, however, said that the department "reserves the right to reevaluate the decisions made in this letter and the necessity of reimposing a license requirement, should circumstances change or should Anthropic fail to adhere to its commitments".
EFFORTS TO TACKLE POTENTIAL AI JAILBREAKS
Anthropic said the June 12 export-control order followed Amazon researchers reporting a way to bypass Fable 5's safeguards, allowing the model to identify software vulnerabilities and, in one case, generate code demonstrating how one vulnerability could be exploited.
Anthropic said it has now implemented a new safeguard that blocks the behavior described in the report.
Any blocked request will instead be sent to its Opus 4.8 model, and Anthropic acknowledged that although this would be frustrating for users, the tradeoff was made in the interest of making the model's other capabilities widely available.
Anthropic warned that it was "probably impossible" to make any AI model fully robust to jailbreaks and noted the potential for the development of a universal jailbreak that would be able to unblock "an entire class of harmful behaviors."
"There will be many minor jailbreaks, some narrow harmful ones, and although no universal jailbreaks for Fable 5 have been discovered at the time of writing, expert safety researchers continue to red-team it," the company said.
Isaac Harris, executive director of the Frontier Security Institute, a nonprofit focused on AI and national security, said there now appears to be a process for standards of the U.S. models.
But he added: "There's still a question mark as to how equivalently dangerous capabilities coming from China with less guardrails will be handled by the administration in the U.S. market."
OPENAI HAS ALSO FACED RESTRICTIONS
Increased scrutiny of AI models this month began with U.S. President Donald Trump's signing of an executive order establishing a voluntary framework for AI developers to offer "covered frontier models" to the U.S. government for up to 30 days before releasing them to trusted partners.
Like Anthropic, rival OpenAI has also faced restrictions. It said on Friday that it had delayed a full public launch of GPT-5.6 at the U.S. government's request, limiting its access to a small group of vetted partners.
Anthropic's relationship with the U.S. government has been particularly tense. The Pentagon earlier this year designated the company a "supply-chain risk", preventing contractors from using Anthropic's AI when working for the U.S. military, after the company refused to allow its models to be used for mass domestic surveillance or fully autonomous weapons systems.
Both OpenAI and Anthropic have confidentially filed for U.S. initial public offerings.
(Reporting by Chris Thomas, Karen Freifeld Deepa Seetharaman and Shubham Kalia; Additional reporting by Alexandra Alper, Costas Pitas, Ismail Shakil and Jaspreet Singh; Editing by Paul Thomasch, Rashmi Aich, Stephen Coates and Edwina Gibbs)