Tin tặc sử dụng Claude AI để khai thác lỗ hổng và đánh cắp dữ liệu nhạy cảm của nhiều cơ quan chính phủ

Một hacker đã lợi dụng chatbot Claude của Anthropic trong chiến dịch kéo dài hơn một tháng từ cuối năm 2025, để dò tìm lỗ hổng, tạo mã khai thác và đánh cắp dữ liệu nhạy cảm từ nhiều cơ quan chính phủ Mexico. 

Theo điều tra, hacker sử dụng các prompt bằng tiếng Tây Ban Nha, yêu cầu Claude nhập vai một “hacker chuyên nghiệp” đang tham gia chương trình bug bounty giả lập. Ban đầu Claude từ chối vì vi phạm chính sách an toàn, nhưng sau nhiều lần thuyết phục và điều chỉnh ngữ cảnh, hệ thống đã tạo ra hàng nghìn báo cáo chi tiết kèm script thực thi để quét lỗ hổng, khai thác hệ thống và tự động hóa thu thập dữ liệu. Khi gặp giới hạn, attacker chuyển sang dùng ChatGPT để xây dựng chiến thuật di chuyển ngang trong mạng và né tránh phát hiện.

Phân tích log cho thấy AI đã cung cấp kế hoạch tấn công từng bước, giúp một cá nhân đơn lẻ thực hiện chiến dịch có độ phức tạp tương đương nhóm APT mà không cần hạ tầng chuyên sâu.

Chiến dịch khai thác ít nhất 20 lỗ hổng trong hệ thống liên bang và cấp bang, thu thập khoảng 150GB dữ liệu bao gồm hồ sơ thuế, dữ liệu cử tri và thông tin đăng nhập. Sau sự việc, Anthropic đã khóa các tài khoản liên quan và tăng cường cơ chế giám sát lạm dụng trong phiên bản Claude Opus 4.6. OpenAI cho biết ChatGPT đã từ chối các prompt vi phạm chính sách. Phản ứng từ phía Mexico còn khác nhau giữa các cơ quan, và Gambit nhận định chưa có bằng chứng cho thấy liên quan tới một quốc gia bảo trợ, mà nhiều khả năng là hành động của một cá nhân chưa xác định danh tính.

Theo Cyber Security News