Post #2858620 - 09/12/2025 20:30:49

Họ giữ AI không hủy diệt thế giới: đội An toàn xã hội của Anthropic

Những người đứng sau bức tường chắn rủi ro: nhóm chuyên trách kiểm soát tác động xã hội của AI đang làm công việc bất kỳ ai cũng biết là cần nhưng ít người nhìn thấy.

Họ giữ AI không hủy diệt thế giới: đội An toàn xã hội của Anthropic

Trong bối cảnh các mô hình ngôn ngữ lớn như Claude, GPT và các hệ thống tổng quát khác ngày càng mạnh, một bộ phận nhân viên tại các công ty AI chuyển trọng tâm từ phát triển tính năng sang ngăn chặn hậu quả bất lợi. Họ không chỉ là kỹ sư hay nhà nghiên cứu: họ là đội chuyên trách phân tích tác động xã hội, kiểm thử “đỏ” (red te...