Trong một thử nghiệm độc đáo, Đại học Carnegie Mellon đã dựng nên mô hình "TheAgentCompany" – một công ty phần mềm hoàn toàn do các tác nhân AI (AI agents) vận hành. Từ phòng nhân sự cho đến bộ phận kỹ thuật, mọi "nhân viên" ở đây đều là sản phẩm của các nền tảng AI đình đám như Google, OpenAI, Anthropic và Meta.
Ý tưởng của thí nghiệm này nhằm kiểm chứng liệu một môi trường làm việc chỉ toàn trí tuệ nhân tạo có thể hoạt động suôn sẻ như một công ty thật sự. Các AI được giao đảm nhiệm đủ vai trò, từ phân tích tài chính, phát triển phần mềm đến quản lý dự án, với mục tiêu thực hiện các nhiệm vụ mô phỏng công việc thường ngày như điều hướng thư mục, tham quan văn phòng ảo, hay viết đánh giá hiệu suất nhân sự.
Tuy nhiên, kết quả lại khá ảm đạm. Theo Business Insider, ngay cả mô hình Claude 3.5 Sonnet – một trong những AI tiên tiến nhất hiện nay của Anthropic – cũng chỉ hoàn thành được 24% số nhiệm vụ, với chi phí thực hiện mỗi nhiệm vụ lên tới hơn 6 USD và trung bình cần tới gần 30 bước thao tác.
Trong khi đó, Gemini 2.0 Flash của Google cũng không khá hơn, chỉ đạt tỉ lệ thành công 11,4%, còn Nova Pro v1 của Amazon xếp cuối với vỏn vẹn 1,7% nhiệm vụ hoàn tất. Không chỉ chậm chạp, các AI này còn thể hiện sự thiếu hụt nghiêm trọng về khả năng điều hướng thông tin, kỹ năng xã hội và tư duy phản biện – những điều tối quan trọng trong môi trường làm việc thực tế.
Một hiện tượng đáng chú ý khác là "ảo tưởng giải pháp" – khi AI tự dựng ra những lối tắt dễ dàng hơn nhưng lại khiến nhiệm vụ thất bại. Ví dụ, thay vì tìm đúng người cần liên hệ trong phòng chat, AI đã tự ý gán nhãn sai đối tượng để "vượt qua" yêu cầu.
Những kết quả trên một lần nữa cho thấy trí tuệ nhân tạo hiện tại còn rất xa mới đủ sức thay thế con người, đặc biệt trong những môi trường yêu cầu tương tác linh hoạt và khả năng thích ứng cao. Dù nhiều lãnh đạo công nghệ như Jensen Huang (Nvidia) hay Sam Altman (OpenAI) từng kỳ vọng AI sớm tham gia vào lực lượng lao động trong năm nay, các nghiên cứu như của Harvard Business School hay Langchain lại chỉ ra những rào cản lớn, từ việc AI khó thích ứng với môi trường biến động đến sự hạn chế trong việc sử dụng công cụ hỗ trợ.
Dẫu vậy, nhóm nghiên cứu tại Carnegie Mellon cũng lưu ý rằng AI có thể đóng vai trò trợ thủ đắc lực cho con người trong những công việc nhỏ lẻ hoặc quy trình đơn giản. Thay vì thay thế hoàn toàn, AI đang mở ra cơ hội hỗ trợ, tối ưu hóa hiệu quả làm việc hằng ngày – một viễn cảnh thực tế và khả thi hơn nhiều.