Theo một phân tích mới của Epoch AI – tổ chức nghiên cứu trí tuệ nhân tạo phi lợi nhuận – những mô hình AI tư duy (reasoning AI) có thể không còn đạt được những bước tiến lớn về hiệu suất trong tương lai gần. Cụ thể, báo cáo cho rằng ngay trong vòng một năm tới, đà phát triển vượt trội của các mô hình dạng này có thể bắt đầu chậm lại.
Trong thời gian gần đây, các mô hình như OpenAI o3 đã mang lại những bước tiến đáng kể trong các bài đánh giá về khả năng giải toán và lập trình, nhờ khả năng áp dụng nhiều tài nguyên tính toán hơn để giải quyết các vấn đề phức tạp. Tuy nhiên, đổi lại, các mô hình này mất nhiều thời gian hơn để hoàn thành nhiệm vụ so với các mô hình thông thường.
Quá trình phát triển mô hình AI tư duy thường bắt đầu bằng việc huấn luyện một mô hình thông thường với lượng dữ liệu khổng lồ. Sau đó, mô hình sẽ được cải thiện thêm thông qua kỹ thuật reinforcement learning (học tăng cường) – một phương pháp cung cấp phản hồi cho mô hình để giúp nó giải bài toán khó hiệu quả hơn.
Cho đến nay, các phòng thí nghiệm tiên phong như OpenAI chưa đầu tư quá nhiều tài nguyên tính toán vào giai đoạn học tăng cường, nhưng điều này đang thay đổi. OpenAI tiết lộ rằng họ đã sử dụng gấp 10 lần sức mạnh tính toán để huấn luyện o3 so với phiên bản tiền nhiệm o1, và phần lớn tài nguyên đó được cho là dành cho học tăng cường.
Thậm chí, theo nhà nghiên cứu Dan Roberts từ OpenAI, trong tương lai, công ty sẽ ưu tiên đẩy mạnh học tăng cường hơn cả huấn luyện ban đầu – một bước đi cho thấy sự tin tưởng vào tiềm năng của phương pháp này.
Tuy nhiên, theo Epoch, vẫn có giới hạn nhất định về mức độ tài nguyên có thể áp dụng cho học tăng cường. Josh You – tác giả báo cáo – cho biết hiệu suất từ huấn luyện mô hình thông thường hiện đang tăng gấp 4 lần mỗi năm, trong khi hiệu suất từ học tăng cường lại tăng gấp 10 lần chỉ sau mỗi 3–5 tháng. Dù vậy, tốc độ tăng trưởng này có thể sẽ hội tụ và chậm lại vào khoảng năm 2026.
Ngoài ra, Epoch cũng cảnh báo rằng chi phí nghiên cứu và vận hành cao có thể trở thành rào cản. Nếu những chi phí này không giảm, thì khả năng mở rộng các mô hình tư duy sẽ gặp nhiều thách thức – không chỉ do giới hạn tính toán mà còn vì tính khả thi về kinh tế.
Thêm vào đó, dù đạt được nhiều thành tựu, các mô hình tư duy như o3 vẫn chưa hoàn hảo – chúng tốn kém để vận hành và có xu hướng tạo ra các câu trả lời sai lệch (hallucinate) nhiều hơn một số mô hình AI truyền thống.
Thông tin rằng các mô hình AI tư duy có thể chạm trần phát triển chắc chắn sẽ khiến nhiều doanh nghiệp trong ngành lo lắng, nhất là khi họ đã đổ lượng vốn đầu tư khổng lồ vào lĩnh vực này.