Mô hình toán học của DeepSeek thách thức cả OpenAI và Google

DeepSeek vừa gây tiếng vang toàn cầu khi giới thiệu DeepSeekMath-V2 – mô hình AI có khả năng tạo và tự kiểm chứng lời giải toán học. Thành tích của mô hình vượt chuẩn vàng tại các kỳ thi danh giá, mở ra cuộc cạnh tranh minh bạch hiếm hoi giữa những phòng thí nghiệm AI lớn nhất thế giới.

DeepSeek, DeepSeekMath-V2, mô hình AI giải toán, kỷ lục DeepSeek, AI Trung Quốc, IMO 2025, Putnam, cạnh tranh AI

Sự xuất hiện của DeepSeekMath-V2 đã tạo nên một bước ngoặt trong lĩnh vực mô hình ngôn ngữ chuyên về toán học. Trong bối cảnh năng lực suy luận vẫn là thách thức với phần lớn hệ thống AI hiện nay, DeepSeek trở thành cái tên gây bất ngờ khi tuyên bố mô hình mới của họ có thể đạt kết quả tương đương huy chương vàng tại Olympic Toán quốc tế (IMO) 2025 và CMO 2024, hai kỳ thi vốn được xem là thước đo cao nhất dành cho những tài năng toán học trẻ.

Điểm đặc biệt khiến cộng đồng nghiên cứu chú ý nằm ở hiệu suất gần như hoàn hảo của mô hình: 118/120 điểm tại kỳ thi Putnam – mức điểm chưa từng có đối với hệ thống AI, thậm chí vượt qua cả thành tích tốt nhất từng được ghi nhận của con người. Thành công này cho thấy DeepSeek không chỉ đuổi kịp mà còn sẵn sàng cạnh tranh trực diện với các mô hình của OpenAI và Google DeepMind, vốn vẫn được xem là những chuẩn mực hàng đầu của ngành.

Theo tài liệu công bố, DeepSeekMath-V2 giải quyết điểm yếu tồn tại lâu nay ở các mô hình AI giải toán: khả năng đưa ra đáp án đúng nhưng thiếu lập luận hợp lệ. Nhóm nghiên cứu xây dựng một cơ chế nhiều tầng cho phép mô hình tự đánh giá, phản biện và tinh chỉnh lời giải theo thời gian thực. Nói cách khác, đây là hệ thống có khả năng tự phê bình, tự điều chỉnh và tự xác nhận mức độ chính xác của kết quả mà không cần dựa vào công cụ ngoài như trình biên dịch mã hay phần mềm toán học.

Tính minh bạch của DeepSeekMath-V2 cũng gây ấn tượng không kém. Khi nhiều hãng công nghệ lớn chọn cách âm thầm phát triển các mô hình chưa công bố, DeepSeek lại chủ động công khai phương pháp, dữ liệu huấn luyện và cấu trúc kỹ thuật. Việc công bố đầy đủ không chỉ giúp mô hình dễ được kiểm chứng trong cộng đồng khoa học mà còn tạo áp lực cạnh tranh lên thị trường Mỹ – nơi nhiều phòng thí nghiệm vẫn giữ bí mật về năng lực thực tế của sản phẩm.

DeepSeek, DeepSeekMath-V2, mô hình AI giải toán, kỷ lục DeepSeek, AI Trung Quốc, IMO 2025, Putnam, cạnh tranh AI

Bối cảnh cạnh tranh càng nóng hơn khi ngay trước đó, OpenAI và Google DeepMind đều chia sẻ rằng các mô hình toán học thế hệ mới của họ đã đạt mức huy chương vàng IMO. Tuy nhiên, sự thiếu vắng thông tin chi tiết khiến những tuyên bố này chỉ dừng lại ở mức gợi mở. DeepSeek, bằng cách triển khai chiến lược công khai, đã khiến cuộc đua trở nên minh bạch hơn và buộc các đối thủ phải cởi mở hơn trong thời gian tới.

Theo The Economist, sự vươn lên của DeepSeek còn tạo ra tác động rộng hơn với hệ sinh thái AI. Một số startup Mỹ đã bắt đầu cân nhắc chuyển sang sử dụng mô hình nguồn mở có chi phí thấp của Trung Quốc để giảm gánh nặng vận hành. Điều này cho thấy sức ảnh hưởng của DeepSeek không chỉ nằm ở thành tích mà còn ở cách họ định hình lại thị trường toàn cầu.

DeepSeekMath-V2 vì vậy không đơn thuần là một mô hình giải toán xuất sắc, mà còn là minh chứng cho sự dịch chuyển quyền lực trong ngành AI – nơi tốc độ đổi mới và sự minh bạch trở thành yếu tố quyết định trong cuộc cạnh tranh giữa những người khổng lồ công nghệ.