Theo Fan, điểm đáng chú ý ở DeepSeek không chỉ nằm ở sự sáng tạo vượt bậc mà còn ở khả năng phát triển với chi phí khiêm tốn so với các gã khổng lồ công nghệ như Meta hay OpenAI. Cách tiếp cận đổi mới này cho thấy, đôi khi, những hạn chế về nguồn lực lại trở thành động lực mạnh mẽ để thúc đẩy đột phá.
Trong lĩnh vực trí tuệ nhân tạo, các mô hình ngôn ngữ lớn (LLM) như ChatGPT được xây dựng trên hàng tỷ tham số, cho phép chúng học hỏi và xử lý các dữ liệu phức tạp, từ đó dự đoán và tạo ra các kết quả chính xác. Thông thường, để đạt hiệu suất cao, các mô hình này cần được huấn luyện trên lượng lớn tài nguyên tính toán, điều này thường đi kèm chi phí khổng lồ.
Thế nhưng, DeepSeek V3, mô hình LLM mới nhất của startup này, đã khiến giới công nghệ ngạc nhiên. Với 671 tỷ tham số, DeepSeek V3 được huấn luyện chỉ trong hai tháng, với tổng chi phí khoảng 5,58 triệu USD – con số khiêm tốn so với các đối thủ. Ví dụ, Meta cần đến 30,8 triệu giờ GPU để huấn luyện Llama 3.1, trong khi DeepSeek chỉ cần 2,78 triệu giờ GPU nhờ vào một kiến trúc tối ưu.
DeepSeek đã vượt qua những rào cản lớn, bao gồm cả lệnh trừng phạt từ Mỹ, để sử dụng GPU H800 – dòng chip Nvidia thiết kế riêng cho thị trường Trung Quốc. Sự hiệu quả này là minh chứng rõ ràng cho khả năng sáng tạo và thích nghi vượt trội của công ty.
DeepSeek không chỉ là một startup thông thường. Thành lập năm 2023, công ty xuất thân từ quỹ đầu cơ High Flyer Quant, và người sáng lập Liang Wenfeng, từng học AI tại Đại học Chiết Giang, đã mua sẵn hơn 10.000 GPU trước khi Mỹ áp đặt lệnh cấm xuất khẩu chip AI. Sự chuẩn bị này đã giúp DeepSeek có nền tảng vững chắc để bước vào cuộc chơi AI toàn cầu.
Một điều thú vị khác là đội ngũ nhân sự của DeepSeek phần lớn là những gương mặt trẻ. Họ là sinh viên mới ra trường hoặc những tài năng trẻ đam mê AI, phù hợp với triết lý "ưu tiên năng lực hơn kinh nghiệm" mà công ty đặt ra.
Tuy nhiên, DeepSeek V3 không tránh khỏi tranh cãi. Có nhiều trường hợp mô hình này nhận nhầm mình là ChatGPT – chatbot nổi tiếng của OpenAI. Sự việc này, theo các chuyên gia, có thể do quá trình đào tạo sử dụng phản hồi từ mô hình đối thủ, một hành động vi phạm đạo đức và tiềm ẩn rủi ro về pháp lý.
Dù vấp phải một số chỉ trích, không thể phủ nhận rằng DeepSeek đang đặt ra áp lực lớn cho các công ty AI lớn. Các mô hình mã nguồn mở của họ đang buộc thị trường AI phải tăng tốc trong cuộc đua phát triển.
Nhà khoa học Andrej Karpathy, đồng sáng lập OpenAI, từng nhận xét: "DeepSeek V3 là minh chứng rõ ràng rằng những hạn chế về tài nguyên không phải rào cản, mà là cơ hội để đổi mới." Điều này đồng nghĩa với việc, tương lai của AI có thể được định hình bởi những cái tên mới nổi, như DeepSeek, hơn là chỉ những gã khổng lồ công nghệ.
Tuy nhiên, việc phát triển AI không chỉ dừng lại ở khả năng kỹ thuật. Những vấn đề như đạo đức, sử dụng dữ liệu minh bạch, và quản lý quyền riêng tư sẽ là thách thức lớn. Nếu vượt qua được những rào cản này, DeepSeek hoàn toàn có thể thay đổi cục diện của lĩnh vực AI toàn cầu.
Liệu DeepSeek có thực sự trở thành "ngựa ô" của năm 2025? Tương lai sẽ trả lời câu hỏi này. Nhưng hiện tại, startup này đang cho thấy rằng sự sáng tạo và nỗ lực không ngừng chính là yếu tố quan trọng để vượt qua mọi rào cản.