Chỉ vài ngày sau khi xuất hiện, Qwen3 đã khiến cộng đồng AI sửng sốt khi âm thầm vượt mặt DeepSeek-R1 – cái tên từng được xem là chuẩn mực của mô hình mã nguồn mở – trong loạt bài kiểm tra toàn diện của LiveBench. Đây là hệ thống đánh giá độc lập chuyên chấm điểm các mô hình ngôn ngữ lớn dựa trên khả năng lập trình, xử lý toán học, phân tích dữ liệu và hiểu ngôn ngữ tự nhiên.
Với tổng cộng 235 tỷ tham số, Qwen3 không chỉ gây ấn tượng bởi quy mô, mà còn bởi thiết kế "lai" đặc biệt. Thay vì chọn giữa phản hồi nhanh hay suy luận sâu – hai khía cạnh vốn luôn đối lập – Qwen3 có thể linh hoạt chuyển đổi giữa chúng theo từng nhiệm vụ cụ thể. Điều này cho phép người dùng kiểm soát chi phí tính toán mà vẫn tối ưu hiệu suất khi cần.
Theo công bố từ Alibaba, Qwen3 là kết quả của quá trình huấn luyện trên khối lượng dữ liệu đồ sộ: khoảng 36.000 tỷ token được lấy từ sách, mã nguồn, hội thoại và nội dung do AI tạo ra. Hỗ trợ tới 119 ngôn ngữ, mô hình này được kỳ vọng sẽ đáp ứng được các nhu cầu từ thị trường nội địa Trung Quốc đến quốc tế.
Một điểm đáng chú ý là Qwen3 tiếp tục khai thác kiến trúc “mixture of experts” – một hướng đi Alibaba chia sẻ chung với DeepSeek. Đây là phương pháp phân luồng tác vụ cho từng nhóm chuyên biệt trong hệ thống, giúp giảm thiểu chi phí mà không ảnh hưởng tới chất lượng đầu ra. Với triết lý này, Qwen3 tạo ra một thế cân bằng giữa độ chính xác và tốc độ phản hồi – hai yếu tố thường khó dung hòa.
Tuy Qwen3 hiện đang dẫn đầu bảng xếp hạng các mô hình mã nguồn mở, khoảng cách giữa nó với các đối thủ ở nhóm “nguồn đóng” như OpenAI hay Google vẫn còn. LiveBench cho thấy các mô hình như o3, Gemini Pro 2.5 hay Claude 3.7 vẫn đang bỏ xa phần còn lại ở nhiều hạng mục đánh giá tổng hợp.
Tuy nhiên, đây mới chỉ là điểm khởi đầu cho tham vọng của Alibaba. Qwen3 không đơn thuần là một mô hình ngôn ngữ – nó là lời khẳng định về khả năng tự chủ công nghệ của Trung Quốc trong lĩnh vực trí tuệ nhân tạo. Với giấy phép mở sắp công bố trên GitHub và Hugging Face, Alibaba không chỉ cung cấp công cụ cho cộng đồng toàn cầu mà còn từng bước định hình lại cuộc chơi của AI thế giới.
Giới phân tích nhận định, nếu Qwen3 tiếp tục được cập nhật mạnh mẽ và ứng dụng rộng rãi, Alibaba hoàn toàn có thể tạo ra một hệ sinh thái AI “không phụ thuộc” phương Tây – một nước cờ mà không chỉ mang giá trị công nghệ, mà còn là chiến lược dài hạn về chủ quyền dữ liệu và sức mạnh AI.