OpenAI chính thức công bố GPT-OSS – một bước đi lịch sử trong chiến lược của công ty. Đây là lần đầu tiên kể từ năm 2018, OpenAI phát hành một mô hình AI có trọng số mở, cho phép cộng đồng tải về, tùy chỉnh và triển khai trực tiếp trên các thiết bị phổ thông như laptop hay GPU cá nhân.
GPT-OSS gồm hai phiên bản: bản lớn với 120 tỷ tham số (tương đương o4-mini), có thể chạy trên một GPU Nvidia duy nhất, và bản nhỏ 20 tỷ tham số, yêu cầu 16 GB RAM – phù hợp với các máy cấu hình tầm trung. Cả hai đang được phát hành trên các nền tảng phổ biến như Hugging Face, Azure, AWS và Databricks dưới giấy phép Apache 2.0 – một dạng mã nguồn mở cho phép thương mại hóa.
Đây là động thái mang tính đột phá, nhất là khi trước đó CEO Sam Altman từng nhiều lần tỏ rõ lập trường không công bố trọng số vì lo ngại an toàn. Tuy nhiên, sự lớn mạnh của các đối thủ như LLaMA, Gemma hay DeepSeek đã khiến OpenAI phải thay đổi tư duy, đặc biệt trong bối cảnh nhu cầu kiểm soát dữ liệu và tùy biến mô hình ngày càng cao.
Theo Chris Cook – nhà nghiên cứu tại OpenAI, GPT-OSS vẫn có khả năng xử lý tốt các tác vụ phức tạp như viết mã, phân tích logic, truy cập web và tương tác qua API. Mặc dù không tiết lộ điểm số chi tiết, OpenAI cho biết GPT-OSS đạt hiệu suất ngang với một số mô hình thương mại trong các bài test phổ biến như HumanEval.
Về mặt an toàn, công ty khẳng định đây là mô hình mở được kiểm tra nghiêm ngặt nhất từ trước đến nay, với sự tham gia của các tổ chức đánh giá độc lập. Các cơ chế suy luận, phản hồi và xử lý lệnh được hiển thị công khai, giúp dễ dàng phát hiện và ngăn chặn hành vi bất thường hoặc vi phạm đạo đức.
Greg Brockman – đồng sáng lập OpenAI chia sẻ: “Đây là thành quả của nhiều tháng làm việc cật lực. Chúng tôi rất tự hào vì điều này”.
Dù chưa tiết lộ thời điểm ra mắt các phiên bản nâng cấp của GPT-OSS, OpenAI cho biết họ đặt kỳ vọng lớn vào khả năng hỗ trợ các nhà phát triển nhỏ, startup hoặc doanh nghiệp muốn giữ quyền kiểm soát dữ liệu riêng. Đây có thể là một bước ngoặt lớn, mở ra thời kỳ phổ cập trí tuệ nhân tạo thật sự rộng rãi, nơi người dùng không còn phụ thuộc vào hạ tầng đám mây hay các mô hình thương mại đắt đỏ.