Cơn sốt token và áp lực vô hình trong ngành công nghệ
Một tuần làm việc bình thường giờ đây có thể đồng nghĩa với hàng trăm tỷ token được xử lý. Tại OpenAI, có kỹ sư tiêu thụ tới 210 tỷ token chỉ trong 7 ngày, một con số đủ để “viết lại” toàn bộ Wikipedia hàng chục lần. Trong khi đó, tại Anthropic, một người dùng cá nhân có thể chi hơn 150.000 USD mỗi tháng chỉ để vận hành các tác nhân AI.

Những con số tưởng như phi lý này lại đang dần trở thành tiêu chuẩn mới. Không còn là ngoại lệ, việc tiêu thụ token ở quy mô lớn đang trở thành dấu hiệu của “hiệu suất cao” trong mắt nhiều doanh nghiệp công nghệ. Một số công ty thậm chí còn theo dõi chi tiết lượng token từng nhân viên sử dụng mỗi tuần, biến nó thành một dạng KPI ngầm.
Điều đáng nói là áp lực này không đến từ mệnh lệnh trực tiếp, mà đến từ nỗi sợ bị tụt lại phía sau. Khi AI có thể làm việc liên tục 24/7, con người cũng buộc phải tìm cách “bắt kịp”, kể cả khi điều đó đồng nghĩa với việc tiêu tốn tài nguyên khổng lồ.
Tokenmaxxing: Khi sử dụng AI trở thành cuộc đua hơn thua
Khái niệm tokenmaxxing ra đời trong bối cảnh đó. Đây là thuật ngữ chỉ việc tối đa hóa lượng token sử dụng, bất kể đầu ra có thực sự tốt hay không. Nói cách khác, nhiều người đang tối ưu cho việc “dùng nhiều AI nhất có thể”, thay vì “dùng AI hiệu quả nhất”.
Theo Gergely Orosz, việc không sử dụng AI với tốc độ cao giờ đây có thể trở thành rủi ro nghề nghiệp. Nhận định này phản ánh một thực tế đáng lo ngại: tốc độ đang được ưu tiên hơn chất lượng. Một lập trình viên có thể tạo ra hàng triệu dòng code thông qua AI, nhưng điều đó không đồng nghĩa với việc sản phẩm tốt hơn.
Sự thay đổi này đến từ chính bản chất của các công cụ AI hiện đại. Các hệ thống lập trình tự động có thể chạy liên tục, tự chia nhỏ nhiệm vụ, tạo ra hàng loạt tác nhân con để xử lý công việc song song. Chỉ trong vài giờ, chúng có thể tạo ra lượng nội dung mà trước đây con người phải mất nhiều tháng mới hoàn thành.
Nhưng chính khả năng này cũng tạo ra một nghịch lý. Khi mọi thứ trở nên quá dễ dàng, việc lạm dụng trở nên gần như không thể tránh khỏi.
Cuộc đua hiệu suất hay ảo giác năng suất?
Các công ty AI rõ ràng đang hưởng lợi từ xu hướng này. Lượng token tiêu thụ tăng mạnh đồng nghĩa với doanh thu tăng trưởng nhanh chóng. Google từng công bố hệ thống của họ xử lý hơn 1,3 triệu tỷ token mỗi tháng, một con số khổng lồ phản ánh quy mô của thị trường.

Tuy nhiên, phía sau những con số ấn tượng đó là nhiều nghi ngại. Không ít kỹ sư thừa nhận rằng việc tiêu thụ hàng triệu token mỗi tuần không đảm bảo chất lượng đầu ra. Một số người thậm chí cảm thấy họ đang “đốt tiền” chỉ để chứng minh rằng mình đang theo kịp xu hướng.
Câu chuyện của một kỹ sư tại Stockholm là ví dụ điển hình. Anh thừa nhận chi phí sử dụng AI của mình có thể còn cao hơn cả mức lương nhận được. Đây không còn là bài toán hiệu suất, mà đã trở thành bài toán tâm lý. Khi tất cả đều chạy, việc đứng yên gần như là không thể.
Khi AI trở thành “bảo hiểm nghề nghiệp”
Trong bối cảnh ngành công nghệ thay đổi chóng mặt, việc sử dụng AI không chỉ là công cụ, mà còn là một dạng “bảo hiểm nghề nghiệp”. Với nhiều lập trình viên, việc chứng minh mình có thể khai thác AI hiệu quả là cách để giữ vị trí trong tổ chức.
Nikunj Kothari gọi đây là “nỗi lo lắng về token”. Theo ông, câu hỏi trong các cuộc trò chuyện công nghệ đã thay đổi. Thay vì hỏi bạn đang xây dựng gì, người ta bắt đầu hỏi bạn đang vận hành bao nhiêu tác nhân AI.
Sự thay đổi này phản ánh một thực tế sâu sắc hơn. Giá trị của một cá nhân không còn chỉ nằm ở kỹ năng trực tiếp, mà nằm ở khả năng “khuếch đại” bản thân thông qua AI. Người nào kiểm soát được nhiều tác nhân hơn, người đó có lợi thế lớn hơn.
Tương lai: Năng suất thực hay bong bóng công nghệ?
Không thể phủ nhận rằng AI đang mở ra một kỷ nguyên mới về năng suất. Những kỹ sư biết tận dụng công nghệ này có thể làm việc nhanh hơn gấp nhiều lần so với trước đây. Nhưng câu hỏi lớn vẫn còn đó: liệu đây có phải là năng suất thực sự?
Việc đo lường hiệu suất bằng token không khác gì việc từng đo năng suất lập trình bằng số dòng code hay số lần commit. Những chỉ số này dễ đo, nhưng không phản ánh đúng giá trị thực. Một đoạn code ngắn gọn, tối ưu vẫn có thể tốt hơn hàng nghìn dòng code do AI tạo ra.
Trong dài hạn, thị trường sẽ tự điều chỉnh. Những ai chỉ chạy theo số lượng sẽ sớm bị đào thải, trong khi những người biết kết hợp giữa AI và tư duy con người sẽ tạo ra lợi thế bền vững hơn.
Kỷ nguyên AI không chỉ thay đổi cách chúng ta làm việc, mà còn thay đổi cách chúng ta được đánh giá. Token, từ một đơn vị kỹ thuật, đang trở thành “chỉ số sinh tồn” trong ngành công nghệ.
Nhưng cũng giống như mọi cuộc đua khác, người chiến thắng không phải là người chạy nhanh nhất, mà là người hiểu rõ mình đang chạy vì điều gì. Trong một thế giới nơi AI có thể làm gần như mọi thứ, giá trị thực sự của con người có lẽ nằm ở việc biết khi nào nên dùng AI và khi nào không.