Nâng cấp lớn mới nhất trong lĩnh vực AI tạo sinh này vừa được triển khai cho ứng dụng Gemini của Google. Bản cập nhật này có tên mã nội bộ là Nano Banana trong giai đoạn thử nghiệm, nhưng được chính thức gọi là Gemini 2.5 Flash Image.
Bên cạnh những cải tiến chung, phiên bản này thực sự vượt trội trong lĩnh vực chỉnh sửa hình ảnh – nơi AI tạo sinh từng gặp nhiều khó khăn. Trước đây, các chỉnh sửa thường không nhất quán, thay đổi nhầm bộ phận của bức ảnh hoặc không tuân thủ chính xác hướng dẫn.
Google cho biết: "Bản cập nhật này cho phép người dùng kết hợp nhiều hình ảnh thành một, duy trì tính nhất quán của nhân vật để kể chuyện phong phú hơn, thực hiện các chuyển đổi mục tiêu bằng ngôn ngữ tự nhiên, và sử dụng kiến thức toàn cầu của Gemini để tạo và chỉnh sửa hình ảnh."
Với Gemini 2.5 Flash Image, người dùng có thể thực hiện các thay đổi một cách chi tiết và chính xác hơn, gần như có thể truy cập ngay lập tức vào một chuyên gia Photoshop. Để bắt đầu, người dùng chỉ cần nhấp vào biểu tượng thanh trượt công cụ trong hộp nhập liệu trên ứng dụng Gemini nền web, sau đó chọn "Tạo hình ảnh" và nhấp vào nút dấu cộng (+) để chọn hình ảnh nguồn.
Như thường lệ, bất kỳ nội dung nào bạn nhập vào Gemini đều có thể được sử dụng để đào tạo thêm mô hình AI của Google và đôi khi có thể được xem xét bởi đội ngũ đánh giá viên là con người. Do đó, người dùng nên tránh chia sẻ bất kỳ thông tin nhạy cảm hoặc bí mật nào. Để ngăn chặn việc này, bạn có thể hướng dẫn Google không lưu bất kỳ cuộc trò chuyện hay hình ảnh nào trong Gemini bằng cách nhấp vào "Hoạt động" trong ngăn điều hướng bên trái.
Một trong những ứng dụng nổi bật của bản cập nhật này là khả năng chỉnh sửa chính xác các chi tiết nhỏ trong ảnh. Đôi khi, người dùng chỉ muốn thay đổi một phần cụ thể: chẳng hạn như đổi màu một chiếc ô tô từ đỏ sang xanh, xóa một chiếc đèn khỏi khung hình, hoặc thêm một vật thể vào cảnh. Gemini mang lại kết quả nhanh chóng và hiệu quả mà không cần đến một trình chỉnh sửa ảnh phức tạp. Ví dụ, nếu bạn có một bức ảnh chân dung nhưng chưa hài lòng về trang phục, bạn có thể dùng lệnh như "đổi màu áo len thành đỏ" hoặc "cho anh ấy mái tóc vàng xoăn" và Gemini sẽ đưa ra kết quả. Mặc dù AI không phải lúc nào cũng hoàn hảo, nhưng phần lớn thời gian, nó thực hiện yêu cầu chỉnh sửa trong khi vẫn giữ nguyên các chi tiết còn lại của bức ảnh. Người dùng có thể thử lại với một câu lệnh khác chính xác hơn nếu kết quả ban đầu chưa ưng ý.
Khả năng kết hợp và thao tác hình ảnh một cách nhất quán cũng là điểm mạnh của Gemini 2.5 Flash Image. Mô hình này xuất sắc trong việc lấy một hoặc nhiều hình ảnh và chuyển đổi chúng theo nhiều cách. Nếu bạn có một bức ảnh tự chụp, bạn có thể đặt mình vào một địa điểm hoàn toàn mới hoặc mặc một bộ trang phục khác (hoặc cả hai), và AI sẽ đủ thông minh để đảm bảo bức ảnh vẫn giữ được nét tương đồng với bạn. Người dùng có thể tải ảnh chân dung lên và yêu cầu Gemini thay đổi phông nền phía sau, hoặc điều chỉnh thời gian trong ngày hay thời tiết mà không làm bức ảnh trông như được tạo ra hoàn toàn từ AI. Việc kết hợp nhiều hình ảnh cũng hoạt động rất hiệu quả; chỉ cần chọn hai hoặc nhiều ảnh khi nhấp vào nút dấu cộng. Ví dụ, bạn có thể tải ảnh của mình và ảnh một bộ trang phục trên mạng để yêu cầu Gemini ghép bạn vào bộ đồ đó. Mặc dù việc kết hợp ảnh có thể đòi hỏi sự thử nghiệm và tinh chỉnh câu lệnh, nhưng Gemini sẽ cố gắng giữ tính nhất quán của các vật thể xuyên suốt nhiều hình ảnh.
Khi đã tự tin hơn với khả năng của Gemini, người dùng có thể thực hiện các yêu cầu tham vọng hơn. Một trong những tác vụ phổ biến nhất trong chỉnh sửa ảnh là xóa vật thể khỏi cảnh, chẳng hạn như xóa một người lạ vô tình lọt vào ảnh selfie, hoặc một vật dụng lộn xộn trong phòng. Chỉ cần mô tả chính xác vật thể cần xóa, như "xóa người bên phải và điền vào nền" hoặc "xóa chiếc áo len đỏ dưới sàn". Miễn là hình ảnh cung cấp đủ thông tin để Gemini lấp đầy khoảng trống, chỉnh sửa sẽ được thực hiện thành công. Tất nhiên, Gemini vẫn có thể tạo ra người hoặc vật thể từ AI, nhưng người dùng không cần phải tạo ra toàn bộ bức ảnh từ đầu mà chỉ cần thêm vào những gì đã có. Ví dụ, bạn có thể yêu cầu "đặt một chiếc ghế sofa màu kem dọc theo bức tường phía sau" hoặc "thêm một chiếc xe buýt màu vàng đang chạy qua ở hậu cảnh". Tính năng này phụ thuộc nhiều hơn vào dữ liệu đào tạo của AI, vì vậy có thể cần nhiều lần thử để đạt được kết quả mong muốn, nhưng người dùng luôn có thể yêu cầu chỉnh sửa bổ sung hoặc quay lại ảnh gốc để bắt đầu lại.