Không thể nói về tạo ảnh AI mà không nhắc đến các mô hình nano banana của Google, và có lý do chính đáng. Hai phiên bản, bản gốc (Gemini 2.5 Flash Image) và bản pro mới (Gemini 3 Pro Image), mới ra mắt vài tháng nhưng đã nhanh chóng định nghĩa lại những gì có thể thực hiện được với việc tạo và chỉnh sửa ảnh AI.

Phiên bản pro sử dụng mô hình suy luận của Gemini 3 để tạo ra kết quả. Điều đó có nghĩa là thời gian tạo ảnh sẽ lâu hơn một chút, nhưng các hình ảnh chi tiết hơn. Bạn cũng có thể thêm các đoạn văn bản dễ đọc vào ảnh của mình, một điều chưa từng có trong ngành. Phiên bản pro là công cụ tạo ảnh AI tốt nhất mà CNET từng thử nghiệm, không nghi ngờ gì. Nhưng điều đó không hẳn là một điều tốt.

Thử nghiệm của chúng tôi đã tiết lộ việc dễ dàng tạo ra hình ảnh siêu thực và đồ họa thông tin với thông tin sai lệch. Các hình ảnh do Gemini tạo ra thiếu đi nhiều lỗi phổ biến nhất trong ảnh được tạo bằng AI, điều này tốt cho người sáng tạo. Tuy nhiên, nó cũng có nghĩa là bất kỳ ai bắt gặp các hình ảnh do Gemini tạo ra trực tuyến sẽ khó khăn hơn khi phân biệt liệu chúng là thật hay do AI tạo ra. Google gỡ bỏ hình mờ hình ngôi sao khỏi một số hình ảnh, điều này không hữu ích. Mặc dù SynthID hoặc hình mờ vô hình của Google được nhúng vào tất cả các hình ảnh được tạo bằng AI, nhưng công nghệ phát hiện trong Gemini còn quá hạn chế để tạo ra sự khác biệt. Đây không phải là vấn đề mới, nhưng khả năng của nano banana pro khiến chúng trở nên phổ biến hơn và khó giải quyết hơn.
Dù bạn sử dụng nano banana thông qua Gemini hay tận dụng nhiều cài đặt hơn trong AI Studio hoặc Flow của Google, việc sử dụng mô hình này để sáng tạo đều dễ dàng. Dưới đây là mọi điều bạn cần biết về nano banana pro dựa trên thử nghiệm của chúng tôi. Để biết thêm, hãy xem các công cụ tạo ảnh AI tốt nhất và những điều cần thiết về AI của chúng tôi.

Nano banana pro vượt trội về tính chân thực và chi tiết tinh xảo, như trong hình ảnh một bông hoa diên vĩ này. Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Chất lượng hình ảnh như thế nào, và chúng khớp với các gợi ý (prompts) đến mức nào?
Nano banana pro tạo ra một số hình ảnh AI ấn tượng nhất mà tôi từng thấy. Ngay cả sau khi sự hào hứng ban đầu lắng xuống sau 
trải nghiệm thực tế đầu tiên của mình, tôi vẫn liên tục kinh ngạc trước nano banana pro trong suốt quá trình thử nghiệm chuyên sâu. Với nhiều hình ảnh tôi đã tạo, tôi sẽ không thể ngay lập tức nhận ra liệu chúng là thật hay được tạo bằng AI -- một suy nghĩ kinh hoàng đến sửng sốt. Khi tôi đung đưa giữa việc bị ấn tượng và lo lắng, một sự thật vẫn còn đó: Nano banana pro xóa nhòa ranh giới giữa thực tế và AI. Và đây là phiên bản tệ nhất mà mô hình này từng có.

Hãy xem bề mặt da của người phụ nữ do AI tạo ra này chi tiết đến mức nào. Không có vẻ ngoài "nhựa", kém chất lượng do AI tạo ra ở đây. Mức độ chân thực và chi tiết này không thể sánh bằng các chương trình AI khác. Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Các hình ảnh nano banana pro được tạo trong Gemini tự động được tạo ra dưới dạng hình ảnh ngang tỷ lệ 16:9; bạn sẽ cần sử dụng AI Studio hoặc Flow để thay đổi tỷ lệ khung hình hoặc bất kỳ cài đặt tùy chỉnh nào khác. Gemini rất giỏi trong việc tuân thủ các gợi ý của bạn, nghĩa là nó sẽ cung cấp cho bạn những gì bạn yêu cầu. Bạn có thể xem hướng dẫn của chúng tôi về cách viết gợi ý tạo ảnh AI tốt nhất, hoặc nếu bạn không có nhiều thời gian, bạn có thể yêu cầu Gemini cải thiện gợi ý của mình.
Nano banana pro vượt trội về tính chân thực. Tôi đã yêu cầu một hình ảnh hiển thị tỷ số trận đấu mà UNC-Chapel Hill thắng Duke University. Gemini đã sử dụng bố cục đồ họa của ESPN để thể hiện tỷ số cuối cùng và thêm logo của ESPN, ACC cùng các trường đại học. Văn bản dễ đọc và các sắc thái màu xanh lam mang tính biểu tượng là hoàn hảo, và thậm chí còn thêm một phản chiếu trên màn hình TV để hiển thị một ngọn đèn chiếu sáng cảnh. Chính những chi tiết nhỏ này làm cho hình ảnh nano banana pro thực sự phi thường.

Hãy chú ý đến mức độ chính xác của các logo, màu sắc và văn bản trong hình ảnh này. Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Có một số giới hạn đối với những gì Gemini có thể tạo ra. Ví dụ, Gemini không gặp vấn đề gì khi tạo một hình ảnh dựa trên bài hát Mr. Brightside của The Killers, nhưng khi tôi yêu cầu một hình ảnh tương tự lấy cảm hứng từ một bài hát của Taylor Swift, nó đã từ chối tạo, nói rằng nó không có quyền truy cập vào nội dung đó. Không cần bận tâm rằng Google Search chắc chắn có vô số nội dung về Swift; Google có thể đang cố gắng tránh mọi cáo buộc vi phạm bản quyền.

Gemini chưa bao giờ hét Mr. Brightside của The Killers tại một bữa tiệc ở nhà, nhưng nó biết tôi đang nhắc đến lời bài hát nào khi tôi yêu cầu nó minh họa "điệp khúc kinh điển." Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Bước tiến lớn nhất là khả năng tạo văn bản dễ đọc của nano banana pro. Các mô hình sáng tạo AI từ lâu đã gặp khó khăn với điều này -- chúng ta từng có thể chỉ ra văn bản bị biến dạng như những dấu hiệu rõ ràng cho thấy một bức ảnh hoặc video được tạo bằng AI. Nhưng nano banana pro là một trong những mô hình có năng lực nhất mà tôi từng thử nghiệm, và nó dễ dàng xử lý việc tích hợp văn bản rõ ràng vào hình ảnh. Nó tốt đến đáng sợ.
Mặc dù phần lớn các đồ họa tôi tạo bằng Gemini gần như hoàn hảo, tôi vẫn nhận thấy một vài lỗi. Một số lỗi nhỏ đến mức bạn sẽ không nhận ra ngay lập tức, như với thiết kế Fourth Wing này. Nếu bạn phóng to rất kỹ, có một từ vô nghĩa phía trên "Fourth." Những ảo giác như thế này thật khó chịu, nhưng có một vấn đề lớn hơn khi mô hình bắt đầu tự tạo ra thông tin.

Gemini đã xác định đúng các motip trong tiểu thuyết Fourth Wing của Rebecca Yarros. Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Tôi đã yêu cầu Gemini tạo một loạt đồ họa thông tin về iPhone 17 mới, và các chuyên gia di động của CNET đã phát hiện ra vấn đề ngay lập tức. Gemini không thể phân biệt giữa các tính năng của các mẫu cơ bản và pro, thường xuyên trộn lẫn chúng. AI không thể hiển thị đúng mặt lưng của bất kỳ chiếc iPhone 17 nào; Patrick Holland của CNET nói rằng một hình ảnh thực sự trông giống một bản phác thảo trước đó về những gì mọi người nghi ngờ iPhone mới có thể trông giống dựa trên Google Pixel, đó là lý do tại sao phiên bản AI trông giống một chiếc Pixel được sơn màu cam với logo của Apple được thêm vào. Tôi đã yêu cầu Gemini giới hạn thông tin của nó vào trang so sánh thông số kỹ thuật của CNET, và nó vẫn tạo ra một hình ảnh đầy thông tin sai lệch.

Có rất nhiều thông tin sai trong đồ họa do AI tạo ra này về iPhone 17 Pro. Thứ nhất, đó không hề giống hình dáng của điện thoại. Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Ngoài những vấn đề tức thời, vấn đề cấp bách hơn là hình ảnh trông có vẻ thuyết phục đến mức nào. Nếu bạn không có kiến thức sâu về chủ đề mà bạn yêu cầu Gemini hình dung, bạn có thể không nhận thấy khi AI bắt đầu bịa đặt thông tin. Đây là một trong những vấn đề phổ biến và đáng lo ngại nhất với chatbot, và nó có khả năng tiếp diễn khi việc tạo ảnh AI dựa vào cơ sở kiến thức của chatbot. Các bản cập nhật mô hình trong tương lai có thể giúp ích, nhưng hiện tại, bạn cần theo dõi sát sao thông tin mà Gemini đưa vào hình ảnh của mình.
Chỉnh sửa ảnh với nano banana pro
Phàn nàn lớn nhất của tôi về mô hình nano banana gốc là khả năng chỉnh sửa ảnh của nó, vốn không hoạt động như mong đợi. Tôi hài lòng, và hơi lo lắng, khi báo cáo rằng mô hình pro khắc phục hầu hết các lỗi này.
Nano banana pro rất giỏi trong việc thay đổi phong cảnh nền của ảnh. Tôi đã tải lên một bức ảnh gia đình chúng tôi chụp trước khi tham dự một trận bóng đá đầy tuyết tại trường đại học của chị gái tôi vào năm ngoái. Trời lạnh đến mức chúng tôi không thể chụp thêm một bức ảnh gia đình nào nữa vào ngày hôm đó, nhưng Gemini đã có thể khắc phục điều đó.

Tôi đã yêu cầu Gemini thêm các biển hiệu Appalachian State ở phía sau, và nó đã giả định chính xác rằng điều đó có nghĩa là chúng tôi sẽ ở Sân vận động Kidd Brewer. Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Kết quả từ phiên bản pro thật tuyệt vời -- sân vận động là một bản sao chính xác, các biển hiệu rõ ràng sắc nét và tuyết trông rất tự nhiên. Tôi đã đánh lừa một số thành viên trong gia đình bằng hình ảnh đó vào Lễ Tạ Ơn. Tôi đã đưa cùng một gợi ý cho mô hình gốc, và không nghi ngờ gì hình ảnh của phiên bản pro tốt hơn.

Tôi đã thử đạt được kết quả tương tự bằng cách tải lên nhiều hình ảnh tham chiếu của gia đình mình và yêu cầu Gemini kết hợp chúng, nhưng kết quả không tốt bằng -- biểu cảm khuôn mặt trông "nhựa" như AI, các biển hiệu ở hậu cảnh không rõ ràng bằng, v.v. Để có được kết quả tốt nhất với nhiều hình ảnh tham chiếu, việc sử dụng hình ảnh chất lượng cao với nền đơn giản sẽ hữu ích, điều mà tôi không có.
Tôi cũng yêu cầu Gemini điều chỉnh ánh sáng cho ảnh chân dung của mình. Tôi yêu cầu nền màu xanh lá cây đậm và một đèn sân khấu chiếu vào mặt. Bạn có thể thấy mô hình gốc đã làm biến dạng phần mặt bị che khuất và đèn sân khấu đã bỏ lỡ hầu hết khuôn mặt tôi như thế nào. Mô hình pro đã sử dụng ánh sáng tự nhiên hơn nhiều và chiếu sáng khuôn mặt tôi một cách chính xác.

Ảnh chân dung được tạo bởi mô hình nano banana gốc (trái) không chi tiết hoặc được chiếu sáng tốt bằng ảnh được tạo bởi mô hình pro (phải). Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Một chỉnh sửa khiến tôi hơi "phát điên" (xin lỗi, không thể cưỡng lại được) với mô hình gốc là cố gắng loại bỏ các phản chiếu. Phải thừa nhận rằng, loại bỏ phản chiếu là một chỉnh sửa ảnh khó. Mô hình pro đã vượt trội so với bản gốc ở chỗ nó thực sự loại bỏ phản chiếu, nhưng nó vẫn làm ảnh hưởng đến các chi tiết tinh xảo và làm biến dạng khuôn mặt. Xin lỗi, Lindsay Lohan và Jamie Lee Curtis. Có lẽ nano banana tiếp theo cuối cùng sẽ vượt qua bài kiểm tra này?

Bức ảnh gốc (trái) có một phản chiếu lớn. Mô hình nano banana gốc không thể loại bỏ nó và làm biến dạng hình ảnh (giữa), trong khi mô hình pro đã loại bỏ được nhưng cũng làm biến dạng các chi tiết tinh xảo (phải). Được tạo bởi Katelyn Chedraoui bằng Gemini AI
Chỉnh sửa ảnh với nano banana pro của Gemini chắc chắn tốt hơn so với mô hình gốc. Quy trình đối thoại rất tuyệt vời cho những người thích trò chuyện để chỉnh sửa. Nhưng việc thiếu hoàn toàn các công cụ chỉnh sửa có nghĩa là nó không phù hợp cho những người muốn có bất kỳ mức độ kiểm soát trực tiếp nào. Ngay cả mô hình pro cũng chỉ có thể xử lý các chỉnh sửa lớn hơn, và quá nhiều chỉnh sửa lặp đi lặp lại sẽ làm giảm chất lượng hình ảnh. Nếu bạn muốn kiểm soát chi tiết hơn, bạn nên đến Photoshop hoặc Canva và sử dụng AI cùng các công cụ của họ. Đây là một lĩnh vực mà Google rõ ràng không phải là một công ty phần mềm sáng tạo.
Mô hình gốc của Google so với bản pro
Nano banana pro là mô hình tốt nhất, nhưng có những lúc bạn có thể không muốn sử dụng nó. Mô hình gốc nhanh hơn nhiều so với bản pro, và nó có thể xử lý tốt mọi loại tạo ảnh AI hàng loạt hoặc theo yêu cầu. Mô hình pro nên là lựa chọn ưu tiên cho người dùng cần chỉnh sửa ảnh chuyên sâu hơn và những người cần dựa vào kiến thức thế giới của Gemini để tạo đồ họa thông tin.

Dưới đây là bảng phân tích đầy đủ hơn về mô hình nano banana gốc so với mô hình pro mới.
Nano banana so với Nano banana pro
| Nano banana gốc | Nano banana pro | |
| Giá | Miễn phí, có tùy chọn nâng cấp | Miễn phí, có tùy chọn nâng cấp |
| Tốc độ | 30 giây trở xuống | 50-120 giây |
| Cách tìm | Mô hình nhanh trong Gemini | Sử dụng mô hình Pro 3 trong Gemini |
| Sáng tạo | Có, rất sáng tạo | Có, cực kỳ sáng tạo, hơn mô hình gốc |
| Khả năng tạo văn bản? | Không | Có, nhưng cần chú ý đến tính xác thực của đồ họa thông tin |
| Ai nên sử dụng? | Người dùng Gemini muốn tạo ảnh nhanh | Bất kỳ ai muốn tạo ảnh chất lượng cao, chỉnh sửa ảnh |
Hình ảnh được tạo ra nhanh đến mức nào?
Nano banana pro sử dụng một mô hình suy luận, thường mất một chút thời gian hơn để chạy. Tôi nhận thấy rằng các hình ảnh của mình được tạo ra trong khoảng từ 50 đến 120 giây. Hai phút có thể được coi là lâu đối với các mô hình hình ảnh khác, nhưng không phải là không hợp lý. Nếu bạn muốn kết quả nhanh hơn, hãy chuyển sang mô hình nhanh để sử dụng mô hình nano banana gốc.
Những suy nghĩ cuối cùng
Nano banana pro thật đáng kinh ngạc. Một số kết quả thật tuyệt vời -- chúng được neo vào thực tế theo cách mà các đối thủ như Midjourney và OpenAI rõ ràng không làm được. Đó là lý do tại sao tôi nói rằng Nano banana pro là một trong những công cụ tạo ảnh AI tốt nhất mà CNET từng thử nghiệm. Nó cũng là một công cụ đáng sợ sâu sắc: Các kết quả tốt đến đáng sợ, và nó có khả năng tạo ra gần như bất cứ thứ gì một cách đáng lo ngại. Và đáng sợ nhất là, chỉ vì nó có thể tạo ra văn bản rõ ràng trong hình ảnh không có nghĩa là nó có thể tạo ra các nguồn thông tin đáng tin cậy. Nó là tất cả những phần tốt nhất của các công cụ tạo ảnh và những phần tồi tệ nhất của chatbot.
Mô hình pro là một công cụ mạnh mẽ, đến mức tôi dự đoán nó sẽ nhanh chóng trở thành lựa chọn hàng đầu cho bất kỳ ai quan tâm đến việc tạo phương tiện truyền thông bằng AI. Các nhà sáng tạo ở mọi cấp độ kỹ năng có thể sẽ tìm thấy công dụng cho nó. Nhưng tôi lo ngại rằng nó cũng sẽ trở thành công cụ đắc lực cho những kẻ xấu có thể lợi dụng quy trình nhanh chóng và dễ dàng của nó để tạo ra những kết quả có hại, những kết quả mà chúng ta sẽ không thể ngay lập tức xác định là do AI tạo ra. Chúng ta đã thấy cách các hàng rào bảo vệ của các công ty AI có thể thất bại.

Khi những hình ảnh như những hình ảnh được tạo bằng nano banana pro trông thuyết phục, chúng ta sẽ không tự động nghi ngờ về nguồn gốc của chúng. Đó là một vấn đề, đặc biệt với các thiết kế chứa nhiều thông tin như đồ họa thông tin. Việc Gemini có thể tạo văn bản dễ đọc không có ý nghĩa gì nếu thông tin sai. Và khi chúng ta lướt qua các nguồn cấp dữ liệu mạng xã hội của mình một cách lơ đãng, chúng ta không phải lúc nào cũng kiểm tra kỹ các bài đăng chúng ta thấy hoặc đọc kỹ chi tiết để xem liệu các tiêu đề có đúng không. Điều này tạo tiền đề cho rất nhiều sự nhầm lẫn, hỗn loạn và thông tin sai lệch.
Tóm lại, nano banana pro là tương lai của phương tiện truyền thông tạo sinh. Nhưng tương lai đó có thể đầy cạm bẫy nếu chúng ta không cẩn thận.
CNET thử nghiệm các công cụ tạo ảnh AI như thế nào
CNET có cách tiếp cận thực tế để đánh giá các công cụ tạo ảnh AI. Mục tiêu của chúng tôi là xác định mức độ tốt của nó so với đối thủ cạnh tranh và mục đích nào nó phục vụ tốt nhất. Để làm điều đó, chúng tôi đưa ra các gợi ý AI dựa trên các trường hợp sử dụng trong thế giới thực, chẳng hạn như kết xuất theo một phong cách cụ thể, kết hợp các yếu tố vào một hình ảnh duy nhất và xử lý các mô tả dài hơn. Chúng tôi chấm điểm các công cụ tạo ảnh trên thang điểm 10, có tính đến các yếu tố như mức độ phù hợp của hình ảnh với gợi ý, sự sáng tạo của kết quả và tốc độ phản hồi. Xem cách chúng tôi thử nghiệm AI để biết thêm.
Giá, khả dụng và quyền riêng tư của Nano banana pro
Bạn có thể sử dụng nano banana pro miễn phí trong ứng dụng và trình duyệt web Gemini, nhưng bạn sẽ muốn nâng cấp lên một trong các gói đăng ký AI của Google để có giới hạn sử dụng cao hơn. Các gói đó bắt đầu từ 20 đô la mỗi tháng và đi kèm với nhiều dịch vụ khác, như dung lượng lưu trữ Google lớn hơn. Nếu bạn là người đăng ký Gemini trả phí, tôi thực sự khuyên bạn nên sử dụng nano banana pro trong AI Studio hoặc Flow của Google để bạn có thể tận dụng các điều khiển trực tiếp để tùy chỉnh hình ảnh của mình.
Chính sách quyền riêng tư chung của Gemini của Google nói rằng nó có thể sử dụng bất kỳ thông tin nào bạn cung cấp, như hình ảnh tham chiếu, để cải thiện sản phẩm AI của mình. Đó là lý do tại sao công ty khuyến nghị bạn tránh tải lên thông tin nhạy cảm hoặc riêng tư. Giống như tất cả các công ty AI lớn, Google có chính sách sử dụng bị cấm
nhằm ngăn chặn việc tạo ra tài liệu bất hợp pháp và lạm dụng.
Để biết thêm, hãy xem các cách được chuyên gia hỗ trợ để khắc phục ảo giác hình ảnh AI và các công cụ tạo video AI Sora của OpenAI so với Veo 3 của Google.
"