WEBSITE ĐANG PHÁT TRIỂN

Mô hình AI DeepSeek V3.2 của Trung Quốc đạt hiệu suất tiên tiến với một phần nhỏ ngân sách tính toán

Mô hình AI DeepSeek V3.2 đạt hiệu suất tương đương GPT-5 và Gemini 3 Pro bằng cách sử dụng ít tài nguyên tính toán hơn. Đột phá mã nguồn mở này thách thức các giả định của ngành.

Mô hình AI DeepSeek V3.2 của Trung Quốc đạt hiệu suất tiên tiến với một phần nhỏ ngân sách tính toán

Trong khi các gã khổng lồ công nghệ đổ hàng tỷ USD vào sức mạnh tính toán để huấn luyện các mô hình AI tiên tiến, DeepSeek của Trung Quốc đã đạt được những kết quả tương đương bằng cách làm việc thông minh hơn, không phải vất vả hơn. Mô hình AI DeepSeek V3.2 sánh ngang với GPT-5 của OpenAI trong các điểm chuẩn suy luận mặc dù sử dụng ‘ít tổng FLOPs huấn luyện hơn’ – một đột phá có thể định hình lại cách ngành công nghiệp suy nghĩ về việc xây dựng trí tuệ nhân tạo tiên tiến.

Đối với các doanh nghiệp, bản phát hành này cho thấy rằng khả năng AI tiên tiến không nhất thiết phải yêu cầu ngân sách tính toán quy mô tiên tiến. Việc DeepSeek V3.2 có sẵn dưới dạng mã nguồn mở cho phép các tổ chức đánh giá khả năng suy luận và tác nhân nâng cao trong khi vẫn duy trì quyền kiểm soát kiến trúc triển khai – một cân nhắc thực tế khi hiệu quả chi phí ngày càng trở nên trọng tâm trong các chiến lược áp dụng AI.

Phòng thí nghiệm có trụ sở tại Hàng Châu đã phát hành hai phiên bản vào thứ Hai: DeepSeek V3.2 cơ bản và DeepSeek-V3.2-Speciale, trong đó phiên bản sau đã đạt hiệu suất huy chương vàng tại Olympic Toán học Quốc tế và Olympic Tin học Quốc tế 2025 – những điểm chuẩn trước đây chỉ đạt được bởi các mô hình nội bộ chưa được phát hành từ các công ty AI hàng đầu của Mỹ.

Thành tựu này đặc biệt đáng chú ý khi DeepSeek bị hạn chế tiếp cận các chip bán dẫn tiên tiến do các hạn chế xuất khẩu.

Hiệu quả tài nguyên như một lợi thế cạnh tranh

Thành tựu của DeepSeek mâu thuẫn với giả định phổ biến trong ngành rằng hiệu suất AI tiên tiến đòi hỏi phải mở rộng đáng kể tài nguyên tính toán. Công ty cho rằng hiệu quả này là nhờ những đổi mới kiến trúc, đặc biệt là DeepSeek Sparse Attention (DSA), giúp giảm đáng kể độ phức tạp tính toán trong khi vẫn duy trì hiệu suất mô hình.

Mô hình AI DeepSeek V3.2 cơ bản đạt độ chính xác 93.1% trong các bài toán toán học AIME 2025 và xếp hạng Codeforces là 2386, đưa nó ngang hàng với GPT-5 trong các điểm chuẩn suy luận.

Phiên bản Speciale thậm chí còn thành công hơn, đạt 96.0% trong kỳ thi Toán học mời Mỹ (AIME) 2025, 99.2% trong Giải đấu Toán học Harvard-MIT (HMMT) tháng 2 năm 2025, và đạt hiệu suất huy chương vàng ở cả Olympic Toán học Quốc tế 2025 và Olympic Tin học Quốc tế.

Các kết quả này đặc biệt quan trọng khi DeepSeek bị hạn chế tiếp cận hàng loạt các loại thuế quan và hạn chế xuất khẩu ảnh hưởng đến Trung Quốc. Báo cáo kỹ thuật tiết lộ rằng công ty đã phân bổ ngân sách tính toán sau huấn luyện vượt quá 10% chi phí huấn luyện trước – một khoản đầu tư đáng kể đã cho phép các khả năng nâng cao thông qua tối ưu hóa học tăng cường thay vì mở rộng quy mô theo cách cưỡng bức.

Đổi mới kỹ thuật thúc đẩy hiệu quả

Cơ chế DSA thể hiện một sự khác biệt so với các kiến trúc attention truyền thống. Thay vì xử lý tất cả các token với cường độ tính toán bằng nhau, DSA sử dụng một “bộ chỉ mục cực nhanh” (lightning indexer) và cơ chế lựa chọn token chi tiết để xác định và xử lý chỉ những thông tin phù hợp nhất cho mỗi truy vấn.

Phương pháp này giảm độ phức tạp của attention từ O(L²) xuống O(Lk), trong đó k đại diện cho số lượng token được chọn – một phần nhỏ so với tổng độ dài chuỗi L. Trong quá trình huấn luyện trước tiếp theo từ điểm kiểm soát DeepSeek-V3.1-Terminus, công ty đã huấn luyện DSA trên 943.7 tỷ token sử dụng 480 chuỗi 128K token cho mỗi bước huấn luyện.

Kiến trúc này cũng giới thiệu quản lý ngữ cảnh được thiết kế riêng cho các kịch bản gọi công cụ. Không giống như các mô hình suy luận trước đây đã loại bỏ nội dung tư duy sau mỗi tin nhắn người dùng, mô hình AI DeepSeek V3.2 giữ lại các dấu vết suy luận khi chỉ các tin nhắn liên quan đến công cụ được thêm vào, cải thiện hiệu quả token trong các quy trình làm việc tác nhân nhiều lượt bằng cách loại bỏ việc suy luận lại thừa thãi.

Ứng dụng doanh nghiệp và hiệu suất thực tế

Đối với các tổ chức đang đánh giá việc triển khai AI, phương pháp của DeepSeek mang lại những lợi thế cụ thể ngoài điểm chuẩn. Trên Terminal Bench 2.0, một công cụ đánh giá khả năng quy trình làm việc viết mã, DeepSeek V3.2 đạt độ chính xác 46.4%.

Mô hình đạt 73.1% trên SWE-Verified, một điểm chuẩn giải quyết vấn đề kỹ thuật phần mềm, và 70.2% trên SWE Multilingual, chứng minh tính hữu ích thực tế trong môi trường phát triển.

Trong các tác vụ tác nhân yêu cầu sử dụng công cụ tự động và suy luận nhiều bước, mô hình cho thấy những cải tiến đáng kể so với các hệ thống mã nguồn mở trước đây. Công ty đã phát triển một quy trình tổng hợp tác vụ tác nhân quy mô lớn, tạo ra hơn 1.800 môi trường riêng biệt và 85.000 lời nhắc phức tạp, giúp mô hình tổng quát hóa các chiến lược suy luận cho các kịch bản sử dụng công cụ không quen thuộc.

DeepSeek đã cung cấp mô hình V3.2 cơ bản dưới dạng mã nguồn mở trên Hugging Face, cho phép các doanh nghiệp triển khai và tùy chỉnh nó mà không phụ thuộc vào nhà cung cấp. Biến thể Speciale vẫn chỉ có thể truy cập thông qua API do yêu cầu sử dụng token cao hơn – một sự đánh đổi giữa hiệu suất tối đa và hiệu quả triển khai.

Hàm ý trong ngành và sự công nhận

Bản phát hành đã tạo ra nhiều cuộc thảo luận đáng kể trong cộng đồng nghiên cứu AI. Susan Zhang, kỹ sư nghiên cứu chính tại Google DeepMind, đã ca ngợi tài liệu kỹ thuật chi tiết của DeepSeek, đặc biệt nhấn mạnh công việc của công ty trong việc ổn định các mô hình sau huấn luyện và nâng cao khả năng tác nhân.

Thời điểm trước Hội nghị về Hệ thống xử lý thông tin thần kinh (NeurIPS) đã khuếch đại sự chú ý. Florian Brand, một chuyên gia về hệ sinh thái AI mã nguồn mở của Trung Quốc tham dự NeurIPS tại San Diego, đã ghi nhận phản ứng tức thì: “Tất cả các nhóm chat hôm nay đều tràn ngập sau thông báo của DeepSeek.”

Những hạn chế được thừa nhận và lộ trình phát triển

Báo cáo kỹ thuật của DeepSeek đề cập đến những khoảng trống hiện tại so với các mô hình tiên tiến. Hiệu quả token vẫn còn là một thách thức – mô hình AI DeepSeek V3.2 thường yêu cầu các quỹ đạo tạo ra dài hơn để phù hợp với chất lượng đầu ra của các hệ thống như Gemini 3 Pro. Công ty cũng thừa nhận rằng phạm vi kiến thức thế giới còn thua kém các mô hình độc quyền hàng đầu do tổng lượng tính toán huấn luyện thấp hơn.

Các ưu tiên phát triển trong tương lai bao gồm mở rộng tài nguyên tính toán huấn luyện trước để mở rộng kiến thức thế giới, tối ưu hóa hiệu quả chuỗi suy luận để cải thiện việc sử dụng token và tinh chỉnh kiến trúc nền tảng cho các tác vụ giải quyết vấn đề phức tạp.

Xem thêm: Thực tế kinh doanh AI – những gì các nhà lãnh đạo doanh nghiệp cần biết

Bạn muốn tìm hiểu thêm về AI và dữ liệu lớn từ các nhà lãnh đạo ngành? Hãy ghé thăm AI & Big Data Expo diễn ra tại Amsterdam, California và London. Sự kiện toàn diện này là một phần của TechEx và được tổ chức cùng với các sự kiện công nghệ hàng đầu khác, nhấp vào đây để biết thêm thông tin.

AI News được cung cấp bởi TechForge Media. Khám phá các sự kiện công nghệ doanh nghiệp và hội thảo trực tuyến sắp tới khác tại đây.

"

Bài viết liên quan

Xem thêm
Tin tức AI

Google I/O 2026: Gemini 3.5, kính AI thông minh và kỷ nguyên agent – điều gì thay đổi với bạn?

Google vừa kết thúc sự kiện I/O 2026 với hàng loạt công bố lớn: Gemini 3.5 và Gemini Omni (tạo video từ bất kỳ đầu vào nào), Gemini Spark (agent AI cá nhân chạy nền 24/7), kính thông minh Android XR hợp tác với Warby Parker và Gentle Monster, cùng Android 17 với widget tạo bằng AI. Hầu hết tính năng mới đã có sẵn hôm nay trên Android, iOS và web.

Tin tức AI

Google AI Pro vs Ultra 2026: gói nào đáng tiền cho người Việt?

Google vừa sắp xếp lại gói AI sau I/O 2026 với 3 tier: AI Free (miễn phí), AI Pro ($19,99/tháng ≈ 510.000 VNĐ), và AI Ultra ($99,99–$249,99/tháng ≈ 2,5–6,4 triệu VNĐ). Bài này phân tích từng gói bằng số liệu cụ thể để bạn biết: mình thuộc nhóm nào, nên mua gì, và quan trọng nhất – liệu Ultra có đáng gấp 12 lần Pro?

Tin tức AI

Android 17: 5 tính năng AI đáng chú ý nhất – điện thoại của bạn sắp thông minh hơn nhiều

Google vừa giới thiệu Android 17 – bản cập nhật AI lớn nhất cho Android trong nhiều năm. 5 tính năng nổi bật: Create My Widget (tự tạo widget bằng AI), Rambler (gõ văn bản bằng giọng nói tự nhiên), Pause Point (chống doom scrolling), Intelligent Autofill (tự điền form thông minh), và Gemini Intelligence (Gemini tích hợp sâu vào hệ thống). Beta đã có sẵn cho Pixel và một số máy partner.