WEBSITE ĐANG PHÁT TRIỂN

Tencent ra mắt bốn mẫu Hunyuan mã nguồn mở nhỏ gọn với các tham số 0.5B, 1.8B, 4B và 7B

Tencent đã công khai mã nguồn mô hình AI Hunyuan của mình, phát hành bốn mô hình ngôn ngữ nhỏ gọn với các tham số 0.5 tỷ, 1.8 tỷ, 4 tỷ và 7 tỷ, có thể chạy trên một GPU tiêu dùng duy nhất.

<p>Tencent ra mắt bốn mẫu Hunyuan mã nguồn mở nhỏ gọn với các tham số 0.5B, 1.8B, 4B và 7B</p>

Tencent đã mở mã nguồn mô hình AI Hunyuan của mình, phát hành bốn mô hình ngôn ngữ mã nguồn mở nhỏ gọn (Nguồn ảnh: Tencent)

Tencent đã công khai mã nguồn mô hình AI Hunyuan của mình, phát hành bốn mô hình ngôn ngữ nhỏ gọn với các tham số 0.5 tỷ, 1.8 tỷ, 4 tỷ và 7 tỷ, có thể chạy trên một GPU tiêu dùng duy nhất.

Tencent đã phát hành một bộ mô hình Hunyuan nhỏ gọn mới: 0.5 tỷ, 1.8 tỷ, 4 tỷ và 7 tỷ tham số; chúng hướng tới các triển khai năng lượng thấp và biên. Cả bốn cấu hình hiện đã có sẵn trên GitHub và Hugging Face, và mỗi cấu hình đều có thể chạy suy luận trên một card đồ họa tiêu dùng duy nhất, khiến chúng phù hợp cho máy tính xách tay, điện thoại thông minh, hệ thống khoang lái thông minh và các phần cứng bị hạn chế tài nguyên khác.

Mặc dù kích thước nhỏ, các mô hình này vẫn đạt được điểm số hàng đầu trong khả năng hiểu ngôn ngữ, toán học và lập luận trên nhiều điểm chuẩn công khai. Tencent cho rằng những kết quả này là nhờ kiến trúc "lập luận kết hợp" cho phép người dùng lựa chọn giữa chế độ suy nghĩ nhanh để có câu trả lời súc tích và chế độ suy nghĩ chậm để lập luận đa bước chi tiết hơn.

Một tính năng kỹ thuật quan trọng là cửa sổ ngữ cảnh 256K token gốc, đủ để nạp khoảng 500.000 từ tiếng Anh trong một lần. Tencent nhấn mạnh các ứng dụng nội bộ như Tencent Meeting và WeChat Reading, nơi các mô hình có thể phân tích toàn bộ bản ghi cuộc họp hoặc một cuốn sách đầy đủ ngay lập tức, duy trì mối quan hệ nhân vật và chi tiết cốt truyện cho các truy vấn tiếp theo.

Bốn LLM nhỏ gọn này tích hợp với các framework suy luận chính thống, bao gồm SGLang, vLLM và TensorRT-LLM, đồng thời hỗ trợ nhiều định dạng lượng tử hóa. Sự chứng thực ban đầu từ Arm, Qualcomm, Intel và MediaTek cho thấy các gói triển khai được tối ưu hóa cho bộ xử lý khách hàng tương ứng của họ sẽ sớm ra mắt.

Các trường hợp sử dụng ban đầu nhấn mạnh trọng tâm thực tế của bản phát hành. Tencent Mobile Manager báo cáo khả năng chặn thư rác ở cấp độ mili giây mà không cần chuyển dữ liệu ra ngoài thiết bị. Đồng thời, một lược đồ hai mô hình trong trợ lý khoang lái thông minh của Tencent cân bằng mức tiêu thụ điện năng trên bo mạch với độ sâu hội thoại. Tencent lập luận rằng những ví dụ này chứng minh rằng các mô hình nhỏ có thể mang lại khả năng tác nhân cấp doanh nghiệp khi được thiết kế một cách chu đáo.


Bài viết liên quan

Xem thêm
Tin tức AI

Google I/O 2026: Gemini 3.5, kính AI thông minh và kỷ nguyên agent – điều gì thay đổi với bạn?

Google vừa kết thúc sự kiện I/O 2026 với hàng loạt công bố lớn: Gemini 3.5 và Gemini Omni (tạo video từ bất kỳ đầu vào nào), Gemini Spark (agent AI cá nhân chạy nền 24/7), kính thông minh Android XR hợp tác với Warby Parker và Gentle Monster, cùng Android 17 với widget tạo bằng AI. Hầu hết tính năng mới đã có sẵn hôm nay trên Android, iOS và web.

Tin tức AI

Google AI Pro vs Ultra 2026: gói nào đáng tiền cho người Việt?

Google vừa sắp xếp lại gói AI sau I/O 2026 với 3 tier: AI Free (miễn phí), AI Pro ($19,99/tháng ≈ 510.000 VNĐ), và AI Ultra ($99,99–$249,99/tháng ≈ 2,5–6,4 triệu VNĐ). Bài này phân tích từng gói bằng số liệu cụ thể để bạn biết: mình thuộc nhóm nào, nên mua gì, và quan trọng nhất – liệu Ultra có đáng gấp 12 lần Pro?

Tin tức AI

Android 17: 5 tính năng AI đáng chú ý nhất – điện thoại của bạn sắp thông minh hơn nhiều

Google vừa giới thiệu Android 17 – bản cập nhật AI lớn nhất cho Android trong nhiều năm. 5 tính năng nổi bật: Create My Widget (tự tạo widget bằng AI), Rambler (gõ văn bản bằng giọng nói tự nhiên), Pause Point (chống doom scrolling), Intelligent Autofill (tự điền form thông minh), và Gemini Intelligence (Gemini tích hợp sâu vào hệ thống). Beta đã có sẵn cho Pixel và một số máy partner.