Được giới thiệu ngày 14/11, Ascent GX10 là một trong những máy tính vận hành và huấn luyện mô hình ngôn ngữ lớn (LLM) trong xu hướng "đưa siêu máy tính lên bàn làm việc". Sản phẩm có trọng lượng 1,48 kg cùng kích thước 150 x 150 x 51 mm, có thể cầm bằng một tay hoặc đặt gọn trong balo để mang đi xa.
Được giới thiệu ngày 14/11, Ascent GX10 là một trong những máy tính vận hành và huấn luyện mô hình ngôn ngữ lớn (LLM) trong xu hướng "đưa siêu máy tính lên bàn làm việc". Sản phẩm có trọng lượng 1,48 kg cùng kích thước 150 x 150 x 51 mm, có thể cầm bằng một tay hoặc đặt gọn trong balo để mang đi xa.
So với Mac Mini M2 2023 (trái), Ascent GX10 nhỏ hơn, khá tương đồng với mẫu DGX Spark của Nvidia dùng cho việc huấn luyện AI với trọng lượng 1,2 kg và kích cỡ 150 x 150 x 50,5 mm.
GX10 sử dụng khung nhôm ở toàn bộ thân máy giúp tản nhiệt tốt hơn. Do được thiết kế để vận hành liên tục, sản phẩm có hệ thống tản nhiệt quạt kép và 7 cấp độ kiểm soát nhiệt độ thông qua phần mềm. Trải nghiệm cho thấy khi vận hành với công suất tối đa, nhiệt độ tỏa ra không quá nóng, khoảng 50-60 độ C.
So với Mac Mini M2 2023 (trái), Ascent GX10 nhỏ hơn, khá tương đồng với mẫu DGX Spark của Nvidia dùng cho việc huấn luyện AI với trọng lượng 1,2 kg và kích cỡ 150 x 150 x 50,5 mm.
GX10 sử dụng khung nhôm ở toàn bộ thân máy giúp tản nhiệt tốt hơn. Do được thiết kế để vận hành liên tục, sản phẩm có hệ thống tản nhiệt quạt kép và 7 cấp độ kiểm soát nhiệt độ thông qua phần mềm. Trải nghiệm cho thấy khi vận hành với công suất tối đa, nhiệt độ tỏa ra không quá nóng, khoảng 50-60 độ C.
Hệ thống tản nhiệt hút gió từ đáy và thổi gió ra phía sau. Theo nhà sản xuất, thiết kế này được đánh giá đạt hiệu quả tản nhiệt cao gấp 1,6 lần so với các hệ thống nhỏ gọn tương đương, giữ nhiệt độ ổn định dưới tải nặng đến 170 W.
Mặt sau được trang bị hàng loạt cổng kết nối, gồm bốn cổng USB4 Type-C (20 Gb/giây, hỗ trợ DisplayPort 2.1 và PD 180 W), HDMI 2.1, LAN 10 GbE và đặc biệt là cổng ConnectX CX-7 SmartNIC 200 Gb/giây (2xQSFP), chủ yếu để kết nối với GX10 thứ hai. Máy cũng hỗ trợ Wi-Fi 7 và Bluetooth 5.3.
Hệ thống tản nhiệt hút gió từ đáy và thổi gió ra phía sau. Theo nhà sản xuất, thiết kế này được đánh giá đạt hiệu quả tản nhiệt cao gấp 1,6 lần so với các hệ thống nhỏ gọn tương đương, giữ nhiệt độ ổn định dưới tải nặng đến 170 W.
Mặt sau được trang bị hàng loạt cổng kết nối, gồm bốn cổng USB4 Type-C (20 Gb/giây, hỗ trợ DisplayPort 2.1 và PD 180 W), HDMI 2.1, LAN 10 GbE và đặc biệt là cổng ConnectX CX-7 SmartNIC 200 Gb/giây (2xQSFP), chủ yếu để kết nối với GX10 thứ hai. Máy cũng hỗ trợ Wi-Fi 7 và Bluetooth 5.3.
Ascent GX10 trang bị chip xử lý AI chuyên dụng Nvidia GB10 Grace Blackwell Superchip tương tự mẫu Nvidia DGX Spark, với lõi Tensor Cores thế hệ thứ năm, được tối ưu hóa để xử lý các nhiệm vụ AI như nhận dạng ảnh, xử lý ngôn ngữ tự nhiên và dự đoán dữ liệu. Chip kết hợp CPU ARM Neoverse V2 chứa 20 lõi hiệu năng cao giúp tăng cường xử lý và sắp xếp dữ liệu, tăng tốc độ tinh chỉnh mô hình và suy luận theo thời gian thực. Công nghệ NVLink C2C cung cấp mô hình bộ nhớ CPU và GPU đồng nhất với băng thông gấp năm lần PCIe 5.0.
Máy có hai phiên bản bộ nhớ trong: 1 TB và 4 TB SSD NVMe, có khả năng mã hóa tự động nhưng không hỗ trợ nâng cấp. Bộ nhớ RAM đạt 128 GB chuẩn LPDDR5X, hỗ trợ Error-Correcting Code (ECC) để phát hiện và sửa lỗi dữ liệu, cũng như có thể truy cập chung cho CPU và GPU với băng thông 272 Gb/giây. Dù vậy, băng thông bộ nhớ LPDDR5x thấp hơn GPU HBM, qua đó khiến hiệu năng huấn luyện mô hình lớn bị giới hạn. Do đó, đây không phải lựa chọn thay thế cho cụm GPU chuyên dụng trong các trung tâm dữ liệu, mà chỉ phù hợp với tác vụ nghiên cứu hoặc tinh chỉnh quy mô nhỏ.
Ascent GX10 trang bị chip xử lý AI chuyên dụng Nvidia GB10 Grace Blackwell Superchip tương tự mẫu Nvidia DGX Spark, với lõi Tensor Cores thế hệ thứ năm, được tối ưu hóa để xử lý các nhiệm vụ AI như nhận dạng ảnh, xử lý ngôn ngữ tự nhiên và dự đoán dữ liệu. Chip kết hợp CPU ARM Neoverse V2 chứa 20 lõi hiệu năng cao giúp tăng cường xử lý và sắp xếp dữ liệu, tăng tốc độ tinh chỉnh mô hình và suy luận theo thời gian thực. Công nghệ NVLink C2C cung cấp mô hình bộ nhớ CPU và GPU đồng nhất với băng thông gấp năm lần PCIe 5.0.
Máy có hai phiên bản bộ nhớ trong: 1 TB và 4 TB SSD NVMe, có khả năng mã hóa tự động nhưng không hỗ trợ nâng cấp. Bộ nhớ RAM đạt 128 GB chuẩn LPDDR5X, hỗ trợ Error-Correcting Code (ECC) để phát hiện và sửa lỗi dữ liệu, cũng như có thể truy cập chung cho CPU và GPU với băng thông 272 Gb/giây. Dù vậy, băng thông bộ nhớ LPDDR5x thấp hơn GPU HBM, qua đó khiến hiệu năng huấn luyện mô hình lớn bị giới hạn. Do đó, đây không phải lựa chọn thay thế cho cụm GPU chuyên dụng trong các trung tâm dữ liệu, mà chỉ phù hợp với tác vụ nghiên cứu hoặc tinh chỉnh quy mô nhỏ.
Với thông số kể trên, sản phẩm cung cấp hiệu suất tính toán phục vụ AI đến 1 petaflop (1 triệu tỷ phép tính mỗi giây), cho khả năng xử lý LLM từ 130 đến 200 tỷ tham số trực tiếp, cũng như cho phép tinh chỉnh, huấn luyện và suy luận cục bộ các mô hình AI không cần kết nối đến đám mây. Thông qua cổng ConnectX CX-7 SmartNIC với tốc độ tới 400 Gb/giây, người dùng có thể kết nối hai GX10 lại với nhau thông qua cáp đặc biệt, qua đó có thể xử lý mô hình lên đến 405 tỷ tham số.
Với thông số kể trên, sản phẩm cung cấp hiệu suất tính toán phục vụ AI đến 1 petaflop (1 triệu tỷ phép tính mỗi giây), cho khả năng xử lý LLM từ 130 đến 200 tỷ tham số trực tiếp, cũng như cho phép tinh chỉnh, huấn luyện và suy luận cục bộ các mô hình AI không cần kết nối đến đám mây. Thông qua cổng ConnectX CX-7 SmartNIC với tốc độ tới 400 Gb/giây, người dùng có thể kết nối hai GX10 lại với nhau thông qua cáp đặc biệt, qua đó có thể xử lý mô hình lên đến 405 tỷ tham số.
Là một thiết bị chuyên dụng cho huấn luyện AI, Ascent GX10 cũng sử dụng hệ điều hành riêng Nvidia DGX Base OS. Đây là phiên bản dùng Linux Ubuntu được tối ưu hóa đặc biệt cho thiết bị AI với tất cả driver, thư viện và công cụ đã cài sẵn, không cần phải cài đặt phức tạp.
Bên cạnh đó, nền tảng cũng cung cấp công cụ, thư viện dùng cho từng mục đích riêng, cũng như hướng dẫn cài đặt theo từng công cụ giúp người dùng có thể thao tác ngay thay vì phải tự tìm hiểu. Thực tế, giao diện máy khá trực quan, dễ sử dụng. Tại sự kiện, các chuyên gia cũng đã thử nghiệm chạy một số mô hình AI và cho kết quả với tốc độ khá nhanh.
Là một thiết bị chuyên dụng cho huấn luyện AI, Ascent GX10 cũng sử dụng hệ điều hành riêng Nvidia DGX Base OS. Đây là phiên bản dùng Linux Ubuntu được tối ưu hóa đặc biệt cho thiết bị AI với tất cả driver, thư viện và công cụ đã cài sẵn, không cần phải cài đặt phức tạp.
Bên cạnh đó, nền tảng cũng cung cấp công cụ, thư viện dùng cho từng mục đích riêng, cũng như hướng dẫn cài đặt theo từng công cụ giúp người dùng có thể thao tác ngay thay vì phải tự tìm hiểu. Thực tế, giao diện máy khá trực quan, dễ sử dụng. Tại sự kiện, các chuyên gia cũng đã thử nghiệm chạy một số mô hình AI và cho kết quả với tốc độ khá nhanh.
Do sử dụng Ubuntu, Ascent GX10 cũng có một số tính năng cho người dùng thông thường như duyệt web, phần mềm văn phòng mã nguồn mở... Người dùng cũng có thể điều khiển thiết bị từ xa thông qua máy tính hoặc thiết bị di động.
Do sử dụng Ubuntu, Ascent GX10 cũng có một số tính năng cho người dùng thông thường như duyệt web, phần mềm văn phòng mã nguồn mở... Người dùng cũng có thể điều khiển thiết bị từ xa thông qua máy tính hoặc thiết bị di động.
Ascent GX10 được bán giá 129 triệu đồng cho bản 4 TB và 115 triệu đồng cho phiên bản 1 TB. Sản phẩm hướng đến nhóm người dùng là nhà phát triển và nghiên cứu AI, doanh nghiệp cần AI cục bộ để xử lý dữ liệu nhạy cảm hoặc muốn truy xuất dữ liệu nhanh, cũng như tổ chức giáo dục, sinh viên muốn học và thực hành LLM trực tiếp thay vì phải thuê máy chủ đắt tiền.
Ascent GX10 được bán giá 129 triệu đồng cho bản 4 TB và 115 triệu đồng cho phiên bản 1 TB. Sản phẩm hướng đến nhóm người dùng là nhà phát triển và nghiên cứu AI, doanh nghiệp cần AI cục bộ để xử lý dữ liệu nhạy cảm hoặc muốn truy xuất dữ liệu nhanh, cũng như tổ chức giáo dục, sinh viên muốn học và thực hành LLM trực tiếp thay vì phải thuê máy chủ đắt tiền.
Bảo Lâm