8 AI sẽ dự giải gồm o3 và o4-mini của OpenAI, Deepseek R1, Grok 4, Gemini 2.5 Flash và 2.5 Pro, Kimi K2 và Claude 4 Opus. Trong đó, Deepseek và Kimi là những sản phẩm của Trung Quốc, còn lại thuộc về Mỹ.
Các "kỳ thủ" dự giải sẽ đấu loại trực tiếp. Tứ kết diễn ra từ 0h sáng thứ Tư 6/8, giờ Hà Nội. LLMs nào đi bốn nước sai luật liên tiếp sẽ bị xử thua. Họ sẽ thi đấu trên đấu trường trực tuyến mới của Google có tên Kaggle.
Trước giải, các AI này sẽ được kiểm tra thử trình độ để xác định hệ số, từ đó xếp hạt giống để chia cặp đấu. Kaggle cũng sẽ đánh giá năng lực của các AI dựa trên hệ số giống như Elo. Từ đó, người xem có thể xác định LLMs nào mạnh hơn ở cờ vua.

8 AI dự giải cờ vua dành riêng cho LLMs. Ảnh: Chess
Mỗi trận đấu sẽ gồm 4 ván, thắng 1 điểm, hòa 0,5 điểm, thua không có điểm. AI nào đạt 2,5 điểm trở lên sẽ đi tiếp. Nếu hòa 2-2, chúng sẽ đấu một ván quyết định tương tự armageddon trong cờ vua, khi Trắng buộc phải thắng để đi tiếp.
Kỳ thủ số hai thế giới Hikaru Nakamura sẽ phát trực tuyến và bình luận suốt giải đấu. Kỳ thủ số một thế giới Magnus Carlsen cũng sẽ tham gia bình luận một số trận đấu.
Sự kiện này được nhiều người hâm mộ chờ đợi. Trên nền tảng Chess, tài khoản GavinSuckAtChess bình luận: "Chắc chắn sẽ có rất nhiều nước cờ sai luật".
Còn real_jaya đưa ra dự đoán: "Tôi đặt cửa chiến thắng áp đảo cho các đại diện của Gemini. Vì chúng đã thể hiện rất tốt trong các trò chơi pokemon trước đây".
LLMs không giống như các công cụ cờ vua chuyên dụng như Stockfish hay Leela Chess Zero (Lc0). Elo của các công cụ này đã vượt xa các kỳ thủ hàng đầu thế giới (khoảng trên 3.600 so với 2.800). Nakamura từng được chấp xe, vẫn thua đậm Lc0 trong một trận biểu diễn. Lc0 cũng có thể coi là AI, vì nó tự học cờ vua bằng cách đánh với bản thân hàng triệu ván đấu.
LLMs là một loại mô hình trí tuệ nhân tạo (AI), chủ yếu dùng để xử lý ngôn ngữ, dịch thuật hay sáng tạo nội dung. Người dùng có thể tương tác với LLMs thông qua chatbot, như ChatGPT thuộc OpenAI. Về kỹ thuật, LLMs hoạt động theo cách thức "đoán từ tiếp theo".
Trong cờ vua, LLMs dường như cũng làm vậy với các nước đi. Vì thế, nó thể hiện tốt ở khai cuộc và ít khi mắc bẫy. Nhưng đến trung và tàn cuộc, nó càng dễ mắc sai lầm hoặc đi những nước sai luật. ChatGPT từng thua Carlsen mà không ăn được quân nào.
Xuân Bình tổng hợp