Tiến sĩ Việt kể về 'bốn ngày kỳ diệu' phát triển AI Google giải toán Olympic

Phát triển Google Deep Think trong thời gian dài, trưởng nhóm Lương Minh Thắng vẫn quyết định thêm tính năng mới những ngày cuối, giúp AI "đoạt huy chương vàng IMO".

TS. Lương Minh Thắng, 38 tuổi, là chuyên gia cao cấp tại bộ phận nghiên cứu trí tuệ nhân tạo Google DeepMind. Gần 10 năm tại Google, anh tham gia xây dựng nhiều mô hình AI, trong đó có Gemini.

AI suy luận nâng cao Deep Think, tích hợp trong Gemini, được phát triển bởi dội ngũ hàng chục chuyên gia Google, do Lương Minh Thắng đứng đầu. Nó được thiết kế đặc biệt để giải các bài toán phức tạp như trong kỳ thi Olympic Toán quốc tế (IMO). Tương tự các thí sinh, AI cũng thực hiện hai buổi thi kéo dài 4,5 tiếng, không sử dụng công cụ hỗ trợ hay Internet. Kết quả, Deep Think đạt 35/42 điểm trong 5 câu hỏi đầu, do chính giám khảo của IMO chấm. Trong kỳ IMO năm nay, chỉ 67/630 thí sinh đạt từ 35 điểm trở lên - mức giành huy chương vàng.

Tiến sĩ Lương Minh Thắng. Ảnh: Bảo Lâm — Tiến sĩ Lương Minh Thắng. Ảnh: *Bảo Lâm*

- Chúc mừng anh và đội ngũ Google đã đạt thành tựu quan trọng với Deep Think. Điều gì đã thúc đẩy nhóm phải phát triển một AI có khả năng giải toán vậy?

- Câu chuyện đến rất tự nhiên. Cuối năm 2022, ChatGPT ra đời. Đầu 2023, chúng tôi ra mắt Bard sau 100 ngày phát triển, sau đó đổi tên thành Gemini năm 2024. ChatGPT hay Gemini đều rất giỏi về ngôn ngữ tự nhiên, như có thể làm thơ hoặc viết thư tình. Nhưng điểm chung của chúng là nằm trong một khuôn khổ, chủ yếu bắt chước ngôn ngữ tự nhiên của con người. Khi đó, câu hỏi đặt ra là tại sao không cho Gemini khả năng tư duy, lý luận cao cấp hơn nữa. Toán học là lĩnh vực đầu tiên chúng tôi nghĩ đến khi xét tới khả năng này của trí tuệ nhân tạo.

Tôi đam mê toán từ nhỏ, cấp ba từng thi toán quốc gia. Đến 2024, tôi thành lập nhóm mới tại Google, có tên Lý luận siêu trí tuệ. Mục đích là làm sao để AI có thể suy luận và suy luận một cách sâu sắc, cũng như hạn chế vấn đề "ảo giác", tức bịa ra thông tin sai nhưng nghe rất thuyết phục. Tiếp cận toán là nhóm muốn dạy AI phải lý luận chặt chẽ, từng bước một.

Thực tế, năm ngoái Google đã có hai mô hình AlphaGeometry 2 ngang trình độ thí sinh giành huy chương vàng và AlphaProof ngang thí sinh giành huy chương bạc. Tuy nhiên, cả hai hoạt động dựa trên sự kết hợp giữa mạng neuron và mạng logic, có nghĩa vẫn cần con người tham gia một số công đoạn.

Trong khi đó, Deep Think thực hiện gần như toàn bộ quá trình nhờ công nghệ suy luận song song, tức cho phép mô hình cùng lúc khám phá và kết hợp nhiều hướng giải, ý tưởng giao thoa nhau trước khi đưa ra câu trả lời, thay vì đi theo một chuỗi suy luận tuyến tính như mô hình thông thường. AI được huấn luyện bằng kỹ thuật học tăng cường mới, sử dụng dữ liệu chuyên sâu lập luận nhiều bước, giải quyết vấn đề và chứng minh định lý.

- Anh nói đến dữ liệu chuyên sâu cho Deep Think, đó là các loại dữ liệu nào?

- Chúng tôi thu thập một lượng dữ liệu rất lớn, rất nhiều bước để huấn luyện, gồm cả các cuộc thi toán trên toàn thế giới. Với các mô hình trước đây, mọi người chủ yếu sử dụng dữ liệu đáp án, nhưng nó chỉ có thể mang về kết quả, không thể hiện trình độ lý luận chặt chẽ.

Số lượng dữ liệu không thể công bố, nhưng rất nhiều. Trong các đợt huấn luyện, chúng tôi liên hệ khoảng 30 người từng đạt huy chương ở các kỳ thi liên quan đến toán học, trong đó có các nhóm ở Việt Nam, như thầy Trần Nam Dũng, Phó hiệu trưởng trường THPT Năng khiếu - Đại học Quốc gia TP HCM.

- Khoảnh khắc nào khiến nhóm phải trầm trồ, hay áp lực deadline mà anh phải trải qua khi phát triển AI?

- Ngay trước kỳ thi IMO 2025, chúng tôi trải qua "bốn ngày kỳ diệu" đối với Deep Think. Chúng tôi đã có một hệ thống AI sẵn sàng thi IMO với khả năng rất tốt rồi. Nhóm muốn mô hình tốt hơn, lớn hơn nữa, nhưng sẽ phải thay đổi cấu hình và rất nhiều tài nguyên tính toán - điều mà Google khi đó không có đủ.

Tôi sau đó phải thuyết phục ba nhóm lớn khác tại Google cũng như các "sếp". Khi nói chuyện trực tiếp với CEO DeepMind Demis Hassabis và các lãnh đạo cấp cao, tôi đưa ra một biểu đồ cho thấy Deep Think sẽ cho kết quả tốt hơn hiện có và lập tức được chấp thuận cung cấp thêm tài nguyên tính toán.

Tuy nhiên, bắt tay hiện thực hóa ý tưởng chỉ trong một tuần khiến nhóm hết sức áp lực, do thời gian quá ngắn để áp dụng thuật toán đào tạo mô hình mới. Trong bốn ngày ngắn ngủi, chúng tôi chạy hệ thống với sự quyết tâm và khẩu hiệu YOLO - You Only Live Once (Bạn chỉ sống một lần).

Ở mô hình trước đó, chúng tôi đặt các công thức riêng lẻ để AI xử lý. Nhưng trong phiên bản mới, các công thức được đặt chung nhau, với bốn công thức chủ chốt. Có thể tưởng tượng, nếu không thành công, mọi thứ có thể đi sai đường và chúng tôi sẽ thất bại.

Trong bốn ngày (8-12/7), chúng tôi liên tục chạy và đánh giá mô hình. Nhóm sau đó vỡ òa vì mọi thứ nằm trong tầm kiểm soát, thậm chí vượt ngoài mong đợi khi thành công với đề thi IMO 2025. Không chỉ giải toán tốt và đạt huy chương vàng, Deep Think còn có thể tự tư duy lập trình, tìm kiếm kiến thức chuyên sâu - điều mà nhiều mô hình khác chưa có hoặc chưa đạt sức mạnh tương đương.

- LLM của OpenAI cũng thử sức và đạt huy chương vàng IMO 2025 với số điểm tương tự. Sự khác nhau giữa AI này và Deep Think là gì?

- OpenAI công bố khả năng giải toán trên mô hình của họ trước vào ngày 19/7, còn chúng tôi sau đó gần hai ngày. Thực tế, mô hình hoàn thiện từ 14/7 và có kết quả rồi, nhưng chúng tôi muốn tôn trọng thí sinh và cuộc thi IMO 2025 (diễn ra ngày 1-20/7 ở Australia) nên thông báo muộn hơn vào 21/7.

OpenAI tuyên bố AI đoạt huy chương vàng, nhưng không cung cấp trình tự thực hiện. Kết quả của họ cũng không do hội đồng giám khảo IMO chấm điểm. Trong khi đó, Deep Think hiển thị toàn bộ quá trình tính toán, minh bạch về cách AI tư duy từng bước. Quan trọng hơn, mô hình của Google đã được triển khai cho công chúng sử dụng, từ cách đây hai tuần.

Đội ngũ phát triển AI Deep Think của Google. Ảnh: NVCC — Đội ngũ phát triển AI Deep Think của Google. Ảnh: *NVCC*

- Nếu coi Deep Think là một học sinh, anh đánh giá AI này là mọt sách, thiên tài hay sở hữu đặc tính nào?

- Vài tháng trước, Deep Think là một học sinh cần cù, kiên trì hoàn thành công việc đến cùng. Nếu được giao một bài toán, AI sẽ suy luận rất tỉ mỉ, xét đến nhiều trường hợp khác nhau từng chi tiết một để đưa ra lời giải tốt nhất.

Còn hiện tại, nó là một học sinh sáng tạo, có thể tạo ra những cách mới mà đôi khi chính đội ngũ cũng bất ngờ.

- Nói đến học sinh, anh đánh giá gì về xu hướng tạo ra nhiều mô hình khác nhau cho mục đích chuyên sâu như làm văn, giải toán... khiến học sinh lười tư duy?

- Đây là vấn đề thực sự cần suy ngẫm, đặc biệt cần xem lại cách thức giáo dục mới trong thời đại AI. Bất cứ thứ gì đều có thể trở thành con dao hai lưỡi. Nếu học sinh lười biếng, AI có thể bị lạm dụng, làm giảm sự tư duy. Nhưng nếu ở trong tay học sinh có khả năng sáng tạo cao, AI sẽ chắp cánh cho những ý tưởng mới mà họ có thể chưa nghĩ tới khi không có AI.

Việt Nam cũng cần thay đổi cách giảng dạy. AI đang phát triển nhanh chóng, chỉ sau 3-6 tháng, kiến thức có thể đã lạc hậu, nên cần có cơ chế "chuyển trạng thái" linh hoạt để thích nghi nhanh.

Theo quan sát của tôi, các bạn trẻ Việt Nam như những viên ngọc thô. Chẳng hạn với môn toán, họ có nền tảng, tư duy rất tốt nhưng thiếu người dẫn dắt, đào tạo và định hình tầm nhìn lâu dài. Như tôi khi mới qua Singapore thấy mình rất sáng tạo, nhưng thực tế không là gì cả. Khi tới Mỹ, mình thậm chí còn nhỏ bé hơn và nhận ra bản thân phải ước mơ, cần một môi trường và có những người dẫn đường.

Với mong muốn hỗ trợ người Việt trẻ, tôi và hai thành viên ở Thung lũng Silicon thành lập tổ chức phi lợi nhuận New Turing Institute. Mục tiêu là nuôi dưỡng và truyền cảm hứng cho thế hệ tài năng AI tiếp theo ở Đông Nam Á và những nơi khác, thông qua chương trình đào tạo, tài trợ hay cuộc thi. Khẩu hiệu của chúng tôi là Zero to Hero - một người từ không biết gì đến am hiểu tường tận, có thể truyền đạt lại cho thế hệ kế tiếp. Thông qua tổ chức, chúng tôi cũng muốn giúp Việt Nam trở thành trung tâm công nghệ hàng đầu trên thế giới, đưa các chuyên gia hàng đầu về Việt Nam để đào tạo và truyền cảm hứng cho các bạn trẻ.

- Để định hướng nghề nghiệp cho người trẻ, anh dự đoán thế nào về xu hướng AI và lĩnh vực rất "hot" hiện nay là robot hình người trong 10 năm tới?

- Tương lai thực sự rất khó đoán vì công nghệ phát triển rất nhanh. Tôi từng nghĩ phải vài năm nữa AI mới có thể giải toán IMO, nhưng giờ đã làm được điều đó rồi.

Nhưng có một điều chắc chắn, AI sẽ đóng góp rất lớn trong những lĩnh vực quan trọng như khoa học, y tế, nghiên cứu. Khi được trang bị khả năng tư duy và lý luận cao cấp, chúng sẽ giúp con người tìm ra kiến thức mới, định luật mới trong toán học, lý thuyết mới ở lĩnh vực vật lý, tạo ra thuốc mới cho lĩnh vực y tế.

Với robot hình người, tôi cũng có phần lo lắng, bởi nó không còn là thuật toán AI nữa, mà là một cỗ máy vật lý có cơ bắp. Tôi chưa có câu trả lời chính xác, nhưng hướng đến mặt tích cực nhiều hơn.

Bảo Lâm

AI của Google giải toán tương đương huy chương vàng Olympic
AI của OpenAI 'đủ đạt huy chương vàng Olympic toán học'

Tiến sĩ Việt kể về 'bốn ngày kỳ diệu' phát triển AI giải toán Olympic

Tiến sĩ Việt kể về 'bốn ngày kỳ diệu' phát triển AI giải toán Olympic