AlphaGo là một chương trình máy tính được phát triển bởi Google DeepMind ở Luân Đôn để chơi game cờ vây. Tháng 12/2015, nó đã trở thành chương trình máy tính cờ vây đầu tiên đánh bại một cầu thủ chuyên nghiệp trên bàn cờ 19x19.
Và vào tháng 3 năm 2016, AlphaGo tiếp tục đánh bại Lee Sedol trong ba ván đầu tiên trong trận đấu gồm 5 ván. Lần đầu tiên trong lịch sử một phần mềm đánh cờ vây có thể đánh bại một kiện tướng cờ vây xếp hạng thứ 9-dan mà không chấp. Tuy nhiên, nó đã để thua Lee Sedol trong ván đấu thứ 4.
Thuật toán của AlphaGo sử dụng sự kết hợp của kỹ thuật máy móc, kỹ thuật tìm kiếm dạng cây, cùng với luyện tập mở rộng, từ cả cách chơi của máy tính và con người. Nghĩa là, AlphaGo không được phát triển dựa trên những phép tính cứng nhắc, mà nó được lập trình để tự nghiên cứu những trận đấu cũ, tự mô phỏng những ván đấu và tự hoàn thiện mình.
Cờ vây được xem là một trong những bộ môn mà máy tính khó giành chiến thắng trước con người hơn là cờ vua bởi nó có sự phân nhánh lớn hơn nhiều trong cách đi, điều đó khiến cho việc sử dụng phương pháp AI truyền thống như Alpha-beta pruning, Tree traversal hay Heuristic Search trở nên khó khăn.
20 năm sau khi Deep Blue của IBM đánh bại nhà vô địch cờ vua thế giới Garry Kasparov trong trận đấu năm 1997, những chương trình cờ vây mạnh nhất sử dụng trí tuệ nhân tạo chỉ đánh bại cấp độ 5-dan nghiệp dư và chưa thể đánh bại một cầu thủ cờ vây chuyên nghiệp mà không chấp. Sau đó, tình trạng này đã được cải thiện, trong năm 2012, phần mềm cờ vây Zen đã đánh bại Takemiya Masaki hai lần. Trong năm 2013 Crazy Stone đánh bại Yoshio Ishida.
AlphaGo đã tạo ra một dấu mốc đáng kể so với các phần mềm cờ vây trước đây. Trong 500 trận đấu với các phần mềm cờ vây hiện có, bao gồm cả Zen và Crazy Stone, AlphaGo chỉ chạy trên một máy tính duy nhất và chiến thắng tất cả.
Đáng kể nhất là trận đánh bại Fan Hui, nhà vô địch cờ vua châu Âu xếp hạng 2-dan chuyên nghiệp với tỷ số 5-0. Và tiếp theo là thắng Lee Sedol trong trận đấu đang diễn ra với tỷ số 3-1.
Video tường thuật các ván đấu giữa AlphaGo và Lee Sedol
AlphaGo được thử nghiệm trên phần cứng với số lượng CPU và GPU khác nhau, chạy ở chế độ không đồng bộ hoặc phân phối. Hai giây suy nghĩ cho mỗi lần di chuyển.
Như đã nói AlphaGo sử dụng sự kết hợp của kiến thức máy móc, kỹ thuật tìm kiếm dạng cây, cùng với luyện tập tổng hợp từ những kịch bản chơi của cả con người và máy tính. Nó sử dụng thuật toán tìm kiếm dạng cây Monte Carlo, được hướng dẫn bởi mạng lưới giá trị (value network) và mạng lưới nước đi (policy network) cả hai đều được thực hiện bởi công nghệ mạng nơ-ron theo chiều sâu.

Hình ảnh mô phỏng thuật toán của AlphaGo
Mạng lưới "thần kinh" của AlphaGo ban đầu được mồi (bootstrap) từ lối chơi của những người chuyên nghiệp. Nó được đào tạo để bắt chước con người, cố gắng đấu lại những nước đi của các chuyên gia trong lĩnh vực cờ vây được lịch sử ghi chép lại, sử dụng cơ sở dữ liệu của khoảng 30 triệu di chuyển. Một khi đã đạt đến mức độ nhất định về trình độ, nó sẽ được đào tạo bằng cách thiết lập để thi đấu một số lượng lớn các trò chơi với chính mình, tự học hỏi để cải thiện khả năng chơi.
AlphaGo đã được mô tả bởi Myungwan Kim xếp hạng 9-dan là chơi giống như một con người trong trận đấu của nó với Fan Hui. Trọng tài trận Toby Manning đã miêu tả phong cách chơi của nó là thận trọng.
Hiện tại người dùng chưa thể tải về code của AlphaGo, nhưng trên trang chủ của chương trình, bạn có thể xem lại những ván đấu của AlphaGo với Lee Sedol cũng như tải về file SGF của trò chơi. Hoặc nhấp vào Tải về để tải file SGF, sau đó sử dụng SgfEditor để xem.
Bích Thủy
AlphaGo là một chương trình máy tính được phát triển bởi Google DeepMind ở Luân Đôn để chơi game cờ vây.
Tháng 12/2015, AlphaGo trở thành chương trình máy tính cờ vây đầu tiên đánh bại một cầu thủ chuyên nghiệp trên bàn cờ 19x19. Vào tháng 3/2016, nó tiếp tục đánh bại Lee Sedol trong ba ván đầu tiên của trận đấu 5 ván.
AlphaGo sử dụng sự kết hợp của kỹ thuật máy móc, thuật toán tìm kiếm dạng cây Monte Carlo, mạng lưới giá trị và mạng lưới nước đi, được thực hiện bởi công nghệ mạng nơ-ron theo chiều sâu.
AlphaGo được đào tạo ban đầu bằng cách học từ các ván đấu của người chơi chuyên nghiệp khoảng 30 triệu nước đi, sau đó tự thi đấu với chính mình để tự học và cải thiện khả năng chơi.
Cờ vây có số lượng phân nhánh lớn trong cách đi, làm cho các phương pháp AI truyền thống như Alpha-beta pruning trở nên khó áp dụng hiệu quả hơn so với cờ vua.
AlphaGo đã để thua Lee Sedol trong ván đấu thứ 4 của trận đấu gồm 5 ván vào tháng 3/2016.
Hiện tại người dùng chưa thể tải về code của AlphaGo, nhưng có thể xem lại các ván đấu và tải file SGF trên trang chủ của chương trình.
AlphaGo được thử nghiệm trên phần cứng với số lượng CPU và GPU khác nhau, chạy ở chế độ không đồng bộ hoặc phân phối.
AlphaGo được mô tả là chơi giống con người và phong cách chơi thận trọng, theo đánh giá của các kiện tướng và trọng tài cờ vây.