「前沿」量子围棋机器 —《Physics World》报道上海交大金贤敏团队研究成果
FUTURE远见| 2021-01-29
Future|远见
Future|远见future选编
一个中国的实验物理学团队及其合作者实现了古老棋盘游戏——围棋的量子版本。研究人员通过使用纠缠光子来模拟处于量子叠加状态的棋子,从而大大提升了游戏的复杂性——他们认为这项技术将成为复杂人工智能(AI)机器玩家的终极测试。
1997年,国际象棋大师Garry Kasparov被IBM的深蓝(Deep Blue)计算机击败。然而当AI程序挑战围棋高手时,因为围棋中所存在的棋盘的可能状态要远多于其他游戏,机器算力要面对更巨大的挑战。当谷歌旗下的DeepMind公司所开发的AlphaGo于2016年击败世界领先的韩国职业棋手Lee Sedol时,震惊了全世界的围棋爱好者和计算机科学家。
AI程序的开发人员在后续的研究中正在寻找难度更大的挑战,并希望AI在诸如扑克和麻将等游戏中击败人类。这类游戏都包含随机性和不完美信息(即一个玩家看不到另一位玩家的手中的牌)。
挑战人工智能
上海交通大学金贤敏教授团队利用量子力学中的反直觉效应将上述元素引入到围棋中,相比而言传统围棋则是确定性的并拥有完美信息。物理学家André Ranchin在2016年提出了一种“量子围棋”的形式,正如此前提出的诸如量子象棋等量子游戏,更侧重于通过量子游戏达到量子力学科普与教学的目的,而金贤敏教授团队则选择设计独特的游戏系统来测试AI程序的算力极限。
在传统围棋中,一名玩家执黑棋,另一名玩家执白棋,两人交替地将手中的棋子置于棋盘之上。棋手的目标是用自己的棋子在棋盘上围占比对方更大的地盘,在这个过程中也可以通过包围对手的棋子将其捕获。
围棋的规则虽然简单,却可以衍生出复杂精巧的游戏模式。在量子围棋的规则里,棋手则通过使用叠加态,将这种复杂性进一步提高。传统的围棋下棋过程中,棋手在每一步只能下一枚棋子占据棋盘上的单一位置;而量子围棋规则下,这枚棋子则可以同时占据棋盘上的两个位置。该枚棋子会持续占据这两个位置,而当它相邻的位置上放有其他棋子后,则会触发量子力学中的“测量”机制。在测量前,量子态会处于叠加态,在被测量后,量子态就塌缩到单一分量上。
随着两名棋手不断将量子棋子置于棋盘上,纠缠光子所构成的希尔伯特状态的空间呈指数增长,每下一枚量子棋子,游戏中可能的状态数将翻倍。这种巨大的决策量使棋手在制定行动策略时需要更多的思考。与传统围棋一样,棋手同样可以捕获对手的棋子,但如果存在处于叠加状态的量子棋子,棋手在执行完各自的“测量”之前,并不知道量子棋子会塌缩到具体哪一个位置以及是否能确定性地包围对手的棋子,也使得量子围棋在进攻和防守上包含了更多的不确定因素。
非完美信息
金贤敏教授解释说,可以通过设计量子纠缠来调整测量过程。如果纠缠光子对处于最大纠缠态,则相应的测量结果是完全随机且无偏的;如果预设棋子塌缩时留在两个位置的概率不相同,即存在概率偏向,并只对下这个棋子的棋手公开这种偏向信息,此时游戏失去了一些随机性,而引入了不完美信息的元素。
实验团队制备多组极化纠缠光子对,并将光子对通过极化分束器传播到不同路径,然后连接到四个单光子探测器来进行符合计数测量。每一对极化纠缠的光子对有两组可能的路径输出,其中一组输出记为“ 0”,并将另一组输出记为“ 1”,将所生成的0和1的随机序列存储起来。在量子围棋游戏过程中,0和1分别代表量子棋子将会塌缩到哪个位置,该序列可以用来将塌缩测量的结果分配给下棋的人类玩家和机器人。
研究团队指出,量子围棋的复杂度和游戏困难度之间的确切关系仍然是一个悬而未决的问题,同时团队也认为量子围棋的优点在于游戏的难度调节范围非常大,而不仅仅是单一确定的难度。通过增加虚拟棋盘的大小并调整纠缠度,即使是那些包含大量隐藏信息的游戏(例如麻将),其难度也能使用量子围棋匹配和模拟。因此,量子围棋可以提供一种用于测试人工智能新算法的通用性平台。
量子围棋机器的论文预印本于近日在 arXiv 上在线发表[arXiv:2007.12186 (2020)],论文第一作者是上海交通大学集成量子信息技术研究中心博士生乔璐枫,通讯作者是金贤敏教授。