大秦科技,总裁办公室。
回到公司的许道微,陆续叫来一位又一位公司部门负责人,微调各部门的方向。
比如,安全管家添加一个软件下载功能,直接替代掉迅雷;光刻机事业部停掉波长157n光刻机的攻关方向,提升林本坚博士的沉浸式光刻机的科研投入;IC设计事业部增加一个4G标准的科研项目;投资并购部的项目收购建议……
大秦科技本就是许道微的一言堂,唯一有能力阻止许道微的只有程颖,可惜程颖向来是夫唱妇随,许道微决定的事情,她的任务是如何去实现它,而不是质疑这件事情的正确性。
公司被许道微搞得鸡飞狗跳,不过对许道微而言,既然有经验可以借鉴,不借鉴不成了傻子嘛?
许道微来到了许志雄的工作区域,问道:“围棋项目怎么样了?”
许志雄一边演示,一边笑道:“完全没有问题,不过我建议找人先内部测试一下。”
许道微看完演示,发觉弱人工智能与未来画卷中的阿尔法狗有很大不同,阿尔法狗主要用了三种算法,即”蒙特卡洛树搜索”,”监督学习”和”增强学习“”。
其中蒙特卡洛树搜索是一种升级版的暴力计算;监督学习是通过记录3000万部人类棋谱,对六段以上职业棋手走棋规律进行效仿,这也是阿尔法狗获得突破性进展的最为关键算法;而增强学习作为辅助,是两台阿尔法狗从自我对战中学习如何下棋。
每当获取棋局信息的时候,阿尔法狗会根据策略探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。
大秦科技的弱人工智能采取的学习手段简单粗暴,就是监督学习加增强学习,教会弱人工智能围棋是什么?如何最快的取得胜利……
剩下就靠弱人工智能的自我学习,许志雄带领着团队成员以及校企合作基地的大学生,给弱人工智能输入了3000万步人类围棋大师的走法,并让其自我对弈3000万局,积累胜负经验,同时在自我对弈的训练中形成全局观,并能够客观的对局面作出评估。
弱人工智能不仅展示出了强大的落子选择能力,并且随着训练的增加,它还在逐步展示出了人类的“直觉”。
“我会安排一场内部测试,如果通过,该项目正式命名为女娲,也是弱人工智能未来的名字。”
顿了顿儿,许道微补充道:“你知道女娲这个名字对华夏的意义,弱人工智能可以失败,而女娲绝对不可以。”
许志雄重重点头,“我相信围棋项目不会辱没女娲这个名字。”
……
大秦科技不知从何时起,做事风格越来越简单粗暴,而且异常的骄傲。
找寻内部测试的围棋选手时,公司的工作人员直接排除了九段以下的所有选手,一番筛选之后向华夏著名围棋国手,职业九段。被称为“天才棋手”,绰号“神猪”的罗洗河先生发出了邀请。
公司的员工坚定的认为,大秦科技必将战无不胜,没必要从低段位开始挑战。
罗洗河先生毫不犹豫的答应了,他同样理所当然的认为,这个比赛与平时玩的人机对战没有任何区别,不过是一个高级的电脑程序罢了。
一共五局比赛,赢下一局就有十万华夏币的奖金,对于五十万华夏币,他已经势在必得。
比赛就在外界丝毫不知的情况下展开了,直到第一局比赛开始之前,罗洗河先生始终信心满满,不过第一局比赛,他以绝对的劣势告负首局,才第一次正视起弱人工智能的超凡能力。
第二局,罗洗河先生反思了第一局的轻敌与失误,全力以赴的对待这局比赛,然而弱人工智能在这一局比赛中,表现的与第一句截然不同。
第一局,罗洗河感觉自己面对的是一位高超的人类棋手,可是第二局,弱人工智能经常选择一些人类不会落子的位置。这出乎意料的下法,开创性的展现了弱人工智能的原创能力,以及与人类截然不同的智慧。罗洗河败的心服口服。
第三局,罗洗河已经不再思考所谓的奖金问题,他已经被逼到了悬崖边上,骄傲的他认为,如果他再次失败,意味着人类将在这个领域被弱人工智能彻底碾压。
罗洗河改变了一贯的下棋方式,希望用先破后立的手段,然后改变就是对自己产生了怀疑,弱人工智能兵不血刃的再下一城。
事到如今,哪怕一场胜利也足以让罗洗河获得安慰,他在第四局中采取了非常规的布局方式,防止弱人工智能推演棋局的走势。
非常规意味着罗洗河自己也不熟悉这种下法,这种设计承担着极大的等风险,对胜利的渴望让他努力寻找弱人工智能的漏洞。
可惜,弱人工智能稳如老狗,它没有丝毫情绪,只有对胜利的追求,比分来到4:0。