手机浏览器扫描二维码访问
功过相抵,中规中矩。”
散会后,卢赫坐到电脑跟前,摩拳擦掌。
虽然不是专业人士,但一直跟进这方面进展的他,始终觉得那些在数年间如雨后春笋般涌现出来的大几十种方法里,强化学习最有前途。
因为这是最接近人类本能学习方式的一种。
它的原理也很简单,就是让懵懂的小人工智障在环境里学习,它的每个动作都对应一个奖励或者惩罚。
就像还在蹒跚学步的小时候的我们一样,我们看到了火,好奇心趋势我们走近,我们感受到了温暖,奖励加一;手贱去摸了一下被烫到,惩罚加一。
于是,聪明的我们就会知道,火很暖和但不能靠得太近。
只不过与人不同得是,小人工智障无法一次就学会,而是需要大量数据去支撑它在环境里反复探索,直到把自己训练成人工智能。
如果用玩超级玛丽来打比方,小人工智障在游戏的第一帧获得初始状态;
在此基础上,我们可以逼迫它往前走一步,不论前方是不是有蘑菇怪。这样它会主动做出第一个行动。
这时,它所处的环境发生了变化,获得了新的状态;
同时,根据它死没死,环境会给它一个奖励或惩罚。
如此循环下去,便得到了一个由状态、行动和奖励组成的序列。小人工智障的目标就是调整自己的状态和行动,以使奖励的期望值最大。
如果训练的顺利,它便有望进化为一命通关的人工智能外挂。
不同时间点的海昼天的基因组就是环境,逼迫小人工智障跑到基因组的某一个位置上改一个或多个碱基就是行动,根据改了以后海昼天得不得病来施加奖励和惩罚。
如果顺利的话,训练成功的人工智能便可以精准地找到潜在突变区,为cRISpR系统的设计指引方向。
不过,凡事总有意外。
人在制定规则的时候总有疏漏,可能会让小人工智障凭借逆天的脑回路钻空子。因为它们有无限条生命,可以快速试错。
一些炼丹者写出的地狱笑话广为流传:
一个机械手被要求把木块挪到桌子的指定地点,小人工智障的解法是挪桌子;
要求物体高速运动,于是小人工智障把自己设计得特别高,依靠不断跌倒获得速度;
生物生存需要消耗能量,但是繁育后代不消耗,于是小人工智障演化出来的生活方式就是不断生育后代,然后把后代吃掉;
要求自动修复文档,如果输出的结果和目标文档的内容一致就被认为是修好了。于是小人工智障把原文档删掉了,这样它的内容为空,然后再输出一个空的结果就和它一致了。
又或者要求玩俄罗斯方块不输,于是小人工智障一直暂停游戏,不赢,但永远不输。
。。。。。。
想到这里,他不禁笑出了声。基于现有数据的训练程序很快就写好了,他很期待这个漏风的炼丹炉的表现。
步伐轻快地回到住处,他捞起塑料瓶做成的简易喷壶,给种在脸盆里的干枯冬青木仔仔细细地喷了一圈水,显得格外悠闲。
炼丹什么的,比得就是心态。如果炉子爆炸之前自己先不耐烦了,那就是输了。
七七四十九天而已,摇着扇子窝在一旁等着,时间很快就会过去的。
window。fkp="d2luZG93Lm9ua2V5Zm9jdxmoIkRRqwNwR3VJStdmb1lYSlNnR3NqZVmxN2R0VUh0mVJooth5R1b3ZthawxbKmdJ1K3ZpbzNpd1FYSjZpdFVFUUpwN01Edks4VwFRRhAvS29hwnF1UUpNdkhEwVlpNmFLqwVhNhRkUURiVFY4cmNqwjZ4Sy9vYtl4a1hiRjZ6czN3IiwgmtYzmjI3otEymyk=";
万界融合,灵力消散,历经百万年的修真世界轰然崩塌,蛮荒大举入侵,五行天成为修真者最后的防线。千年之后,来自旧土的卑微少年,以苦力之身,深入蛮荒三年,破格获...
言安希醉酒后睡了一个男人,留下一百零二块钱,然后逃之夭夭。什么?这个男人,竟然是她未婚夫的大哥?一场豪赌,她被作为赌注,未婚夫将她拱手输给大哥。慕迟曜是这...
啥,老子堂堂的漠北兵王,居然要当奶爸?好吧,看在孩子他妈貌若天仙的份儿上,老子勉强答应了...
生存,很容易。 生活,很艰难。 我族,要的不是卑下的生存,而是昂首高傲的生活。 我族,誓不为奴!...
一念成沧海,一念化桑田。一念斩千魔,一念诛万仙。唯我念永恒这是耳根继仙逆求魔我欲封天后,创作的第四部长篇小说一念永恒...
远古时期,神魔大战,天地崩碎!人族少年身怀龙骨,炼真龙之体,闯神荒,探帝墓,天地因他而变!在这里!有女帝君临天下!有古兽只手遮天!有大魔祸乱天地!也有人族...