有一些物品,每个物品有对应的价值和重量,你有一个背包,只能装有限重量的物品。问如何装物品可以使总价值最大?形象地理解一下,有个游戏叫做小偷模拟器,也是背着包去别人家拿东西,目标也是价值最大。这就是背包问题。
推荐理由:盗贼小偷模拟器是一款模拟盗贼的游戏,玩家们可以在这里变成小偷去完成任务,潜行的玩法和多样的任务地图,都让你感受小偷的紧张的乐趣。
也就是说,如果我们以会使AI系统报告“小偷没有拿走钻石”的行动为优化的目标,那么它会做的就是欺骗人类。它将试图产生一个行动,使人类认为小偷没有拿走钻石。所以这个报告器没有给我们带来任何改进。因此,如果我们训练出了人类模拟器,我们就根本没有实现我们的希望。
这游戏还有一个别名《小偷模拟器》,你什么技能都可以不学,但你不能不学偷东西。你只需要选择一个队友和商人聊天吸引注意力,再让一个人从背后悄咪咪的进货。什么神装、神器全部轻松收入囊中。
我宣称,这一我将称之为“人类模拟器(humansimulator)”的现象可能会是一个问题。如果我们问AI:“摄像头是否在显示房间里发生的事情?小偷拿走了钻石吗?”它只会在人类能识别干扰存在的情况下报告干扰存在,并以人类看到视频后会回答这个问题的方式回答问题。因此,如果传感器以人类不会注意到的方式被干扰,系统对我们就一点帮助都没有。