:脑洞这种东西,开着开着就习#了_(:з」∠)_小耳家族新系列连载漫画开始啦~各种萌萌的死法,你怕##############################号:小耳######################:小耳家族
但也如**所言,文心一言表现出了一些“不完美”——“这种生成式的语言大模型确实会出现‘一本正经胡说八道’的现象,大家在其他大模型的体验过程中应该有这种感觉。”
但生成式AI也有自己的问题,例如用于训练底层AI模型的数据来源可能存在争议、训练数据应如何流通、缺乏对源数据的使用权限、模型中存在偏见,还有更重要的一点——响应内容的准确性,特别是“一本正经的胡说八道”。
·针对生成式语言大模型“一本正经胡说八道”的现象,百度创始人、董事长兼首席执行官**在回答澎湃科技的提问时表示,“百度在这个方面确实有优势,我们做了知识增强和检索增强。”
而根据**介绍,文心一言所用的训练数据主要来自于千亿万亿量级的网络页面、几十亿的(百度)搜索请求、巨量图片,以及5500亿条知识图谱(一种结构化的语义知识库)中的事实数据。因此,他认为,百度在面对当前语言大模型经常会出现的“一本正经地胡说八道”的问题时“拥有优势”,可以事先检查生成的内容到底是否和事实吻合,一定程度上保证了回答的准确性。
正如**所言,这种生成式的语言大模型确实会出现“一本正经胡说八道”的现象,大家在其他大模型的体验过程中应该有这种感觉。
但也如李彦宏所言,文心一言表现出了一些“不完美”——“这种生成式的语言大模型确实会出现‘一本正经胡说八道’的现象,大家在其他大模型的体验过程中应该有这种感觉。”