百度3月将推出ChatGPT风格搜索服务?SEO转点?
·消息人士称,百度计划在3月推出类似于ChatGPT的AI聊天机器人服务,百度文心(Ernie)大模型将成为其基础。
·百度对这一消息尚未作出正面回应。百度搜索杰出架构师辜斯缪1月初曾表示,百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统。
1月初,百度搜索杰出架构师辜斯缪曾在一次小范围的媒体沟通会上说:“我们预计在3月会做一个比较大的升级。”“百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统。”
上述消息发布后,百度股价上涨5.8%,创下近4周以来的最大盘中涨幅。
ChatGPT是由人工智能实验室OpenAI发布的对话式大型语言模型,它可以轻松与人类进行各个领域的对话,回答各种问题,无论是写代码改bug、回答科学问题,还是写论文、写文章都不在话下。ChatGPT被认为会颠覆现有搜索引擎的商业模式,吸引了微软公司的高度关注和合作兴趣,并促使谷歌公司在内部发布了“红色代码”警报。
名称尚未确定
一位熟悉此事的人士向彭博社透露,百度计划在3月首次推出ChatGPT式的应用程序,最初将其嵌入百度主要的搜索服务中,该人士要求在讨论私人信息时不透露身份。该工具的名称尚未确定,将允许用户获得对话式的搜索结果,很像ChatGPT。
百度多年以来已经花费数十亿美元研究人工智能。该人士称,经过数年数据训练的大规模机器学习模型文心大模型,将成为百度即将推出的类似ChatGPT的工具的基础。
百度的一位代表拒绝就彭博社的报道发表评论。
ChatGPT自去年11月公开亮相以来,已经点燃了互联网,在几天内积累了超过一百万用户,并引发了一场关于人工智能在学校、办公室和家庭中作用的辩论。包括微软在内的公司正在投资数十亿美元,尝试开发现实世界的应用,而其他公司则在利用这种炒作来筹集资金。在宣布将ChatGPT纳入其内容的计划后,美国病毒式新闻网站Buzzfeed的股价本月上涨了一倍多。
在移动广告、视频和社交媒体等领域日益落后于其较大的竞争对手之后,百度一直试图在移动时代恢复增长。除了人工智能方面的研究,它还在开发自动驾驶技术。
根据彭博社看到的一份记录,百度首席执行官李彦宏在去年12月的一次内部谈话中提到了ChatGPT,作为该科技巨头可以发挥领导作用的一个例子。“我很高兴,我们每天都在思考的技术能够吸引这么多人的注意。这并不容易。”他说。但他警告说,通过使生成性人工智能成为“每个人都需要的产品”来实现商业化可能是一个挑战。
ChatGPT也引起了中国网民的极大兴趣,很多人在社交媒体上分享了与ChatGPT对话的截图。除百度外,几家中国初创公司也在探索生成性人工智能,并吸引了红杉和Sinovation Ventures等投资者。
百度:搜索的未来是“检索+生成”
在1月初的媒体沟通会上,百度搜索杰出架构师辜斯缪提出搜索领域的三个重点技术趋势:第一是搜索从信息检索到检索+生成的混合系统。第二是搜索变成跨模态的理解和交互,搜索将以图片、视频、音频等各种媒介形式理解用户输入的信息。第三是在知识的理解和组织基础上完成搜索。
就“检索+生成”的技术趋势而言,“目前,搜索系统的设计逻辑还是在互联网的生态领域找到用户需要的信息反馈给用户,但我们认为,未来更有可能是‘检索+生成’的模式。”辜斯缪举例称,生成一个像“高智商”或知识储备丰富的人的人工智能,将百度搜索中的信息理解处理后提供给用户,“我们认为它最终提供的服务质量会远高于现在待机下的搜索服务质量”。
另外,对比原来单元对话式的搜索模式,即搜索一个问题得到一个结果,未来的搜索模式可能变成多轮交互形式,“这跟对话式的多轮不一样,它不追求聊天,而是让用户可以更高效地向搜索引擎提出需求,同时让搜索迭代和调整适应用户需求。比如搜索一张图片,再用语言告诉搜索引擎怎么修改这张图片,最后产生一个真正定制化的答案。”辜斯缪说。
据辜斯缪介绍,百度搜索今年最重要的工作是要把整个检索系统变成“检索+生成”双模系统。具体从终端用户体验而言,变化主要体现在三个方面。
第一,搜索结果的信息整合推理效果明显提升。比如现在用百度搜索“秦始皇和汉尼拔两个人谁的年纪比较大”,可能得不到一个理想的答案。这个问题实际上对人来说更容易,只要查秦始皇和汉尼拔的出生年月就可以得到答案。而在“检索+生成”系统下,其通过检索获取基础信息,再通过生成整理组织答案最终呈现,就会得到更好的效果。
第二,搜索有了创作能力。比如个人想要的水墨画风格的兔子头像,但互联网上不存在这样的资源,那么通过生成技术未来就可以通过搜索解决。
第三,个性化内容体验。“简单来说,就是同样一个答案呈现给不同的用户的描述方式不同。”辜斯缪举例,百度搜索“天空为什么是蓝色”,目前所有人都会得到一个结果,但未来可能可以通过生成技术提供给儿童用户能通俗理解的答案,还可以再配合其他的场景设计如TTS(文本到语音)让它朗读出来。如果用户是精英人士,那么就可以呈现一个更高效简洁的答案。
如何解决生成模型的成本和答案准确性问题?
众所周知,像ChatGPT这样的模型有其局限性,最核心的有两点:回答准确性与搜索成本。“ChatGPT的预训练依托于大型语料库,而语料库来源于互联网上实际发生的语言使用场景。一方面,这使其无法避免地带有虚假信息、歧视偏见信息,另一方面,也往往容易忽略冷门信息。”上海人工智能研究院研究员陈逸君表示。
辜斯缪认为解决思路主要有两点,第一,不纯粹做生成模型,而是“检索+生成”,搜索引擎本身就可以让其更好地验证自己的能力边界,判断正确性。第二,从模型本身来说,关键在于对答案可解释性的判断是否到位。
“从技术上,我们在构建模型训练任务时,需要设置两个训练的目标。一方面让它可以给出一个真实且流畅的答案。另一方面让它能够更好地判断对于这个答案的自信度,或者对于这个知识本身来源的判断。我们可能会通过多任务学习,最终综合达到更好的效果。”辜斯缪说。
同时,当检索结果有争议甚至有更高风险时,就回归到正常的检索效果,“因为生成目前来看不是不可或缺的环节。”辜斯缪补充道。
对于成本问题,摩根士丹利的分析师布莱恩·诺瓦克(Brian Nowak)估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。
辜斯缪也坦诚,“这个技术确实很贵”。另一方面,“具体落地时也还有很多优化空间,我们现在已经考虑的很多优化方案可以大幅降低它的单次服务成本。同时,我们确实也需要投入一定比例的资源,才能去支撑这个事情最终做下来。”
目前来看,有两个核心技术参数决定了最终需要多大的投入,第一个是模型本身的规模,第二个是最终交互的请求量。“我们目前判断,除了产品设计上有很多优化空间外,技术本身的演进也会使模型效率提升。很可能最终我们不需要那么大的模型(GPT3.0版本),就能够提供非常好的服务,近期也会有大量技术成果诞生来解决这个问题。如果攻克了这个问题,对应的成本就会有大幅度的下降。”辜斯缪分享道。