Google可说是全世界最懂AI的公司了,用自家AI打败围棋世界冠军,能翻译133种语言,还引领智慧手机计算摄影风潮,几乎所有Google产品背后都有AI驱动。但最近两个月,Google被OpenAI的聊天机器人ChatGPT抢尽了风头。
能像人类说话的ChatGPT让AI一词彻底出圈,人们对AI的讨论已经从「AI能做什么」慢慢变成「还有什么AI不能做」。8日微软宣布与OpenAI合作将聊天机器人整合成新Bing和Edge,用AI带来全新体验。微软意思很明显:想挑战Google「搜寻一哥」地位,并以对方最擅长的招式与之较量。
手握LaMDA、PaLM、Imagen等AI技术的Google自然不会让微软轻易抢占AI先机。刚结束的Google发表会,展示未来Google Lens、地图、翻译及最重要的搜寻会有全新AI技术,意图重新占领AI高地。一起展示的Bard聊天机器人是最有力的反击,宣告搜寻引擎将进入聊天机器人大战时代。现在谁都别想温和地走进良夜。
不容小觑的Bard
介绍Bard之前,先简单了解基于哪个AI模型。Google两年前发表LaMDA模型引发高关注度,影响力不亚于ChatGPT。LaMDA是全新AI构架,让机器学习更简单、高效和易扩张,甚至到数千节点,并支持多种机器学习任务,如图象辨识、自然语言处理等。
经训练,LaMDA可用接近人类表达和理解力与人对话。由于LaMDA表现太像人类,Google工程师甚至认为它有「自我意识」,闹出不小风波。这也是Google这段时间未趁胜追击聊天机器人先机的原因:不是没能力做,只是LaMDA「疯」起来连Google都会怕。不过Google还是低估人们对AIGC的接受程度,ChatGPT突然爆红敲响了警钟,于是Bard应运而生。发表会前,Google CEO Sundar Pichai就预告Bard的存在。
Bard基于轻量版LaMDA模型,可降低Bard算力,拓展给更多使用者,获更多回馈。和停在2021年的ChatGPT不同,Bard数据库包括最新网络数据,因此Bard能解答现在发生的事,两者数据量Bard比ChatGPT大一级。换句话说,以后电子新品发表会都不用熬夜写稿了,直接叫Bard整理成懒人包即可。
Google展示使用者可直接问Bard问题,不必用关键词搜寻。如果想买车,也能问Bard什么车适合,Bard会从预算、安全性等角度给予不同建议。如果喜欢新能源车,Bard还会依上下文建议选哪种新能源车。这也是Bard的特点:多方面回答,以及强大的上下文理解能力。
将来Bard还会整合至Google搜寻,快速提供答案。如Google展示搜寻「观星时能看到最棒的星座是什么?」Bart会一起展示多个星座特点及观测方法。Google认为,人工智慧回答问题时没有唯一正解(No One Right Answer),因此Bard多角度回答问题、帮助使用者迅速理解大局,比ChatGPT提供唯一看似正确的答案更好。
Bard与其说是聊天机器人,倒不如说是搜寻助理,更专注解决自然语句搜寻困难不准确问题,以及如何归类整合搜寻结果,减少人们时间成本。至于Bard有没有像ChatGPT强大的文本产生能力,还很难依有限展示判断。使用者最关心的问题则是Bard什么时候才能用?Google表示Bard还在内测,几周内会开放大众试用。
10亿人都在用的Google翻译
Google翻译可能是搜寻以外最多人用的产品,Google数据是全世界超过十亿人用Google翻译了解这世界。为了帮助人们更理解外语,Google翻译现在除了提供单词意思,还有更多背景和相关讯息,如展示多个同义词、例句。支持英文、法文、德文、日文和西班牙文5种语言,几周内上线。
Android端Google翻译也会改成阅读性更好的全新设计,更简单操作逻辑让翻译这件事更轻松,出门遇到语言不通时也能从容处理。Google说也会重新设计iOS端Google翻译。另一个重要功能更新是用AI学习能力精准翻译图片文字,且能将翻译过文字与图片背景重新组成图片,比iOS即时文本功能更进一步,Google强调新功能需6GB以上RAM才能做到。
将地球搬上云端
2021年公布的Immersive View功能,现在有更精致建筑模型,且渲染范围更大,真的把整个地球搬到云端。Immersive View结合天气系统,会根据天气预报渲染,沉浸感十足,即日起在伦敦、洛杉矶、纽约、旧金山和东京上线,数月内会有更多城市上线。
另一个元宇宙「基建工程」,是将现实世界和虚拟元素结合,也就是「扩增实境」,Google地图同样启用,不过只有手机可用。街上举起手机,四处环顾,屏幕会显示店家名称,点进商店能查看营业时间、客户评分评价等更详细信息。这不算创新,但支持功能的城市逐步扩充,最终虚拟与现实的桥就会完工。到时用AR眼镜也有类似体验非难事。
或许Google Glass也会复活,完成未竟之业。
Google还宣布Google地图AR导航功能支持全球千余座机场,方便旅客更精准找到目的地。Google也终于重视新能源车主,内置Google地图的新能源车之后会有推荐充电站的功能,真是电动车车主的福音。
Google Lens尽善尽美
人工智慧与镜头结合以前,手机相机只用来拍照摄影,但人工智慧时代,手机相机逐渐取代人眼,有了辨识世界的能力,Google Lens应运而生,商品辨识、即时景点翻译、植物辨识、文字辨识搜寻等,都算在Google Lens职责内。
有全新AI模型帮助,Google Lens也有突飞猛进发展。首先Search your Screen可算「所见就能得」的新诠释,如在社群看到非常可口的蛋糕,不用跳出App,长按电源键唤醒Google智慧助理,点击Search Screen,即可找到蛋糕信息,再搭配新推出的「混合搜寻」(multisearch),就能找到附近有卖蛋糕的地方,满足口腹之欲。
「混合搜寻」在图片辨识基础上,再用文字微调搜寻目标,获得更精准结果,有点像图片版ChatGPT,不过不能连续对话,结果也不一定每次都令人满意。不过这小更新能看到Google自然语言模型的潜质,或许会比ChatGPT更早推出全能型AIGC工具,但不是现在。
搜寻依然是「登月工程」
Google高级副总裁Prabhakar Raghavan介绍更新前,提出有点令人诧异的观点:搜寻依然是「登月工程」。搜寻引擎虽然非常成熟,是大部分网络使用者的日常基础工具,是如此简单、好用、直觉──只要有个搜寻框,想知道什么就直接输入搜寻。
但也是使用方式太简单,要在这基础上不增加使用者负担同时扩大准确度,就变得非常困难。搜寻引擎要付出大量人看不见的努力,才能搜寻时穿越层层无用信息找到答案。Google已在搜寻领域耕耘25年,依然不能保证使用者每次搜寻都找到想要的信息,因此引入AI辅助对改善用户体验、避免不必要的重复数据尤其关键。
Prabhakar Raghavan认为Google帮助人们摆脱单一搜寻方式和语言限制,跳出框架探索更大的世界,并重塑搜寻的意义,且只是开始。而用户对Google的AI化答案满意度如何?从股价看,截至发稿前Google股价下跌7.68%,如果Google要想继续坐稳「搜寻一哥」地位,Bard需要比ChatGPT更快改善搜寻引擎。
编按:本文由《爱范儿》编辑与ChatGPT共同完成。
留言 | Comments