巨头对决:ChatGPT与Google Bard谁更胜一筹?全面对比揭秘!

在人工智能生成文本领域,AIGC有两个最大的竞争对手:ChatGPT和Google Bard。本文将介绍这两种人工智能引擎之间的技术差异。

对于目前的人工智能生成文本领域而言,ChatGPT已经被广泛认知,而Google Bard则相对较为陌生。这意味着尽管我们已经可以利用Bard生成文本,但相比之下,ChatGPT的知名度要高得多。对于普通用户而言,Bard仍然是一种遥不可及的技术。

ChatGPT与Google Bard之战的开始

人工智能领域的两大聊天机器人,ChatGPT和Google Bard,与智能手机上的文本预测功能相比,更加复杂和高级。ChatGPT最初由OpenAI开发,随后得到了微软100亿美元的投资,这使得它的技术和表现都达到了令人瞠目结舌的程度。而Google Bard则是谷歌为了应对搜索垄断的压力而推出的产品,但该产品在首次现场演示中却犯了几个事实性错误,给谷歌带来了一些尴尬。要了解这两款聊天机器人之间的差异,我们需要深入探讨它们之间的技术差异。

ChatGPT与Bard:内藏玄机?

我们可以通过如下表格快速了解它们之间的技术差异,通过表格可以看到很多细节。

ChatGPT

Bard

模型​

GPT-3.5​

LaMDA,即对话应用的语言模型​

神经网络结构​

Transformer​

Transformer​

训练数据​

网络文本,主要是被称为 “common​crawl”的数据集,在2021年中期截止。​

156万字的公共对话数据和网络文本​

目的​

成为一个多用途的文本生成聊天机器人​

专门协助搜索​

参数​

1750亿参数​

1370亿参数​

创建者​

OpenAI​

Google​

优势​

– 对所有人开放​

– 更加灵活,能够处理开放式文本​

– 训练数据截止到2021年​

– 训练数据截止到当前​

– 专门为对话而训练,所以当你和它对话的时候,听起来更像人。​

劣势​

– 对话没有那么有说服力​

– 没有那么仔细的微调​

– 目前还没有​

– 可能不那么适合一般的文本创作

什么是ChatGPT?

ChatGPT于2022年11月30日突然出现在舞台上。到2022年12月4日,该服务每天有超过一百万的用户。2023年1月,这个数字膨胀到1亿多用户。​

它突然这么受欢迎其基本原因是,它能以一种听起来几乎是人类的方式,为你提供许多主题的靠谱回答,而且任何能够上网的人都可以使用它。​

ChatGPT是OpenAI创建的,OpenAI是一家位于旧金山的人工智能实验室,专注于创造友好的人工智能方案。该聊天机器人是基于GPT-3.5开发的,GPT-3.5是一个大型语言模型,当给定文本时,可以持续给请求者提供回复。​

ChatGPT在此基础上增加了一些额外的训练–人类培训师通过与模型的互动改进了模型,并通过”奖励 “的方式让模型具备提供高质量答案的能力。​

训练数据

GPT-3.5是在一个巨大的网络文本数据集上进行训练的,其中包括了许多流行的数据集,其中之一就是Common Crawl。Common Crawl是一个PB级别的网络数据集,包含了原始网页数据、元数据提取和文本提取等内容。在这些数据集中,来自StrataScratch的URLs集合也是其中之一。ChatGPT使用的训练数据则来源于网络用户在ChatGPT上的输入,这听起来是不是有些疯狂?除了Common Crawl,GPT-3.5还利用了其他数据来源,但Common Crawl占据了其中的60%。

什么是Google Bard?

Google Bard是在ChatGPT受到广泛关注的背景下,由Google推出的智能聊天机器人。与ChatGPT不同,Bard是由Google自己的模型LaMDA驱动。LaMDA是对话应用语言模型的简称,与ChatGPT相比,它的表现并不那么惊人,原因很简单,大多数人还无法访问它。虽然Google在今年2月进行了一次令人尴尬的Bard演示,但目前Bard仅对少数人开放。

Google Bard的主要优势是它对互联网开放。问ChatGPT“现在谁是总统?”,它是不知道的。这是因为训练数据在2021年中期左右被切断了。而Bard则是借鉴了今天互联网上的信息。从理论上讲,Bard应该能够从今天互联网上的数据中提取,告诉你现在谁是总统。​

很容易看出Bard在几个关键方面是如何从ChatGPT中脱颖而出的。

训练数据

首先,LaMDA是专门用于对话的语言模型,与GPT-n模型不同,它在对话中进行训练,因此更加擅长处理对话内容。尽管ChatGPT对其训练数据没有隐藏,但我们对Bard所使用的数据仍不太清楚,可以通过研究LaMDA的论文来了解更多信息。据谷歌的研究人员表示,他们使用了12.5%的Common Crawl数据集以及12.5%的维基百科数据,但在研究论文中,他们声称使用了1.56万亿个字的 “公共对话数据和网络文本” 进行训练。​

以下是完整的分类:​

  • 12.5%基于C4的数据(Common Crawl数据的衍生品)。​
  • 12.5%的英语维基百科​
  • 12.5%来自编程问答网站、教程和其他的代码文档​
  • 6.25%的英文网络文档​
  • 6.25%的非英语网络文档​
  • 50%来自公共论坛的对话数据​

从上面的信息可以知道两者共同利用的数据,显然有维基百科。其余的数据明显是Google故意隐藏的,大概是为了保护Bard(和LaMDA)不被模仿。​

LaMDA是通过微调Transformer的神经语言模型而形成的,它是一个最初由谷歌开发的开源神经网络架构。(GPT也是建立在Transformer的基础上)。

ChatGPT在其设计中包含了一些限制条件,以避免产生不必要的废话或令人讨厌的行为。相比之下,谷歌强调保证Bard的质量和安全,通过微调来使其更加贴近人们的需求和口味。Bard被调整为“高质量、接地气和安全”,以确保用户能够获得更好的体验。

谷歌对此有很多说法,我建议阅读他们的相关博文,但如果你时间不多,基本上可以分成如下几个方面:​

  • Bard应该给出有意义的回应–没有荒谬的内容,没有矛盾的内容​
  • Bard应作出有见地、诙谐或出人意料的回应。​
  • Bard应该避免任何有可能对用户造成伤害的东西–血腥、偏见、可憎的刻板印象等​
  • Bard不胡编乱造​

谷歌因为一个错误的发布,仍在探索Bard的底层需求。然而,值得注意的是,谷歌对Bard的设计要求非常明确,而ChatGPT则没有像谷歌那样清晰地阐述其设计要求–至少目前是这样。

ChatGPT与Google Bard对比:模型参数为什么很重要?

ChatGPT和Bard的模型参数数量是不同的,ChatGPT具有1750亿个模型参数,而Bard只有1370亿个。模型参数可以看作是模型用来适应数据的调节旋钮或杠杆。更多的参数通常意味着模型可以更好地捕捉语言中的复杂关系,但这也可能导致过度拟合的问题。虽然Bard可能不像ChatGPT那么灵活,但是由于新的语言应用情况,Bard也可能会变得更加强大。总的来说,模型参数的数量只是模型表现的一个方面,更重要的是它们是否能够有效地处理语言任务。

ChatGPT与Google Bard:共同点?

值得强调的是,Bard和ChatGPT的模型(分别是LaMDA和GPT-3.5)都位于基于Transformer的深度学习神经网络。​

例如,Transformer可以使一个经过训练的模型来阅读一个句子或段落,注意这些词之间的关系,然后预测它认为接下来会出现什么词–类似前面提到的智能手机预测性文本的功能。​

这里就不展开讨论了,但你需要知道的是,这意味着在其核心部分,Bard和ChatGPT彼此之间没有太大区别。​

ChatGPT与Google Bard:所有权

虽然所有权并不完全是一个技术上的差异,但它是值得记住的。​

Google Bard是由Google制作并完全拥有的,在LaMDA之上,LaMDA也是由Google创建的。​

ChatGPT是由OpenAI开发的,这是一家位于旧金山的人工智能研究实验室。OpenAI最初是非营利性的,但它在2019年创建了一个营利性的子公司。OpenAI也是Dall-E的幕后推手,你可能玩过的人工智能文本到图像的生成。​

虽然微软在OpenAI上投入了大量资金,但就目前而言,它是一个独立的研究机构。

ChatGPT和谷歌 Bard哪个好?

这个问题很难给出公平的回答,因为两者相似的地方很多,但也有不同的地方。首先,现在几乎没有人可以访问Google Bard。另外,ChatGPT的训练数据几乎在两年前就被切断了。​

两者都是文本生成器–你提供一个提示,Google Bard和ChatGPT都能回答。两者都有数十亿的参数来微调模型。两者都有重叠的训练数据源,并且都建立在Transformer上,即同一个神经网络模型。​

它们的设计目的也不同,Bard将帮助你浏览谷歌搜索,它被设计为对话式的。ChatGPT可以生成整个博客文章。它的设计是为了输出有意义的文本。​

即便说了ChatGPT和Google Bard之间的差异,那也只能证明人工智能驱动的文本生成技术已经取得了多大进展。虽然它们都有一段路要走,而且都面临着版权和道德方面的争议,但这两个生成器都是现代人工智能模型发展的有力证明。

延伸阅读:

国外接码平台 SMS-Activate 注册 ChatGPT 详细指南,ChatGPT注册百分百成功!

Google AI 人工智能谷歌“巴德” Google Bard 申请攻略教程

Rate this post

留言 | Comments