人工智能研究公司 OpenAI 上周正式推出 ChatGPT,这是一种基于对话的人工智能聊天机器人模型,它能够理解自然语言并以自然语言的方式做出回应。
自 ChatGPT 公测以来,一些网友纷纷试水,各种千奇百怪的问题和新奇的玩法都被网友晒了出来,ChatGPT 也凭借着既能玩梗、写诗、写剧本、又能给程序找 bug 的惊艳才能征服了一众网友,甚至连马斯克也忍不住询问 ChatGPT 怎么设计 Twitter,一时间 ChatGPT 成为了时下区块链行业最热门的话题,而与之相关的 AIGC(人工智能生产内容)行业也再度兴起。
ChatGPT 是大型人工智能语言模型
ChatGPT 是一款以 InstructGPT 为基础的人工智能语言模型,它能进行自然语言理解和生成,并具有高度的智能化和可训练性。ChatGPT 以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求,能以更贴近一般人的对话方式与使用者互动。
ChatGPT 是 OpenAI 的 GPT(Generative Pre-trained Transformer)自然语言生成式模型的最新衍生品,而 GPT 是一种基于互联网可用数据训练的文本生成深度学习模型,它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话 AI。GPT 目前已经迭代到了第三代,第四代 GPT-4 也即将上线。
GPT 发展史
GPT-1 诞生于 2018 年,这一年也是 NLP(自然语言处理)的预训练模型元年。在性能方面,GPT-1 有着一定的泛化能力,能够用于和监督任务无关的 NLP 任务。其常用任务包括:自然语言推理、问答与常识推理、语义相似度识别、分类。
GPT-2 出现于 2019 年,GPT-2 并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集,在性能方面,除了理解能力外,GPT-2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。
GPT-3 发布于 2020 年,作为一个自监督模型,几乎可以完成自然语言处理的绝大部分任务,在参数上,GPT-1 包含了 1.17 亿个参数,GPT-2 包含了 15 亿个参数,而 GPT-3 比前身多出了 100 倍,数量突破到了 1750 亿个参数。在性能方面,GPT-3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且 GPT-3 不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说 GPT-3 似乎已经满足了我们对于语言专家的一切想象。
GPT-4 目前还没推出,不过坊间传闻 GPT-4 预计很快就会出现,并且传闻中还提到 GPT4 已经通过了图灵测试,而所谓的图灵测试目的是测试机器能否表现出真人一样的智能水平,GPT-4 通过了图灵测试,则表示 GPT-4 已经具备了真人一样的智力水平。或许从 GPT-4 开始,真正的人工智能时代将要到来。
ChatGPT 和 GPT 的区别
ChatGPT 和 GPT 都是由 OpenAI 训练的大型语言模型,ChatGPT 是基于 GPT-3 模型的衍生品,因为这一点 ChatGPT 也被称为 GPT-3.5,但是在实际功能和应用方向上 ChatGPT 和 GPT 系列还是有一些关键的区别。
GPT 是最强大的语言模型之一,目前已经发展到了第三代。它可以针对各种自然语言处理任务进行微调,包括语言翻译、文本摘要和问答,侧重于综合语言服务。而 ChatGPT 是专门为聊天机器人应用程序设计的 GPT-3 模型变体。它在大型对话文本数据集上进行了训练,因此能够生成更适合在聊天机器人上下文中使用的响应。
在性能方面,ChatGPT 不如 GPT 强大,但它更适合聊天机器人应用。它通常也比 GPT 更快、更高效,这使其在实时聊天机器人系统中成为更好的选择。总体而言,ChatGPT 和 GPT 都是强大的语言模型,但它们的设计目的不同,各有所长。
ChatGPT 可以带来哪些改变
ChatGPT 背后的训练除了常规的万亿级别语料投喂之外,还依托了更为强大的算力,总算力消耗大约为 3640PF-days,除此之外,ChatGPT 有两个较为明显的思路。即引入 “人工标注数据+强化学习”。这也使得 ChatGPT 可以在不断积累数据的同时,通过不断的强化训练,让自己变的更加智能。ChatGPT 所带来的改变不仅是为下一代智能搜索引擎发展提供了思路,还将助力 AIGC(人工智能生产内容)行业进一步向前发展。
ChatGPT 开创了搜索引擎的新范式
自 ChatGPT 发布以来便吸引了全球科技圈的目光,其用户量在短短数天便增长上百万,而 ChatGPT 通过与用户交流的方式,充分挖掘用户真实需求,提出针对性的答案也为未来搜索引擎提供了新范式,ChatGPT 也被认为是最有可能取代谷歌的下一代智能搜索引擎。
人们在 ChatGPT 和谷歌上就相同的一个问题就行检索,通过对比发现 ChatGPT 往往可以给出用户最想要的答案,并且答案呈现的方式也非常直接,如 ChatGPT 可以根据用户编程的需求直接生成代码,同时也可以帮助用户检索已有代码存在的错误。而面对同样的问题谷歌却只能给用户提供一堆网页链接,运气好或许可以找到类似问题的处理教程,这无疑会花费用户更多的时间寻找答案。从时间成本和效率上 ChatGPT 无疑比现有绝大多数的搜索引擎更有优势。
有人甚至将 ChatGPT 比喻为 “搜索引擎+社交软件” 的结合体,能够在实时互动的过程中获得问题的答案,ChatGPT 所带来的搜索引擎新范式也让其在寻找答案、解决问题的效率上超越了百度、谷歌等平台,但是 ChatGPT 目前还处在早期发展阶段,数据的收集还仅限于 2021 年之前的资料,想要取代谷歌成为下一代智能搜索引擎,ChatGPT 还有很长的一段路要走。
ChatGPT 或将威胁常规内容生产者
ChatGPT 另一个惊艳的表现是在语言组织能力、文本水平、逻辑能力上,一些用户甚至打算把日报、周报、总结反思类的工作,都交给 ChatGPT 辅助完成。除了在文本创作上,ChatGPT 还能给程序员的代码找 Bug,一些开发者在试用中表示,ChatGPT 针对他们的技术问题提供了非常详细的解决方案,比一些搜索软件的回答还要靠谱。
ChatGPT 更利好创新型内容创作者,基于调查研究和访谈类型的内容,是很难被 ChatGPT 所取代的。真正面临威胁的是常规性质的内容创造者,如总结报告、基础的程序编写等此类常规性质的内容,ChatGPT 已被证实有不输于人类的能力,并且从时间和成本上看 ChatGPT 无疑比人类更有优势。就在 ChatGPT 公测不久,国内程序员社区 V2EX 就有用户就在「程序员」节点发表了一则帖子,名为《体验了下 chatGPT,越玩心越凉》,心凉的背后是,越来越多证据显示 ChatGPT 在代码编写上的优秀能力,底下的评论则大部分是吐槽自己卷赢了同事,却最终输给了 AI。
但是从另一方面看,ChatGPT 也带来了更多的好处,从辅助索引到内容呈现,ChatGPT 极大地提高了阅读搜集材料的效率,打破了知识的壁垒,当人们想要了解或掌握某一项知识时,不用再像过去一样交学费报班学习,ChatGPT 可以给出专业的指导。此外 ChatGPT 的出现也促使了内容创作者不断的探索创造新的内容,让内容创作向更好的方向发展。
ChatGPT 助力 AIGC 行业进一步向前发展
AIGC 是指利用人工智能技术来生成内容,和此前 Web1.0、Web2.0 时代的 UGC(用户生产内容)和 PGC(专业生产内容)相比,代表人工智能生产内容的 AIGC,是新一轮内容生产方式的变革。
AIGC 真正的大火是源于 AI+绘画应用的出现,在 2022 初推出至今短短的几个月内已经孕育了好几个独角兽,众多的资本也开始疯狂涌入到这一领域,ChatGPT 本身也属于 AIGC 领域的实际应用,并且 ChatGPT 突出的文本编辑能力也为 AIGC 在文本领域商业化应用提供了可能,相信不久以后一些由 AI 创造的小说、新闻将会很快出现在大众面前。
AIGC 对于创作的替代,降低了创作门槛,为元宇宙数字内容的丰富打下基础。在此之上,ChatGPT 所展示了作为生产力的存在,或许在未来会改变获取信息的方式,成为 AIGC 新时代的用户入口。而 ChatGPT 的火爆也助力了 AIGC 行业进一步向前发展。
ChatGPT 存在的问题
ChatGPT 的出现让 AIGC 行业再度兴起,随着越来越多的人开始关注这一行业,ChatGPT 所暴露出来的问题也愈发明显,虽然 ChatGPT 成功的回答了 CNN 提交的问题,但是一些回答明显不对。作为人工智能的 ChatGPT 可以回答涵盖人类所涉及的各个学科的问题,但是 ChatGPT 并不是专家,它无法确保给出的建议或答案是正确的,一些人想要它发挥更多作用,甚至攻克人类尚且无法解决难题的想法恐怕要落空了,至少当前的 ChatGPT 还不具备这项能力。
ChatGPT 造成垃圾答案泛滥成灾
Stack Overflow——全世界第二大程序员交友网站,正在面临 ChatGPT 源源不断生成垃圾答案的威胁,一些社群成员利用 ChatGPT 生成的答案随意地发布到网站上,然而为了判断这些答案的对错,避免用户被误导,Stack Overflow 就需要安排大量专业人员进行考证,对此疲于应付的 Stack Overflow 不得不宣布,暂时禁止用户分享来自 ChatGPT 的信息,这些表明了,在涉及一些专业领域或当用户对于答案精准度有要求时,ChatGPT 目前还不被信任。当前它在人们心中的定位还只是一个人机聊天的工具。
ChatGPT 的回答可能会无意识的伤害到某一群体
除了传播不正确信息的问题之外,ChatGPT 语言模型的运行机制也很容易给出看似合理但不正确或荒谬的答案,市场研究公司 ABI Research 的研究主管 Lian Jye Su 曾警告说,聊天机器人的运行 “没有对语言的上下文理解,尤其是它缺乏针对特定区域或国家的了解,一些看似正常的回答可能会伤害到某一类人或是表现出偏见的行为。” 如关于女性是否需要出门带头巾的问题,ChatGPT 的问到可能会造成一部分女性的困扰。
ChatGPT 引发社交媒体信任危机
ChatGPT 惊人的语言能力也带来了另外一个问题,就是它模糊了人类和 AI 的界限,当你在社交媒体上与人交流时,你将无法确认对方是否为真实的人类,社交媒体也有可能会因此陷入信任危机。对此 Twitter 网友 @clowwindy 就发布了一串推文,讨论了 ChatGPT 使用泛滥可能导致社交媒体上充斥更多、威胁更大的虚假信息:
ChatGPT 虽然存在一些问题,但整体瑕不掩瑜,未来随着 GPT 的更新迭代,这些问题都会得到解决。而且相比于之前大火的 AI 绘画,ChatGPT 更具有将 AI 能力与工作流程相结合的潜力,例如 ChatGPT 与 Midjourney 等创作工具融合,可以直接输出设计图稿等内容,用户只需要调整自己的需求,就可以促使 AI 输出更高质量的内容,而 ChatGPT 也可以在用户不断的反馈中,调整完善自己的答案。
ChatGPT 的大火离也不开 OpenAI 长期以来在 AIGC 领域的默默耕耘,也正是因为有了前几代 GPT 的技术积累,ChatGPT 才能厚积薄发,一鸣惊人。很多人惊叹于 ChatGPT 的能力,但其实真正惊艳的还在后面。ChatGPT 作为 OpenAI 未来人机交互领域的新起点,它的推出只是为即将公测的 GPT-4 作预热,正如如 OpenAI CEO Sam Altman 的一句话:“Trust the exponential. Flat looking backwards, vertical looking forwards.” 我们就处在即将起飞的这个点上。
(声明:请读者严格遵守所在地法律法规,本文不代表任何投资建议)