作者:Daniel Li
出品:CoinVoice
人工智能研究公司 OpenAI 上周正式推出ChatGPT,这是一种基于对话的人工智能聊天机器人模型,它能够理解自然语言并以自然语言的方式做出回应。自ChatGPT公测以来,一些网友纷纷试水,各种千奇百怪的问题和新奇的玩法都被网友晒了出来,ChatGPT也凭借着既能玩梗、写诗、写剧本、又能给程序找bug的惊艳才能征服了一众网友,甚至连马斯克也忍不住询问ChatGPT怎么设计Twitter,一时间ChatGPT成为了时下区块链行业最热门的话题,而与之相关的AIGC(人工智能生产内容)行业也再度兴起。
ChatGPT是大型人工智能语言模型
ChatGPT是一款以 InstructGPT 为基础的人工智能语言模型,它能进行自然语言理解和生成,并具有高度的智能化和可训练性。ChatGPT以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求,能以更贴近一般人的对话方式与使用者互动。
ChatGPT 是OpenAI的GPT(Generative Pre-trained Transformer )自然语言生成式模型的最新衍生品,而GPT是一种基于互联网可用数据训练的文本生成深度学习模型,它用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。GPT目前已经迭代到了第三代,第四代GPT-4也即将上线。
GPT发展史
GPT-1诞生于2018年,这一年也是 NLP(自然语言处理)的预训练模型元年。在性能方面,GPT-1 有着一定的泛化能力,能够用于和监督任务无关的 NLP 任务。其常用任务包括:自然语言推理、问答与常识推理、语义相似度识别、分类。
GPT-2出现于2019年,GPT-2 并没有对原有的网络进行过多的结构创新与设计,只使用了更多的网络参数与更大的数据集,在性能方面,除了理解能力外,GPT-2 在生成方面第一次表现出了强大的天赋:阅读摘要、聊天、续写、编故事,甚至生成假新闻、钓鱼邮件或在网上进行角色扮演通通不在话下。
GPT-3发布于2020年,作为一个自监督模型,几乎可以完成自然语言处理的绝大部分任务,在参数上,GPT-1包含了1.17亿个参数,GPT-2包含了15亿个参数,而GPT-3比前身多出了100倍,数量突破到了1750亿个参数。在性能方面,GPT-3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说 GPT-3 似乎已经满足了我们对于语言专家的一切想象。
GPT-4目前还没推出,不过坊间传闻GPT-4预计很快就会出现,并且传闻中还提到GPT4已经通过了图灵测试,而所谓的图灵测试目的是测试机器能否表现出真人一样的智能水平,GPT-4通过了图灵测试,则表示GPT-4已经具备了真人一样的智力水平。或许从GPT-4开始,真正的人工智能时代将要到来。
ChatGPT和GPT的区别
ChatGPT和GPT都是由 OpenAI 训练的大型语言模型,ChatGPT是基于GPT-3模型的衍生品,因为这一点ChatGPT也被称为GPT-3.5,但是在实际功能和应用方向上ChatGPT和GPT系列还是有一些关键的区别。
GPT是最强大的语言模型之一,目前已经发展到了第三代。它可以针对各种自然语言处理任务进行微调,包括语言翻译、文本摘要和问答,侧重于综合语言服务。而ChatGPT是专门为聊天机器人应用程序设计的GPT-3模型变体。它在大型对话文本数据集上进行了训练,因此能够生成更适合在聊天机器人上下文中使用的响应。
在性能方面,ChatGPT不如GPT强大,但它更适合聊天机器人应用。它通常也比 GPT更快、更高效,这使其在实时聊天机器人系统中成为更好的选择。总体而言,ChatGPT 和GPT都是强大的语言模型,但它们的设计目的不同,各有所长。
ChatGPT可以带来哪些改变
ChatGPT背后的训练除了常规的万亿级别语料投喂之外,还依托了更为强大的算力,总算力消耗大约为3640PF-days,除此之外,ChatGPT有两个较为明显的思路。即引入“人工标注数据+强化学习”。这也使得ChatGPT可以在不断积累数据的同时,通过不断的强化训练,让自己变的更加智能。ChatGPT所带来的改变不仅是为下一代智能搜索引擎发展提供了思路,还将助力AIGC(人工智能生产内容)行业进一步向前发展。
ChatGPT开创了搜索引擎的新范式
自ChatGPT发布以来便吸引了全球科技圈的目光,其用户量在短短数天便增长上百万,而ChatGPT通过与用户交流的方式,充分挖掘用户真实需求,提出针对性的答案也为未来搜索引擎提供了新范式,ChatGPT也被认为是最有可能取代谷歌的下一代智能搜索引擎。
人们在ChatGPT和谷歌上就相同的一个问题就行检索,通过对比发现ChatGPT往往可以给出用户最想要的答案,并且答案呈现的方式也非常直接,如ChatGPT可以根据用户编程的需求直接生成代码,同时也可以帮助用户检索已有代码存在的错误。而面对同样的问题谷歌却只能给用户提供一堆网页链接,运气好或许可以找到类似问题的处理教程,这无疑会花费用户更多的时间寻找答案。从时间成本和效率上ChatGPT无疑比现有绝大多数的搜索引擎更有优势。
有人甚至将ChatGPT比喻为“搜索引擎+社交软件”的结合体,能够在实时互动的过程中获得问题的答案,ChatGPT所带来的搜索引擎新范式也让其在寻找答案、解决问题的效率上超越了百度、谷歌等平台,但是ChatGPT目前还处在早期发展阶段,数据的收集还仅限于2021年之前的资料,想要取代谷歌成为下一代智能搜索引擎,ChatGPT还有很长的一段路要走。
ChatGPT或将威胁常规内容生产者
ChatGPT另一个惊艳的表现是在语言组织能力、文本水平、逻辑能力上,一些用户甚至打算把日报、周报、总结反思类的工作,都交给ChatGPT辅助完成。除了在文本创作上,ChatGPT还能给程序员的代码找Bug,一些开发者在试用中表示,ChatGPT针对他们的技术问题提供了非常详细的解决方案,比一些搜索软件的回答还要靠谱。
ChatGPT更利好创新型内容创作者,基于调查研究和访谈类型的内容,是很难被ChatGPT所取代的。真正面临威胁的是常规性质的内容创造者,如总结报告、基础的程序编写等此类常规性质的内容,ChatGPT已被证实有不输于人类的能力,并且从时间和成本上看ChatGPT无疑比人类更有优势。就在ChatGPT公测不久,国内程序员社区 V2EX 就有用户就在「程序员」节点发表了一则帖子,名为《体验了下 chatGPT,越玩心越凉》,心凉的背后是,越来越多证据显示 ChatGPT 在代码编写上的优秀能力,底下的评论则大部分是吐槽自己卷赢了同事,却最终输给了AI。
但是从另一方面看,ChatGPT也带来了更多的好处,从辅助索引到内容呈现,ChatGPT极大地提高了阅读搜集材料的效率,打破了知识的壁垒,当人们想要了解或掌握某一项知识时,不用再像过去一样交学费报班学习,ChatGPT可以给出专业的指导。此外ChatGPT的出现也促使了内容创作者不断的探索创造新的内容,让内容创作向更好的方向发展。
ChatGPT助力AIGC行业进一步向前发展
AIGC是指利用人工智能技术来生成内容,和此前Web1.0、Web2.0时代的UGC(用户生产内容)和PGC(专业生产内容)相比,代表人工智能生产内容的AIGC,是新一轮内容生产方式的变革。
AIGC真正的大火是源于AI+绘画应用的出现,在2022初推出至今短短的几个月内已经孕育了好几个独角兽,众多的资本也开始疯狂涌入到这一领域,ChatGPT本身也属于AIGC领域的实际应用,并且ChatGPT突出的文本编辑能力也为AIGC在文本领域商业化应用提供了可能,相信不久以后一些由AI创造的小说、新闻将会很快出现在大众面前。
AIGC对于创作的替代,降低了创作门槛,为元宇宙数字内容的丰富打下基础。在此之上,ChatGPT所展示了作为生产力的存在,或许在未来会改变获取信息的方式,成为AIGC新时代的用户入口。而ChatGPT的火爆也助力了AIGC行业进一步向前发展。
ChatGPT存在的问题
ChatGPT的出现让AIGC行业再度兴起,随着越来越多的人开始关注这一行业,ChatGPT所暴露出来的问题也愈发明显,虽然ChatGPT成功的回答了CNN提交的问题,但是一些回答明显不对。作为人工智能的ChatGPT可以回答涵盖人类所涉及的各个学科的问题,但是ChatGPT并不是专家,它无法确保给出的建议或答案是正确的,一些人想要它发挥更多作用,甚至攻克人类尚且无法解决难题的想法恐怕要落空了,至少当前的ChatGPT还不具备这项能力。
ChatGPT造成垃圾答案泛滥成灾
Stack Overflow——全世界第二大程序员交友网站,正在面临ChatGPT源源不断生成垃圾答案的威胁,一些社群成员利用ChatGPT生成的答案随意地发布到网站上,然而为了判断这些答案的对错,避免用户被误导,Stack Overflow就需要安排大量专业人员进行考证,对此疲于应付的Stack Overflow不得不宣布,暂时禁止用户分享来自 ChatGPT 的信息,这些表明了,在涉及一些专业领域或当用户对于答案精准度有要求时,ChatGPT目前还不被信任。当前它在人们心中的定位还只是一个人机聊天的工具。
ChatGPT的回答可能会无意识的伤害到某一群体
除了传播不正确信息的问题之外,ChatGPT语言模型的运行机制也很容易给出看似合理但不正确或荒谬的答案,市场研究公司 ABI Research 的研究主管 Lian Jye Su 曾警告说,聊天机器人的运行“没有对语言的上下文理解,尤其是它缺乏针对特定区域或国家的了解,一些看似正常的回答可能会伤害到某一类人或是表现出偏见的行为。”如关于女性是否需要出门带头巾的问题,ChatGPT的问到可能会造成一部分女性的困扰。
ChatGPT引发社交媒体信任危机
ChatGPT惊人的语言能力也带来了另外一个问题,就是它模糊了人类和AI的界限,当你在社交媒体上与人交流时,你将无法确认对方是否为真实的人类,社交媒体也有可能会因此陷入信任危机。对此Twitter网友@clowwindy就发布了一串推文,讨论了ChatGPT使用泛滥可能导致社交媒体上充斥更多、威胁更大的虚假信息:
ChatGPT虽然存在一些问题,但整体瑕不掩瑜,未来随着GPT的更新迭代,这些问题都会得到解决。而且相比于之前大火的AI绘画,ChatGPT更具有将AI能力与工作流程相结合的潜力,例如ChatGPT与Midjourney等创作工具融合,可以直接输出设计图稿等内容,用户只需要调整自己的需求,就可以促使AI输出更高质量的内容,而ChatGPT也可以在用户不断的反馈中,调整完善自己的答案。
ChatGPT的大火离也不开OpenAI长期以来在AIGC领域的默默耕耘,也正是因为有了前几代GPT的技术积累,ChatGPT才能厚积薄发,一鸣惊人。很多人惊叹于ChatGPT的能力,但其实真正惊艳的还在后面。ChatGPT作为OpenAI未来人机交互领域的新起点,它的推出只是为即将公测的GPT-4作预热,正如如OpenAI CEO Sam Altman 的一句话:“Trust the exponential. Flat looking backwards, vertical looking forwards.” 我们就处在即将起飞的这个点上。