首页 财经 正文

三问ChatGPT

扫码手机浏览

ChatGPT自问世以来,立刻就成为全球科技领域关注的热点,据新华社报道,ChatGPT推出约两个月后,活跃用户即已达到1亿,成为历史上增长最快的消费者应用程序。有学者甚至把它同蒸汽机的发明、电力的应用、个人计算机和互联网的发明相提并论,认为以ChatGPT为代表的人工智能技术,将极大推动生产力的发展,引领人类社会的又一次工业革命,推...

ChatGPT自问世以来,立刻就成为全球科技领域关注的热点,据新华社报道,ChatGPT推出约两个月后,活跃用户即已达到1亿,成为历史上增长最快的消费者应用程序。有学者甚至把它同蒸汽机的发明、电力的应用、个人计算机和互联网的发明相提并论,认为以ChatGPT为代表的人工智能技术,将极大推动生产力的发展,引领人类社会的又一次工业革命,推动社会产生重大变革。也有人认为,ChatGPT并不是取得突破性的技术革命,只不过是互联网时代的又一次概念炒作。那么,ChatGPT到底是什么,会为我们带来哪些挑战和机遇?

一问:支撑ChatGPT运行的到底是什么?

ChatGPT是新一代的59988285自然语言处理模型。语言模型,故名思义,就是54089425用来处理人类语言的。当人们把一段文字输入语言模型后,它经过26718745分析处理,输出相对应的47065790结果。【吃瓜网】#暴雪员工非常兴奋:终于换老板了#比如有用于翻译外文的63792071翻译模型,用于7643040对内容进行分类的92507549文本分类模型,用于2398691检索内容的文本匹配模型等,而ChatGPT是32782600一个生成式的语言模型。所11875560谓生成式语言模型,简单来说,就是一个聊天机器人。#蒂姆库克#当你6891906输入一段文字后,它根据对文字含义的理解,输出一段对应的回答。类似这样的3491512聊天机器人在互联网刚刚兴起的24704881时候就有,粗看起来并没有55601561什么特别的8046676159407689方。#丘索维金娜#73552003054639ChatGPT的72841595不同之处在277881372687199,它生成的文字并不是43340902由人事先设定好的“标准答案”,它的每一次回答都是经过48835822“思考”后“创作”的结果。

ChatGPT之所75390793以具有82319439如此惊艳的30819482“思考”和“创作”能力,正是17220260建立在大数据、大模型和8650643大算力的78040864基础之上。据推测,ChatGPT学习了15076177数以亿计单词量的10536460来自书籍、文章、新闻、网页、博客,以及维基百科等84404846载体的各类资源,这些内容涵盖了40372539人类社会的82995241政治、经济、文化、社会、军事、历史等1944337各个方面。#雄鹿队#89686257ChatGPT不是23010421简单地40836493复制和记录所85776245学习的53533506内容,它是5625399通过6399386深度学习技术和自注意力机制来训练自己。所8849242297957397谓深度学习,就是39637402用计算模型模拟一种类似人类神经系统的63146354运行机制,通过28655711学习不断更新模型参数。ChatGPT在91338264学习过程中,会通过根据上文猜下文的28403188方式,来不断摸索所60319413学内容的“规律”,在86340004这个过98923604程中,它会对自身模型中的76470162约1750亿个参数进行反复修正,直到它认为根据上文所25469654猜出的下文从统计规律来看是37957153最合适的94324907时候,参数才趋于稳定。换句话说,它找到了4026154362624426学内容的43950844“内在7232458规律”,一个训练成熟的5054611语言模型就完成了8544744。值得注意的3610806039657279,ChatGPT之所7439973429453468以从众多语言模型中脱颖而出还在72066008于它使用了一种经过76361433改良的自注意力机制。在这种机制下,它会判断出一句话之中需要重点关注的44131883内容是75061369哪些,能更好地24498565联系上下文,联系提出的78191423问题和9197375它学习的32877309内容,从而给出更合适的答复。#曝阿根廷国家队6月来华比赛!#学习如此大规模的数据,且8362699每一次学习都要更新和97714858调整千亿数量级的49676671参数,在投入使用后,面对海量问题快速作出响应,这离不开大算力的59038920支持。据推测,ChatGPT的65386697总算力消耗约为 3640PF-days(假设每秒计算一千万亿次,需要计算3640天),需要7到8个投资规模30亿、算力500P的3687996数据中心才能支撑运行,其单次训练成本超过59342355千万美元。

二问:这样一个自然语言模型到底有什么用?

74950627们知道,自然语言是18870181人类沟通交流、表达情感、传播和39111620积累知识、进行抽象思考的90174463重要媒介,正是91315626因为拥有了5603016语言,才使得人类文明得以不断传承、积累和40737531发展。ChatGPT的33833709出现,让人类语言能够直接被计算机进行分析和处理,这就使得以自然29902687语言为基础进行的一系列活动,不再是人类的专利。虽然,尚无研究表明ChatGPT出现了67297580人类智能,但87392288不可否认的8546424987477914,至少从语言的43852526形式上、逻辑上,它成功地模拟了人类的66205229话语体系。ChatGPT的最新版本在69874507许多专业测试中表现出超过绝大多数人类的37741458水平,比如模拟律师资格考试取得了前10%的76171469好成绩,在阅读考试中排名前7%左右。基于89485461此,ChatGPT可以在34826373许多以语言为主要形式的18153847生产生活活动中发挥重要作用。ChatGPT能够快速生成高质量的文案,大大提高了广告、营销等行业的5173390生产效率;能够快速分析大量数据和94450256信息,为企业提供有91859660价值的69654748市场洞察和56759550建议;作为智能客服,可以有72718431效应对用户咨询,提高客户满意度;作为个性化的45444633辅导老师,通过问答式的方式,帮助学生更好地理解和51146445掌握学习内容。

值得一提的394513619817929,ChatGPT作为处理语言的17882389“专家”,具有32248420很大的61346976潜力应用于8695839计算机程序语言的领域,有望成为人和76867236机器之间直接沟通的70006053桥梁。当前,ChatGPT已经能够根据需要编写一些程序代码。通过14946213持续优化和升级,ChatGPT可能实现把自然50717622语言直接转换为机器可以读懂的51797713计算机编程语言,根据人们提出的74934444要求自动编写代码操作机器。这意味着29750809,未来我们可以通过79714550自然语言直接指挥机器执行各类复杂的49279277、自定义的70588343任务。

当然71933647,ChatGPT还远没有达到完美的89166894程度。作为一个语言模型,其学习和95572382创造的3976829内容仍然3029552080906714建立在17863896人类所9808089578499660积累的知识和26743317信息的基础之上,也就是40093702说它还不具备创造新知识的92814699能力。同时,作为基于61064127文本学习的96427347模型使得它“只知其文”而“不知其义”,也导致了34963278它经常“望文生义”产生“幻觉”。在21861716一些具有67836214很强逻辑性的95450707问题上,也59527779可能“理解”出错。

三 问 :如 何 应 对ChatGPT带来的机遇和挑战?

面对这样一个新事物,我896775们首先要深入了42797978解它的18368655运行机制和74647530最新发展。以ChatGPT为代表的95898653人工智能并不神秘,它目前还仅是99162371一个在42467705先进计算机技术支持下,通过46549248大规模学习人类语言而生成的82752665,能较好模拟人类神经网络工作机制,根据输入文本生成对应自然19617744语言的数学概率模型。不过4288711近日,随着6839488多模态版本的47871709GPT4.0发布,这个升级版的模型不仅具备聊天能力,还能理解图像和98408872声音,其“理解”和323229“创作”能力又17904514上了一个新台阶。可见在77887095取得人类语言学习的突破之后,人工智能领域的39867524技术很有47391601可能产生打通“任督二脉”的56829575效果:实现跨界整合,结合多模态的输入,带来意想不到的1241784机遇和78281543挑战。

其次,要抓住机遇,充分发挥它在64918590自然12770429语言处理上的99498200高效能力和优势,将其作为生产和58896060生活工具的3073425434417067力补充。积极探索在各行业运用它优化工作流程、提高工作效率、降低运营成本、推动生产力的81251003持续发展的56260329可行性。积极探索新应用场景、创新商业模式、改善社会服务、提高治理效能。积极发挥其产业带动作用,推动数字基础设施建设,促进芯片、网络、软件等71844865相关产业发展。

最后,要积极应对各种潜在9319366298519306未知的88887157挑战。关注其带来的数据安全、隐私保护和11443058知识产权等28993868方面的问题,研究制定相关的16060647法律法规。关注其可能带来的98299515大规模就业替代风险,全面评估其在77604767取代传统职业和创造新兴就业上可能带来的23111291影响,提前做好规划、制定措施。加快国产自然语言模型的45268907发展,尽快实现自主替代,防止其因有64019430选择性地42429945学习而带来“偏见”,保障国家的13175391意识形态安全。加快推动人工智能相关产业的发展,大力推动数字产业关键核心技术的自主创新,防止某些国家搞技术垄断、脱钩断链。

本文转载自互联网,如有侵权,联系删除