ChatGPT自问世以来,立刻就成为全球科技领域关注的热点,据新华社报道,ChatGPT推出约两个月后,活跃用户即已达到1亿,成为历史上增长最快的消费者应用程序。有学者甚至把它同蒸汽机的发明、电力的应用、个人计算机和互联网的发明相提并论,认为以ChatGPT为代表的人工智能技术,将极大推动生产力的发展,引领人类社会的又一次工业革命,推动社会产生重大变革。也有人认为,ChatGPT并不是取得突破性的技术革命,只不过是互联网时代的又一次概念炒作。那么,ChatGPT到底是什么,会为我们带来哪些挑战和机遇?
一问:支撑ChatGPT运行的到底是什么?
ChatGPT是新一代的【吃瓜网】 比如有用于翻译外文的 翻译模型,用于 对内容进行分类的 文本分类模型,用于 检索内容的文本匹配模型等,而ChatGPT是 一个生成式的语言模型。所 谓生成式语言模型,简单来说,就是一个聊天机器人。 当你 输入一段文字后,它根据对文字含义的理解,输出一段对应的回答。类似这样的 聊天机器人在互联网刚刚兴起的 时候就有,粗看起来并没有 什么特别的 地 方。 但 是 ChatGPT的 不同之处在 于 ,它生成的文字并不是 由人事先设定好的“标准答案”,它的每一次回答都是经过 “思考”后“创作”的结果。 自然语言处理模型。语言模型,故名思义,就是 用来处理人类语言的。当人们把一段文字输入语言模型后,它经过 分析处理,输出相对应的 结果。
ChatGPT之所 以具有 如此惊艳的 “思考”和“创作”能力,正是 建立在大数据、大模型和 大算力的 基础之上。据推测,ChatGPT学习了 数以亿计单词量的 来自书籍、文章、新闻、网页、博客,以及维基百科等 载体的各类资源,这些内容涵盖了 人类社会的 政治、经济、文化、社会、军事、历史等 各个方面。 但 ChatGPT不是 简单地 复制和记录所 学习的 内容,它是 通过 深度学习技术和自注意力机制来训练自己。所 谓深度学习,就是 用计算模型模拟一种类似人类神经系统的 运行机制,通过 学习不断更新模型参数。ChatGPT在 学习过程中,会通过根据上文猜下文的 方式,来不断摸索所 学内容的“规律”,在 这个过 程中,它会对自身模型中的 约1750亿个参数进行反复修正,直到它认为根据上文所 猜出的下文从统计规律来看是 最合适的 时候,参数才趋于稳定。换句话说,它找到了 所 学内容的 “内在 规律”,一个训练成熟的 语言模型就完成了 。值得注意的 是 ,ChatGPT之所 以从众多语言模型中脱颖而出还在 于它使用了一种经过 改良的自注意力机制。在这种机制下,它会判断出一句话之中需要重点关注的 内容是 哪些,能更好地 联系上下文,联系提出的 问题和 它学习的 内容,从而给出更合适的答复。 学习如此大规模的数据,且 每一次学习都要更新和 调整千亿数量级的 参数,在投入使用后,面对海量问题快速作出响应,这离不开大算力的 支持。据推测,ChatGPT的 总算力消耗约为 3640PF-days(假设每秒计算一千万亿次,需要计算3640天),需要7到8个投资规模30亿、算力500P的 数据中心才能支撑运行,其单次训练成本超过 千万美元。
二问:这样一个自然语言模型到底有什么用?
我 们知道,自然语言是 人类沟通交流、表达情感、传播和 积累知识、进行抽象思考的 重要媒介,正是 因为拥有了 语言,才使得人类文明得以不断传承、积累和 发展。ChatGPT的 出现,让人类语言能够直接被计算机进行分析和处理,这就使得以自然 语言为基础进行的一系列活动,不再是人类的专利。虽然,尚无研究表明ChatGPT出现了 人类智能,但 不可否认的 是 ,至少从语言的 形式上、逻辑上,它成功地模拟了人类的 话语体系。ChatGPT的最新版本在 许多专业测试中表现出超过绝大多数人类的 水平,比如模拟律师资格考试取得了前10%的 好成绩,在阅读考试中排名前7%左右。基于 此,ChatGPT可以在 许多以语言为主要形式的 生产生活活动中发挥重要作用。ChatGPT能够快速生成高质量的文案,大大提高了广告、营销等行业的 生产效率;能够快速分析大量数据和 信息,为企业提供有 价值的 市场洞察和 建议;作为智能客服,可以有 效应对用户咨询,提高客户满意度;作为个性化的 辅导老师,通过问答式的方式,帮助学生更好地理解和 掌握学习内容。
值得一提的 是 ,ChatGPT作为处理语言的 “专家”,具有 很大的 潜力应用于 计算机程序语言的领域,有望成为人和 机器之间直接沟通的 桥梁。当前,ChatGPT已经能够根据需要编写一些程序代码。通过 持续优化和升级,ChatGPT可能实现把自然 语言直接转换为机器可以读懂的 计算机编程语言,根据人们提出的 要求自动编写代码操作机器。这意味着 ,未来我们可以通过 自然语言直接指挥机器执行各类复杂的 、自定义的 任务。
当然 ,ChatGPT还远没有达到完美的 程度。作为一个语言模型,其学习和 创造的 内容仍然 是 建立在 人类所 积累的知识和 信息的基础之上,也就是 说它还不具备创造新知识的 能力。同时,作为基于 文本学习的 模型使得它“只知其文”而“不知其义”,也导致了 它经常“望文生义”产生“幻觉”。在 一些具有 很强逻辑性的 问题上,也 可能“理解”出错。
三 问 :如 何 应 对ChatGPT带来的机遇和挑战?
面对这样一个新事物,我 们首先要深入了 解它的 运行机制和 最新发展。以ChatGPT为代表的 人工智能并不神秘,它目前还仅是 一个在 先进计算机技术支持下,通过 大规模学习人类语言而生成的 ,能较好模拟人类神经网络工作机制,根据输入文本生成对应自然 语言的数学概率模型。不过 近日,随着 多模态版本的 GPT4.0发布,这个升级版的模型不仅具备聊天能力,还能理解图像和 声音,其“理解”和 “创作”能力又 上了一个新台阶。可见在 取得人类语言学习的突破之后,人工智能领域的 技术很有 可能产生打通“任督二脉”的 效果:实现跨界整合,结合多模态的输入,带来意想不到的 机遇和 挑战。
其次,要抓住机遇,充分发挥它在 自然 语言处理上的 高效能力和优势,将其作为生产和 生活工具的 有 力补充。积极探索在各行业运用它优化工作流程、提高工作效率、降低运营成本、推动生产力的 持续发展的 可行性。积极探索新应用场景、创新商业模式、改善社会服务、提高治理效能。积极发挥其产业带动作用,推动数字基础设施建设,促进芯片、网络、软件等 相关产业发展。
最后,要积极应对各种潜在 和 未知的 挑战。关注其带来的数据安全、隐私保护和 知识产权等 方面的问题,研究制定相关的 法律法规。关注其可能带来的 大规模就业替代风险,全面评估其在 取代传统职业和创造新兴就业上可能带来的 影响,提前做好规划、制定措施。加快国产自然语言模型的 发展,尽快实现自主替代,防止其因有 选择性地 学习而带来“偏见”,保障国家的 意识形态安全。加快推动人工智能相关产业的发展,大力推动数字产业关键核心技术的自主创新,防止某些国家搞技术垄断、脱钩断链。