首页 > 科技快讯 > 对标ChatGPT，百度敲响战鼓

对标ChatGPT，百度敲响战鼓

晰数塔互联网快讯
2023-03-17 22:10

来源：中国新闻周刊

中国大语言模型开始出击

近日，大洋两岸，两家极具代表性的科技企业几乎同时地向通用人工智能迈进了坚实的一步，OpenAI宣布发布多模态预训练大模型GPT-4，百度测试新一代大语言模型、生成式AI产品文心一言。

以数学解题能力为例，令ChatGPT和文心一言同样解答一个奥数题：一桶油连桶重16千克，用去一半后，连桶重9千克，桶重多少千克？二者的回答如下。

2月以来，由美国人工智能公司OpenAI推出的大语言模型ChatGPT持续火热，席卷全球。这款“AI神器”自去年11月30日正式发布以来，用户规模已达到1亿，成为互联网发展史上用户增长最快的消费级应用。

随着ChatGPT的走红，大语言模型和生成式AI已成为新的技术范式，全球每一个行业、每一家企业都在思索AI带来的新变革。国内互联网公司同样意识到一场人工智能技术浪潮即将兴起。如何面对ChatGPT带来的发展机遇与挑战，成为大众关注的焦点。

3月16日下午，百度围绕新一代大语言模型、生成式AI产品文心一言进行公开测试。百度创始人、董事长兼首席执行官李彦宏展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。这意味着扎根于中国市场的大语言模型诞生了。

对标ChatGPT，中国大语言模型出击

去年，自ChatGPT正式发布以来，被业内人士看作是AI技术实现了质的飞跃。这款产品属于自然语言处理模型，通过数据训练和模型的持续调整，在海量文本语料库的训练中，最终能够通过学习和理解人类的语言来进行对话。

在这种对话中，普通用户感受到了AI的强大。一位内容从业者曾经形容ChatGPT是一个24小时不间断学习的机器人，一位学者则指出，ChatGPT令大家看到了AI的进步，聊天机器人从最开始的初级加工升级为生产结构化语义文本。

源码资本合伙人黄云刚曾表示，从应用的多样性和对行业可能产生的巨大变化看，ChatGPT有iPhone诞生时刻的潜力。它于2022年11月发布，标志着AI行业进入大众视野，但现在仍处非常早期的阶段。比尔·盖茨非常积极地表态，“ChatGPT的意义不亚于PC或互联网的诞生”，马斯克认为ChatGPT的发明不亚于iPhone的出现。

一切源于ChatGPT的快速崛起，目前，大语言模型和生成式AI代表了一个新技术范式，是全球每家企业都不可错过的机会。

根据相关报道，OpenAI推出“深度学习的最新里程碑”GPT-4，这是一款大型多模态模型，与ChatGPT所用的模型GPT-3.5相比，它的文本处理量扩大至2.5万个单词，还增加了图片处理功能。在官方介绍中，在公司内部的对抗性真实性评估中，GPT-4的得分比GPT-3.5高40%，相应的“不允许内容请求的倾向”降低了 82%，根据政策响应敏感请求（如医疗建议和自我伤害）的频率提高了29%。这被OpenAI称为“里程碑”式的模型。

3月16日，百度发布的新一代大语言模型、生成式AI产品文心一言正式进行邀请测试。李彦宏公开表示，文心一言对标ChatGPT、甚至是对标GPT-4，也是全球大厂第一个做出来的类ChatGPT产品。他认为这款产品“不完美”，但是市场上有需求，从搜索到智能云，很多合作伙伴都需要这款产品，截至目前，有超过650家合作伙伴宣布加入文心一言生态。

值得注意的是，因为对标ChatGPT，所以门槛很高，国产ChatGPT的到来，实际上也是以百度为代表的互联网公司看到了大语言模型未来的发展前景。

时隔6年后李彦宏公开接受采访，表示过去这一年多，人工智能领域发生了比较明显的变化，就是从过去的判别式的人工智能，转向了生成式的人工智能，也就是说“你提一个要求，人工智能可以产生符合你要求的东西，不管是文字、图片，还是视频”。

李彦宏也展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。这也是大模型比较通用的优势能力。在中文理解能力方面，文心一言解释了成语“洛阳纸贵”的意思，还用“洛阳纸贵”四个字写了一首藏头诗。文心一言明显具备本土特色，在中文世界优势明显。

这不是速成的游戏

事实上，无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。

ChatGPT的发展就经历了漫长的发展过程，2018年OpenAI首次发布了一个机遇Transformer架构的语言模型GPT-1，这时候给它一个给定的输入问题，可以生成一段连贯的文本；2019年推出了GPT-2模型，这时含有1.5亿个参数，能够实现更加流畅、自然的文本；到了2020年，GPT-3除了可以生成流畅、自然的文本，还能够用于各种自然语言处理人物，并且进行简单的推理和判断；在今年2月，横空出世的GPT-3.5能够聊天、写诗、回邮件等，已经出圈。

据OpenAI的公开信息显示，GPT-3模型有1750亿的训练参数，数据量达到45TB。它一次训练的费用就可能超过1000万美元，而上百人的团队和算力支持的成本，一年可能耗资10亿。目前OpenAI没有公开GPT-4的参数数量及运行成本，不过根据媒体报道，由于OpenAI新的聊天机器人接受了更多数据训练，其成本将会增加。

不止是ChatGPT耗费巨大的人力、物力和财力，百度在自然语言处理领域，投入多年，具备先发优势。早在2019年，百度就推出了文心大模型ERNIE1.0，到了ERNIE3.0已经每天接受数十亿用户的搜索请求以及各类训练。

有研究表明，数据规模足够大，参数达到千亿级，大模型就可能发生“智能涌现”，即使在没有专门训练过的领域，也能涌现出知识理解和逻辑推理能力。

在商业文案创作场景中，文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。连续三次内容创作生成中，文心一言既能准确理解人类意图，又能清晰地表达，这是基于庞大数据规模而发生的“智能涌现”。

文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等，这让百度在中文语言的处理上，能够处于独一无二的位置。

某种程度上文心一言具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及，这类大语言模型还远未到发展完善的阶段，进步空间很大，未来这段时间它一定会飞速发展，日新月异。

一位资深学者曾表示，在中文世界中，少数互联网公司如百度、腾讯和字节跳动等能够做到如此高的投入，并且具备较好的数据基础，但摆在他们面前最大的挑战在于，中文数据存在质量不高、数据较少以及版权受限等问题，再造一个中国版ChatGPT并非易事。

此外，从技术上来看，人类进入人工智能时代，IT技术的技术栈发生了根本性变化。过去基本分为三层：芯片层，操作系统层和应用层。现在可以分为四层：芯片层、框架层、模型层和应用层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，到搜索、智能云、自动驾驶、小度等应用，各个层面都有较为领先的自研技术。

“从某种意义上说我们已经为此准备了多年，我们十几年前就开始投入AI研究”，李彦宏如此说到。

真正的机会在哪里？

自2月份百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到，文心一言和生成式AI代表了一个新的技术范式，它会影响到每一家公司。

根据中信建投证券研报显示，创造是生成式AI的核心，本质是对生产力的大幅度提升和创造。生成式AI是“最有商业前景的人工智能技术”，根据第三方机构Gartner发布的2022年人工智能技术成熟度曲线，预计生成式AI将会在2到5年内进入生产成熟期，发展潜力与应用空间巨大。

在这项预测中，2025年，生成式AI产生的数据将占到所有数据的10%，30%的大型组织出战消息将由生成式AI生成，50%的药物发现与研发将使用生成式AI，到了2027年，30%的制造商将使用生成式AI提高产品研发效率。

AI市场爆发性的需求增长，将释放出前所未有的、指数级的商业价值。李彦宏预测，大语言模型将带来三大产业机会。

第一类是新型云计算公司，其主流商业模式从IaaS变为MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来，更多会看框架好不好、模型好不好，以及模型、框架、芯片、应用这四层之间的协同。文心一言将通过百度智能云对外提供服务，帮助企业构建自己的模型和应用，农业、工业、金融、教育、医疗、交通、能源等重点领域，都会因此效率大幅提升，并在每一个行业快速形成新的产业空间，助力数字中国的实现。

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们可以基于对行业的洞察，调用通用大模型能力，为行业客户提供解决方案。这方面，百度文心大模型已经在电力、金融、媒体等领域，发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。李彦宏断言，对于大部分创业者和企业来说，真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型，这很不现实，也不经济。基于通用大语言模型抢先开发重要的应用服务，这可能才是真正的机会。目前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。

一位在生成式AI领域的创业者分析，大语言模型作为一款产品出圈只是一个现象，而它背后的技术走向成熟，可能带来商业模式的颠覆和创新。有些垂直领域（比如搜索引擎）的商业基础或许会被动摇，收入壁垒被AIGC颠覆；整个产业链的上下游利益有可能会被重新分配，市场份额落后的企业可能有更大的动力和积极性利用这类技术实现产品和业务的升级，从而实现行业内的反超。

他表示，创业公司仍可以站在巨人的肩膀上，利用对垂直行业痛点的了解和特有数据的壁垒，结合提示学习等底层算法，创造更加专业的规模化平台化的AIGC商业应用。同时，随着数据处理量的增长、算法的进步、针对性反馈的累计，未来AIGC可能有机会进入更多存在严格标准答案、可量化衡量的业务领域中，比如生物医药研发、工程设计和法律实践。

“我们相信，人工智能会彻底改变我们今天的每一个行业。AI的长期价值，对各行各业的颠覆性改变，才刚刚开始。未来，将会有更多的杀手级应用、现象级产品出现，将会有更多的里程碑事件发生。”李彦宏说道。

作者：子青

运营编辑：马晓轶

发布于：北京