智能体的出现是否意味着每个人都能成为AI应用开发者呢?

智能体到来,人人都能成为AI应用开发者吗?_图1

初夏的深圳国际会展中心,人们热情洋溢的氛围中迎来了一场盛大的百度AI展示活动。百度创始人李彦宏以及其他重要业务负责人在Create 2024百度AI开发者大会上,向所有关注百度产品和AI技术的人们展示了最新的实力。

去年三月份,百度文心一言发布;随后十月份的百度世界大会上,王海峰详细介绍了文心大模型4.0的技术创新。一年来,文心大模型的发展情况如何,是否有了新的突破,成为了人们关注的焦点。

王海峰是这场阅兵仪式上最重要的人之一。现在人们渴望从这位百度AI的领航人口中,了解百度这家中国人工智能的领头雁,进展到了什么阶段。

如果这篇文章可以用一句话总结,那就是,在这次盛会上,人们终于认识到AI技术已经成为必不可少的技能。

01

从思考到执行,智能体是指具备思考和执行能力的实体。

自2023年3月16日文心一言发布以来,百度不断进行技术创新,对文心大模型进行迭代升级。通过增强知识和检索功能,进一步发展出了知识点增强功能。借助飞桨平台提供的更大算力、更多数据和更强算法的支持,文心大模型从3.0、3.5版本升级到了4.0版本,其能力得到了显著增强,效果和性能也得到了全面提升。

这些介绍未免过于笼统,具体增强了哪些能力,以实际产品和应用效果来谈更加具体和易于理解。

最显著、也最让人能够深刻体会到科幻感的一个变量,就是智能体。本来这已经是一个备受关注的话题,这次大会更加让人真切地感受到了智能体的强大力量。

智能体是指具备理解、规划、反思和进化能力的实体,使得机器能够像人一样思考和行动,能够自主地完成复杂任务,并在不断学习的环境中实现自我迭代和进化。

从这个定义上来看,智能体的思考模式就已经和生物大脑同频了。而百度还将这一过程白盒化,让用户能够清楚看到,每一次输入需求后,大模型是如何理解的,又是如何经过思考调用工具来完成任务的。

王海峰也在会上展示了一个这样一个案例。在文心大模型 4.0 工具版上输入,“我要到大湾区出差一周,想了解一下天气变化,请帮我查一下未来一周北京和深圳的温度,告诉我出差期间应该穿什么衣服,并整理成表格。”

如果有一个人类助理收到了这样的请求,思考路径就会是,首先通过查询了解天气情况和温度,然后根据这些信息来判断合适的着装应该包括哪些服装和配饰,最后将这些内容整理成一个表格。

而案例中的智能体,也正是按照以下思考过程进行操作。首先,它调用了高级联网工具来查询天气情况。接着,它调用了代码解释器来展示温度的趋势图。然后,它根据情况选择了适当的衣物。最后,它对结果进行思考确认,并将结果输出为表格。

对于人类来说,做出判断很简单,麻烦之处在于不停地查询和记录。然而,对于大模型来说,最困难的地方在于如何使其能够顺利地从一个步骤进行到另一个步骤。

从深入理解规划的过程,再到做出行为决策的阶段,最终利用多种工具完成任务,百度的智能体展现出了非常出色的增强学习能力。

这正是文心大模型4.0工具版最令普通用户感到惊喜的功能。一些简单的决策工作,比如查询航班找机票、安排日程做规划之类的小事情,都能直接告诉文心一言,让它给出一个决策意见。

通过智能体的智能化技术,我们可以简化繁琐的人工操作,从而节省大量的时间和精力,这正是智能体的重要意义所在。

02

现在模型自己生成代码,是否意味着程序员的门槛降低了呢?

查询天气、航班等等,都可以归纳为信息处理的范畴,这些属于自然语言能力的延伸。我们在日常生活中所需的不仅仅是信息处理,有时还需要智能体来帮助我们完成一些具体的任务。

比如查询完行程和机票信息后,我们希望大模型能自动帮我们下单一张机票;做好个人财务规划之后,我们希望大模型能自然帮我们购买符合我们自己需求的理财产品。

购买行为是指一次具体的购买操作。那么如何让大型模型来执行这个购买操作呢?

在过去,人与计算机之间的互动方式是通过将人类的需求转化为指令,然后将这些指令翻译成计算机可以理解的语言,从而驱动计算机执行各种任务。可以说,程序员在这个时代扮演着人与计算机之间的翻译官的重要角色,他们的存在具有重要的意义。

编程是一门显学,不过有能力写代码的程序员毕竟是少数人,对于不会写代码的人,王海峰带领团队进行的工作或许提供了一条新路径,即通过代码智能体来实现。

思考模型和代码解释器的结合,形成了一个称为代码智能体的实体。

代码智能体是一种具有智能思考能力的实体。它能够将完成任务所需的指令和相关信息整合成提示,并输入给代码解释器进行翻译,生成可执行的代码,以满足用户更个性化的需求。代码智能体的认知能力非常重要。它会对代码解释器执行的结果进行反思和确认,如果结果正确,就将结果返回给用户;如果结果不正确,它还能够继续进行自主迭代更新。

文心大模型经过万亿级的数据训练,不仅包含了丰富的自然语言数据,还涵盖了各种类型的代码数据,因此可以将自然语言与代码的能力完美结合,实现从思考到执行的无缝衔接。

王海峰带来了一个简单的展示案例,展示了如何为每一位前来参加百度Create大会的嘉宾定制个性化的邀请函。

对于一个经验丰富的设计师来说,这份工作非常容易,重复性也比较高,做起来浪费时间。但是,代码智能体可以理解需求,识别邀请函模板内容,并自动生成代码,将嘉宾姓名写到适当的位置。

我们经常会有疑问,当大模型具备了编写代码的能力,是否会取代程序员?然而实际情况是,大模型只能覆盖那些简单的工作,而真正重要的研发工作仍然需要专业程序员的智慧。大模型的作用在于将程序员从繁重的重复劳动中解放出来。

作为首席技术官,王海峰深切体会到了程序员在工作中所面临的困扰。他提到,在实际工作中,许多程序员都曾经历过接手代码的情况,需要花费大量时间和精力来分析和理解整个工程代码,这是一项非常耗时耗力的任务。然而,文心大模型推出的智能代码助手Comate可以在这个过程中提供帮助。

Comate这个词,代表了百度工程师们对于智能代码助手的期望——希望它能成为程序员的人工智能伙伴。

Comate能够接手所有低效耗时的繁琐工作,只要一条简单的指令,就可以快速了解整个代码架构,包括模块、功能、具体实现逻辑等等,进一步自动生成新代码,比私人助理还要快捷方便。

Comate具备自动化处理低效耗时的繁琐工作的能力。只需输入简单的指令,即可快速了解整个代码架构,包括模块、功能和具体实现逻辑等。进而,Comate能够自动生成新的代码,比使用私人助理更加快捷方便。

文心大模型的代码能力,不仅能够降低普通人开发应用的门槛,还能够减少程序员的工作量,从某种意义上来说,它提高了人机交互的效率。

03

大模型是否是最佳解决方案呢?

这场“阅兵仪式”的最后一个重头戏是多模型。

一个通用大模型虽然功能强大,但并不是解决所有问题的最佳答案。这次大会上百度发布了对大模型进行压缩蒸馏后,并使用数据进行训练得到的三个轻量级模型,分别是ERNIE Speed、Lite和Tiny,用于满足不同的应用场景需求。

做小模型的逻辑是,在大模型应用落地的过程中,效果、效率和成本都非常重要。在实际应用中,我们需要根据具体的场景需求来选择最适合的模型。

王海峰在现场分享了多模型技术。他提到,多模型技术具有两个主要优势。首先,它可以实现高效低成本的模型生产,这意味着可以更快地开发和部署新的模型。其次,多模型技术还可以实现多个模型的同时推理,从而提高系统的整体性能。

在高效低成本模型生产方面,百度采用了一种大小模型协同的训练机制。这种机制可以有效地进行知识继承,从而高效地生产出高质量的小模型。此外,还可以利用小模型进行对比增强,从而帮助大模型的训练。

同时,百度还建立了种子模型矩阵,通过数据提升和增强机制来提高模型的质量。此外,还开发了一套完整的工具链,包括预训练、精调对齐、模型压缩和推理部署等环节。

高效低成本模型生产机制,能够帮助应用实现更快的速度、更低的成本和更好的效果。

在多模型推理方面,百度通过研制基于反馈学习的端到端多模型推理技术,成功构建了智能路由模型。该技术能够充分发挥不同模型处理不同任务的能力,从而实现效果、效率和成本的最佳平衡。

在相同尺寸的情况下,可以明显看到更好的效果,而在相同效果的情况下,成本则明显更低。这就是多模型所带来的全新变革。

04

在这篇文章的结尾,我想总结一下。

除了智能体、代码和多模型技术,文心大模型在其他方面也不断进行创新。其中包括基于模型反馈闭环的数据体系,通过不断优化模型的反馈机制来提高模型的性能。另外,还有基于自反馈增强的大模型对齐技术,通过自我学习和调整来提高模型的准确性和一致性。此外,还有多模态技术,可以处理多种不同类型的数据。王海峰在现场宣布,文心大模型4.0的效果持续提升,发布后的半年时间,又提升了52.5%。

文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习平台和文心的联合优化。文心大模型的周均训练有效率达到98.8%,相比一年前文心一言发布时,训练效率提升到当时的5.1倍,推理效率提升到当时的105倍。截至目前,飞桨文心生态已凝聚1295万开发者,服务24.4万家企事业单位,基于飞桨和文心创建了89.5万个模型。

每个人都期待着人工通用智能(AGI)时代的到来,然而我们并不清楚AGI何时才能实现。想象一下,只需说一句话,机器人就能为我们完成一系列工作,这不正是科幻世界中经常出现的情景吗?

目前,文心一言的用户数量已经达到了2亿人,每天平均使用次数也达到了2亿次,有效地满足了用户在工作、生活和学习方面的需求。

而这些成绩可能很快就要被刷新,因为智能体的出现大大扩展了人工智能的应用场景,代码助手又降低了开发者的技术门槛,多模型技术为大量开发者和企业提升了工作效率,降低了开发成本。

王海峰详细介绍了百度AI人才计划的最新进展,百度在2020年提出了一个雄心勃勃的目标,即在5年内为全社会培养500万名AI人才。令人振奋的是,目前这一目标已经提前达成。

考虑到过去一年,百度为了弥合普通人与人工智能技术之间的认知、能力、应用鸿沟所做出的努力,可以预见到,未来将会有更多的人工智能人才,将会从大规模模型的研究和开发中蓬勃发展。