华为管理培训
数字化转型培训

李彦宏最新演讲:百度AI战略重心转移(完整版)

640 (2)

版权声明

来源:划重点KeyPoints(huazhongdian123),书享界(readsharecn)

导语

4月25日,Create2025百度AI开发者大会在湖北武汉举办。百度创始人李彦宏发表题为《模型的世界 应用的天下》的演讲。不仅揭晓了百度在基础大模型领域的最新突破——文心大模型4.5 Turbo与深度思考模型X1 Turbo,更以前所未有的力度,将重心旗帜鲜明地指向了AI应用的繁荣,并宣告百度将全面拥抱并赋能开发者,迎接模型组件协议(MCP)时代的到来。

 

现场,李彦宏向开发者传递了一个明确而坚定的信号:“只要找对场景,选对基础模型,有时候还要学一点调模型的方法,在此基础上做出来的应用是不会过时的。”

 

4月25日,百度Create AI开发者大会上,李彦宏发表题为《模型的世界应用的天下》的主题演讲。

 

此次演讲中,李彦宏一口气发布九项重磅产品与技术成果,全面覆盖基础模型、AI应用及生态建设等领域。发布内容包括文心大模型4.5 Turbo与X1 Turbo、AI数字人、沧舟OS操作系统,以及代码智能体秒哒、多智能体协作APP心响、搜索AI开放计划、MCP开放计划和3万卡集群等。以下为演讲核心要点梳理:

 

1.模型趋势:多模态将成为基础模型的必备属性,纯文本模型的市场空间将持续收缩,而多模态模型的市场前景愈发广阔。随着模型性能不断提升,大模型与应用场景的融合机遇日益增多。这些AI应用不仅不会被模型能力所替代,反而能拓展至更多领域,实现价值跃升。

2.应用核心地位:应用才是价值创造的关键所在,脱离应用,芯片与模型将失去实际意义。尽管模型数量众多,但未来真正主导市场的是应用——应用为王,才是AI时代的核心法则。

3.DeepSeek的局限性:DeepSeek并非无所不能。其仅支持文本处理,在图片、音频、视频等多媒体内容的理解与生成方面存在空白;同时存在较高的幻觉率,使用场景受限;此外,调用成本高、响应速度慢也是显著短板。目前,国内多数大模型API在价格与速度上均优于DeepSeek满血版本。

4.智能体的未来角色:代码智能体(CodingAgent)将成为企业完成任务的必备工具,传统手动逐行编写代码的模式将难以在竞争中胜出。未来的AI应用不仅要具备问答能力,更需实现任务自动化执行。复杂任务的完成,需依赖多智能体协同工作,通过需求解析、任务拆解、资源调度与执行规划,最终达成目标。

5.MCP协议的革新意义:MCP(模型上下文协议)如同AI的“万能接口”,开发者只需遵循MCP标准编写一次接口,即可大幅简化开发流程。该协议赋予AI更强的外部感知能力,使其获取信息更便捷、工具调用更灵活,堪称AI发展的重要里程碑。当下基于MCP开发智能体,正如同2010年前后布局移动APP开发,蕴含巨大机遇。

6.创新的本质:创新的核心在于降低成本。只有成本显著下降,开发者与创业者才能更自由地开展开发工作,企业也能以更低成本部署大模型,从而推动AI应用在各行业的全面爆发。

李彦宏演讲全文

 

大家好!欢迎来到Create2025百度AI开发者大会!

 

Create作为年度技术盛会,始终聚焦开发者群体的交流与成果发布。当下AI技术迭代迅猛,新概念与应用层出不穷,在此背景下,面对面的思想碰撞与经验分享,比以往任何时候都更具价值。

 

今年,我们首次将大会落地武汉。这座城市以开放包容的姿态汇聚众多高校,不仅充满创新活力,更蕴藏丰富应用场景。随着无代码开发时代的到来,武汉必将成为当之无愧的“开发者之城”。

 

过去一年,AI领域呈现两大趋势:一方面,模型发布进入爆发期,DeepSeek异军突起,MCP逐步成为行业标准,多智能体协作产品引发广泛关注;开源中国社区一年内新增开发者超150万,人才队伍不断壮大。另一方面,开发者群体也面临焦虑——模型迭代加速,能力持续升级,基于大模型开发的应用是否会迅速失去价值?

 

这种担忧并非空穴来风。大模型领域竞争激烈,更新频率惊人:2024年第四季度有49个模型发布,2025年第一季度增至55个,单周最高发布量达8个。厂商的高强度竞争,反而让开发者陷入两难——既担心投入付诸东流,又不敢贸然尝试新应用开发。

 

但实际上,技术迭代是一把双刃剑。开发者既要把握技术趋势,避免与大模型的直接竞争;也要看到,丰富的模型资源与强大的能力,正为应用开发带来更多可能。只要精准匹配场景、选对基础模型,并掌握必要的调优技巧,开发出的应用就能保持持久生命力。

 

请记住:应用才是价值创造的核心。没有应用落地,芯片与模型都将失去意义。这正是本次大会主题“模型的世界,应用的天下”的深意——模型数量虽多,但唯有应用才能主宰未来。

 

以交通领域为例,高速公路安全事件种类繁多,从常见的异常停车、行人闯入,到罕见的火灾烟雾、物品抛洒,都依赖路侧边缘系统的小模型检测。但这些小模型存在误报率高、识别不准等问题,严重影响预警效率。而引入云端大模型后,常发事件检测准确率提升至95%以上,长尾事件也达到90%,监测人员工作量减少50%。这证明,大模型与场景的深度结合,不仅不会取代应用,反而能拓展其价值边界。

 

自DeepSeek发布以来,百度智能云千帆平台迅速完成部署,为开发者提供免费调用服务。文小言、百度搜索、百度地图等业务也接入满血版,在实际应用中取得显著成效。今天下午的分论坛,我们将专门分享基于DeepSeek的开发经验。

 

当然,DeepSeek并非完美无缺:它仅支持文本处理,无法满足多媒体内容理解与生成需求;高幻觉率使其在电商直播等场景中存在风险;此外,调用成本高、响应速度慢也是明显短板。而今天重磅发布的文心大模型4.5 Turbo和X1 Turbo,正是为解决这些痛点而生。

 

1

文心4.5 Turbo、X1 Turbo

 

今年3月16日,正值文心一言发布两周年,百度推出文心大模型4.5版本与文心大模型X1。其中,文心大模型4.5作为百度首款原生多模态模型,实现文本、语音、图像、视频的统一理解,在多项测评中超越GPT4.5,API调用成本仅为后者的1%;文心大模型X1则聚焦深度思考,性能对标DeepSeek-R1,调用价格却只有其一半。

 

今日,我们正式发布文心大模型4.5 Turbo与文心大模型X1 Turbo。这两款新品主打多模态、强推理、低成本三大核心优势。多模态能力已成为基础模型的必备属性,纯文本模型的市场空间正逐渐收窄,而多模态模型的应用前景则愈发广阔。至于新品价格,先留个悬念,稍后为大家揭晓。

 

先来看文心4.5 Turbo的多模态表现:面对一张模糊的球赛照片,其他模型误将足球识别为橄榄球,甚至错误判断为1981年SuperBowl赛事;而文心4.5 Turbo仅通过赛场广告牌与球员动作细节,便精准识别出这是1986年阿根廷对阵英格兰的世界杯比赛,并点出“上帝之手”这一经典事件。在视频理解测试中,它也能快速解析水槽实验画面,准确解释红色水滴形浮体率先抵达终点的流体动力学原理。此外,该模型在去幻觉、逻辑推理及代码处理能力上也实现全面升级。

 

文心大模型X1 Turbo基于4.5 Turbo打造,进一步强化深度思考能力。自上月初代X1发布后便广受好评,而X1 Turbo不仅延续了文学创作、逻辑推理的优势,还升级多模态功能,并支持多工具协同调用。以武汉网红吉祥物“蒜鸟”为例,当被要求绘制形象时,X1 Turbo自动联网搜索其背景信息,结合长江大桥、黄鹤楼等城市元素,调用AI绘图工具生成特色形象;被要求撰写“蒜鸟应聘热干面代言人简历”时,它又能通过联网收集资料、构思内容,并调用代码解释器输出可编辑的Word文档。

 

现在揭晓价格:

 

文心大模型4.5 Turbo:输入价格每百万token仅0.8元,输出价格3.2元,相比文心4.5速度更快,成本直降80%;

 

文心大模型X1 Turbo:输入价格每百万token1元,输出价格4元,性能升级的同时,价格再降低50%。

 

百度持续降低大模型成本,正是为打破开发者的应用瓶颈。创新的核心在于成本优化,只有让开发门槛和企业部署成本大幅下降,才能真正激发AI应用在各行业的爆发式增长。

 

2

AI数字人

 

基于强大的基础模型,我们得以开发出兼具实用性与趣味性的AI应用。其中,AI数字人堪称2025年最具突破性的应用之一。今天要介绍的高说服力数字人,凭借超拟真的声形表现、专业的内容输出和灵活的互动能力,带来超越真人的体验,在电商直播、游戏、消费等领域极具应用潜力。

 

目前市面上的数字人普遍存在文案单调、动作僵硬、语音机械的问题。这类数字人虽然能满足基础需求,但长时间观看容易产生审美疲劳。与之形成鲜明对比的是,高说服力数字人已达到“真假难辨”的境界——其核心秘诀在于“剧本生成”技术。

 

高说服力数字人由内容丰富的多模态剧本驱动。完整的剧本不仅包含台词,还精准设计了表情、语气、动作等细节,能根据台词实时调整,实现情绪与动作的自然过渡。在实际应用中,数字人直播间更展现出强大的协同能力:一个AI中枢可根据实时流量和转化数据,灵活调度助播、场控等虚拟角色。例如,当直播间热度上升时,AI会自动安排助播引导下单;在产品讲解和福利发放环节,还能智能切换镜头、插入互动卡片,让单个数字人发挥出完整营销团队的效能。

 

为降低使用门槛,我们推出“一键克隆”功能。用户只需录制2分钟直播视频,上传至百度慧播星平台完成训练,即可生成专属数字人,轻松实现直播变现,真正做到“人人都能当主播”。

 

高说服力数字人是多模态大模型的典型应用。但对开发者而言,更多场景需要组合多个模型。看似简单的模型组合,实则对技术整合、用户体验优化和商业价值实现提出了更高挑战。

 

3

沧舟OS

 

百度文库的AI功能已获得市场高度认可,付费用户突破4000万,月活跃用户达9700万,成为名副其实的“超级生产力”工具。其中,文库与网盘联合打造的自由画布,堪称多模型组合应用的典范。

 

自由画布支持全模态、全格式内容处理,用户可直接从网盘中拖拽Word、PDF、图片、音频、视频等素材,也能粘贴网页链接或通过AI搜索补充最新信息。例如,研究《长江禁渔对江豚种群的影响》时,用户不仅能调用本地素材,还可利用“以图生图”功能,将江豚实拍图转换为可爱漫画风格。

 

在素材整合阶段,用户可精准标注使用需求:指定文稿中的数据段落,圈选论文核心观点,明确素材应用逻辑。完成标注后,一键输入主题,自由画布即可输出多样化内容——从深度长文、演示PPT,到适合儿童的视频绘本,均可灵活生成,并自动融入新创建的卡通形象。

 

这种强大的内容处理能力,源于多模型协同运作:基于文心大模型的精调版本理解用户意图,多模态模型解析音视频,行业专用模型则负责文档提取、格式转换与内容生成。这些能力最终沉淀为沧舟OS,这个专为内容创作打造的操作系统包含两大核心模块:

 

Chatfileplus:对全形态内容进行解析与向量化处理,将文本、图像、音视频转化为大模型可识别的Token,支持混合生成;

三库三器架构:整合公域知识库、私域知识库、记忆库,联动编辑器、阅读器、播放器,实现模型按需调用。

 

依托这一技术底座,百度近期推出AI笔记等实用功能。未来,百度文库与网盘将基于沧舟OS持续创新,开发更多高效AI工具,巩固“超级生产力”的市场定位。

 

4

萝卜快跑全球化

 

刚才我介绍了几个多模态理解和生成方面的应用。下面,我还想给大家再看看,另外一个视觉大模型的典型应用,无人驾驶。就在我们create大会的会场周边,包括这个城市的大部分区域,有许多辆萝卜快跑正为人们提供着安全、舒适与便利的服务。

 

事实上,无人驾驶比有人驾驶更安全的理念,正在被越来越多的人意识到,全世界各个国家、城市都会逐步接受这一新鲜事物,我们也将在全球持续扩大规模。

 

我相信不久的将来,全球各个国家地区、不同种族的人,都能坐上无人驾驶车。

 

5

秒哒(代码智能体)

 

大约一年前,当被问及最看好的AI应用方向时,我曾提出“智能体”这一概念,彼时这还属于小众观点。然而短短不到一年,智能体已成为AI应用领域的核心焦点。

 

其中,代码智能体是近半年发展最为迅猛的赛道,cursor、devin、lovable等产品层出不穷,涵盖辅助编码与无代码编程等多种类型。可以预见,未来企业若想在数字化竞争中胜出,代码智能体将成为不可或缺的工具——传统逐行手写代码的模式,已难以满足效率需求。

 

在百度,工程师广泛使用文心快码Comate辅助编程,而非技术人员则更倾向于秒哒这类无代码编程工具。秒哒自去年11月发布,具备无代码编程、多智能体协作、多工具调用三大特性,并于今年3月面向公众开放,实现“一句话生成应用”的便捷体验。

 

举个例子,一位父亲希望开发一款拼图游戏,要求包含动物、交通工具等经典主题,支持自定义图片上传,且拼图完成后能展示知识卡片。秒哒接到需求后,自动调度策划、研发、设计等多个智能体协同工作,快速生成了兼具趣味性与教育性的游戏。该游戏支持多种难度选择,还能上传本地图片制作个性化拼图,收获用户好评:“解决了亲子互动难题,度过了愉快的午后。”

 

另一案例中,大学生创业团队计划开发校园夜宵配送系统,原本需耗时一周的开发工作,在秒哒的帮助下仅用几分钟便完成。秒哒通过调用产品经理智能体梳理需求,联动架构师、设计师等角色,并整合百度智能云的存储、地图导航、智能客服等工具组件,最终生成可直接上线的应用。团队仅花费约5元的模型调用成本,便拥有了集下单、配送、数据管理于一体的营销工具。

 

从陕西果农开发的苹果销售算账应用,到退休人员创建的社区服务登记系统,再到苏绣工作室搭建的AI博物馆,秒哒已助力不同职业、身份的用户实现创意落地。全球程序员不足3000万,而总人口达80亿——随着技术门槛不断降低,秒哒正赋予每个人“编程创造”的能力,让创意突破技术限制,成为现实。

 

6

心响(多智能体协作应用)

 

多智能体协作是一个非常有价值的AI应用方向。未来的AI应用,不只可以回答问题,还要能完成任务。而任何一个复杂任务的交付,都需要多智能体协作来解析需求、分拆任务、调度资源、规划执行,最终交付结果。

 

百度全新的多智能体协作应用——心响。

 

7

百度搜索开放平台

 

AI应用爆发的浪潮即将到来,无论是智能体,还是H5页面、小程序、独立App,都将百花齐放。那么,用户如何快速找到心仪的AI应用?开发者又该如何让作品触达更多受众?答案就藏在百度搜索开放平台的AI开放计划中。

 

这一计划旨在构建全新生态:百度搜索打破边界,接纳多元形态的AI应用,并搭建高效的内容分发网络。一方面,用户能借此获取海量、前沿的AI服务;另一方面,开发者将获得流量扶持与变现机会。

 

例如,当用户在搜索框输入“3D家装设计”,生境科技的AI应用卡将优先展示。点击“定制专属方案”,上传房间照片、选择房型与风格,即可秒获个性化效果图。目前,AI面试助手、医学专业咨询、视觉创作工具等多领域应用已抢先入驻。百度诚邀更多开发者加入,共享早期红利。

 

此外,百度搜索还将全面整合市场上的MCPserver资源,为开发者提供一站式、全链路的开发工具支持,助力创新应用加速落地。

 

8

MCP(模型上下文协议)

 

MCP热度居高不下,其核心价值何在?在AI应用井喷式发展的背景下,开发者普遍面临三大困境:工具接口缺乏统一标准,导致开发效率低下;适配不同平台需反复调试,耗时耗力;开源组件质量参差不齐,整合维护成本极高。

 

而MCP(模型上下文协议)为这些难题提供了破局方案。它如同AI领域的“万能适配接口”,开发者无需为每个工具单独编写适配代码,仅需遵循MCP标准完成一次接口开发,就能实现多工具兼容,大幅降低开发复杂度与时间成本。通过MCP,AI系统得以更高效地感知外部信息、调用各类工具,堪称AI技术发展的重要里程碑。

 

开发者融入MCP生态可通过两种路径:其一,将自身资源、数据与能力以MCP标准封装输出,为其他AI应用提供支持;其二,在开发过程中直接调用现有MCPServer资源,既能减少重复开发工作,又能快速提升应用功能。目前,Anthropic、OpenAI、Google等国际企业,以及阿里、字节、腾讯等国内巨头,均在积极布局MCP生态。

 

百度全面发力,助力开发者拥抱MCP技术:

 

模型升级:优化文心基础大模型,增强其对MCPserver的任务规划与智能调度能力;

 

平台支持:百度智能云千帆平台率先实现MCP全兼容,不仅汇聚海量第三方MCPserver资源,还支持开发者自主创建、发布server,并提供全流程托管服务;

 

资源整合:百度搜索打造MCPserver发现平台,高效索引全网优质服务;文心快码成为国内首个支持MCPserver的智能编码工具;

 

场景开放:百度电商推出国内首个支持交易闭环的MCP服务,涵盖商品检索、交易、参数对比等功能;地图、文库、网盘等核心应用也逐步开放MCPserver接口,其中文心大模型的联网搜索功能升级为行业领先的百度搜索MCPserver。

 

应用案例一:三星手机与百度文库网盘的深度协同

 

三星手机接入百度文库网盘的文件管理MCPserver后,用户通过语音指令即可完成“照片备份至网盘并分享”等操作。系统自动执行照片上传、链接生成,并联动通讯录实现短信分享,既丰富了手机云存储功能,又解决了大文件批量管理难题。

 

应用案例二:千帆平台的智能体升级实践

 

用户提出“备考清华计算机考研书籍”需求,传统智能体仅能提供模糊书单,无法实现精准推荐与交易。基于千帆平台,通过添加百度AI搜索与百度优选的MCPServer,智能体实现能力跃升:

 

精准推荐:调用搜索MCP获取书籍清单及作者、出版社等详细信息;

 

能选品通过电商MCP对比不同店铺评分与价格;

 

一键交易:直接生成订单,完成从需求到交易的全流程服务,打造国内首个支持电商交易闭环的MCP应用。

 

当前,基于MCP开发智能体正处于黄金机遇期,堪比2010年移动APP爆发前夜。百度将持续深化MCP生态建设,今日下午的MCP分论坛将带来更多技术解读与实践案例,诚邀开发者共探MCP的无限潜力。

 

9

“文心杯”创业大赛

 

长期以来,百度始终致力于为开发者提供全方位支持,涵盖模型资源、开发工具及资金扶持等多个维度。早在两年前,百度便发起“文心杯”创业大赛,旨在繁荣大模型生态,助力创业者与开发者探索AI应用创新。

 

历经两届赛事,“文心杯”吸引了全球2500余支创业团队踊跃报名。百度不仅为优胜团队提供超2亿元的资金支持,还在技术赋能、团队建设和资源对接等方面给予持续助力。如今,“文心杯”已成长为国内AI创投领域极具影响力的标杆赛事,众多获奖团队深度融入百度生态,近半数项目成功获得后续融资,实现快速发展。

 

在此,让我们聚焦部分优秀获奖团队的卓越表现。(此处可列举案例,原文未提及具体团队,故保留表述)

 

现在,我正式宣布:第三届“文心杯”创业大赛启动!本届赛事将进一步加码扶持力度,单一项目的奖励金额翻倍,特别大奖最高可获7000万元投资。我们诚邀更多开发者与创业团队加入,共同打造更丰富、更优质的AI应用。

 

面对充满变数的外部环境与经济挑战,百度始终坚守技术创新与社会责任。作为深耕技术的企业,百度持续践行AI人才培养战略——5年前提出的“500万AI人才计划”已超额完成,累计为社会输送630万专业人才。今天,我们郑重承诺:未来5年,百度将投入更多资源,再培养1000万AI人才,激发创新活力,为智能经济发展注入强劲动力。

 

10

3万卡集群(昆仑芯P800)

 

为助力开发者轻装上阵、低成本开发应用,这里还有一个重磅消息与大家分享。请看大屏幕——国内首个全自研3万卡集群正式亮相。

 

昆仑芯第三代P800芯片专为大模型计算需求打造,综合性能位居行业前列。3万颗这样的AI芯片协同运作,意味着什么?它不仅能同时支持多个千亿参数级满血版DeepSeek模型的全量训练,还可满足1000个客户同步开展百亿参数模型的精调工作。

 

构建如此规模的集群,从硬件部署到软件适配都充满挑战。百度百舸异构计算平台成为破局关键:通过搭建超高性能网络,保障大规模训练任务的稳定性;创新优化资源调度,大幅提升芯片利用率;同时设计高效散热方案,显著降低能耗。如今,我们有足够底气为国内AI应用开发保驾护航。

 

今天这场大会,我们在1小时内带来9项重磅发布:推出性能更强、成本更低的文心大模型4.5 Turbo与X1 Turbo;展示新一代高说服力数字人、沧舟OS系统;分享代码智能体秒哒的新突破、多智能体协作APP心响;启动百度搜索AI开放计划与MCP生态赋能计划;更以点亮全自研3万卡集群,为开发者注入“强心剂”。

 

所有这些成果,都只为一个目标——让开发者无需担忧模型能力、成本压力与工具短板,能够专注创新,打造真正有价值的AI应用。让每一个需求都能得到回应,让每一次人机交互都充满温度,让每一项创新都成为行业变革的引擎。我们始终坚信:应用定义未来,开发者塑造未来。

 

谢谢大家!

77640 (9)640 (10)640 (11)
5

书享界保留所有权 |书享界 » 李彦宏最新演讲:百度AI战略重心转移(完整版)

扩展阅读请点击
分享到:更多 ()

相关推荐

评论区 抢沙发

华为管理培训 · 数字化转型培训

服务案例联系书享界