来源:36氪
超级生产力的基座,在于操作系统。
国内AI领域内,一场围绕MCP的暗战悄然显现。
不会再有百模大战那样声势浩大的泡沫、更关注AI是否落地好用的长期价值,再谈生态壁垒,这些都是MCP入局者的共识。
科技巨头们如今的摩拳擦掌,比起在这片“新战场”抢占先机,更大的目标是携手帮助AI应用加速进化。
而被看作是智能体“万能插头”的MCP,不但依托框架化思维,成为多模态应用与各方数据源深度融合的纽带,更能真正意义打造开放生态、让每个企业、开发者都能打造自己的应用,给用户提供高质量、个性化的交付,大幅提升AI生产力。
基于此,4月25日,Create2025百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏宣布,百度文库与百度网盘联合推出“沧舟OS”,这也是全球首个内容领域的操作系统,将AI的能力沉淀到了系统级技术底座,在OS的特性和MCP的价值基础之上,真正实现从深度思考走向到深度交付。
如果说数据是AI时代的能源,模型是生产力引擎,OS系统就像是一个“超级工厂”,将技术、数据、工具和端到端的交付需求连接起来,让用户进一步感受到大模型时代AI正在朝“无所不能、无处不在”的方向迈进。
AI的正确方向,
是“无所不能、无处不在”
2024年被称为AI应用的元年。很多AI应用生产的多模态内容已经基本“可用”,大多数用户也告别观望,开始寻找符合自身需求的AI交付场景。
然而“可用”并不是最终目标,AI时代仍需迈向更进一步的阶段——用户需要更“实用”、更“好用”的AI,这该如何实现?
在回答这个问题之前,值得思考的是,AI应用还“不够好用”的痛点是什么。
首先,大模型已经非常普及,也全面进入了深度思考阶段。AI可以为我们出谋划策,但做到真正能干活、能实现交付的案例还是凤毛麟角。
纵观市面上的AI应用,大部分仍然匮乏上下文语境贯通和跨平台调用能力。在封闭环境下,非常考验用户多轮对话的耐心和“生成概率”。品控参差不齐,也会让用户不敢把它用到更专业复杂的交付场景中。
其次,从ChatGPT到DeepSeek,用户输入prompt的门槛已经大幅简化,但还是依赖用户自身的逻辑表达和资料整理,造成了很多输入负担和输入成本。
再次,在没有多模态输入和输出的成熟解决方案之前,AI只能“聪明”地思考,但不能“干活”。用户受限于不同AI应用的单点功能对素材模态处理的局限,往往需要不断地切换应用、更换平台,输入、输出的思路也被频繁打断。Manus等AI Agent的能力上限,就明显受到了这方面的制约。
在这些明确的挑战下,提升模型能力不再直接对等AI交付能力的跃迁。百度文库和百度网盘也已经意识到,用户需求并不是学习如何使用AI,而是在“不学习AI、不精准掌握提示词结构”的前提下就能稳定得到高质量交付结果。而且是能在任何时间、任何地点、任何终端,输入任何指令或多模态文件,都能端到端地迅速生成多模态格式的内容,这才符合大众对AI“聪明能干”的心理预期。
正是在这个从量变到质变的关键节点,“沧舟OS”给出了正确的方向:让AI朝着“无所不能、无处不在”迈进。
好的系统,
需要端到端的高质量交付
在MCP的“连接”价值体系下,想要让每一个应用场景都实现端到端的交付,技术、工具、服务,每个链条上的价值创新都是必不可缺的。
所以,端到端的交付,意味着一站式系统级的完整生成体验。就像有了Windows系统以后,用户不再需要参与编码就能让计算机干活一样,想要让百度文库、百度网盘庞大的用户群体“平等”地用AI干活,同样需要一套AI原生的操作系统。
比如,百度文库和百度网盘去年发布的自由画布,就是一个改变Chatbot交互方式的、多模态理解生成、多任务并行协作的操作系统,就是为了降低AI门槛而生,可以说是“沧舟OS”的一个Beta版。
李彦宏在Create2025上介绍道:“自由画布多个模型组合使用的能力,现在已经沉淀为一个完整的技术底座——沧舟OS。这是一个为内容而生的操作系统。”
“沧舟OS”解决问题的思路更加简单直接:让AI实现系统级的进化。也就是说,用户把全模态的材料和指令输入这套系统,通过更加自由的交互和操作,直接生产出全模态、可交付的内容,这不再是单一的工程化思路,而是一个端到端的系统。
而端到端的系统,至少要满足三点:一是让用户没有输入的门槛,二是需要工具链和上下文记忆完整且开放,三则是多模态混合输入输出的内容精准丰富。
这样的操作场景一旦被验证,就会迅速挑战和迭代现有的OS生产力体系。而想要超过传统定义的操作系统,AI时代的操作系统,需要在三件事情上有突破:内容更个性、交互更便捷、工具更全面。
“沧舟OS”的三层架构也与之一一对应。
在底座基建上,“沧舟OS”构建了“三大库”。这也是基于百度文库和百度网盘积淀多年的文库公域知识库、网盘用户授权的私域知识库和用户的记忆库,以及对知识强大的加工和知识提取能力。让用户在任务中没有门槛地获取和调用知识数据。
公私域知识库之所以是百度文库和网盘的壁垒,是因为文库积累的海量知识可以帮助推理,多模态输出结果更专业可信,网盘知识则让生成内容更符合用户个性化的需求和灵感。
在中枢系统上,想要弥合效率场景的“断层”,输入与输出、生产与协作必须是高度集成且易操作的,这也是今后所有OS系统和AI终端都会发力的场景。“沧舟OS”因此构建了“三大器”,不仅拥有百度文库、百度网盘自研的集成AI能力的阅读器、编辑器、播放器,还能通过“调度中枢”,通过交互组件、意图模型和传输基建等,结合用户记忆和画像数据、充分理解用户意图,实现多模型、多智能体的并行协作和高效调度。
在应用服务上,回归操作系统自身的属性,“沧舟OS”基于MCP协议,集成了文库、网盘数百项AI Agent,生成模态涵盖了图片、图表、文档、音频、视频等各种类格式的素材、全面覆盖学习办公、生活娱乐等多元化实用场景,还拥有灵活扩展的能力。
与PC、移动端操作系统相比,“沧舟OS”很好地体现了AI OS的价值特性,让数据的个性化和MoE带来的模型多元性和精确性流动到各个场景、各个终端中,探索真正的“无处不在”。
同时,“沧舟OS”结合着庞大的公私域知识数据,以及数百个已经被用户长期验证过的AI能力,满足用户通用又细分的需求场景,才有机会朝向“无所不能”迈进。
聪明能干活,
是验证AI的唯一方式
李彦宏在Create2025上公开发布:百度文库AI功能的付费用户已经超过4000万,月活用户达到了9700万,成为了真正的“超级生产力”。
那么,在有了一套“OS”系统之后,如何让这套系统为如此大规模的用户赋能?
基于“沧舟OS”,百度文库、百度网盘推出了两个全新能力,“GenFlow超能搭子”“AI笔记”,这两个能力也体现出,在AI OS系统之上,AI功能的体验、AI的交互界面也可以像水一样柔性而有力地流动,在不同的应用形态中去探索AI“无所不能、无处不在”的可能性。
比如,百度文库APP的GenFlow超能搭子,在人机协作的原理上是WorkFlow的全面迭代。WorkFlow一般用于指代一切都规定好的工作流,是写死的,非机动性的;而GenFlow的逻辑则是通过AI的思考规划,自主调用各种模型和PPT、文档、脑图、海报等Agent,最终输出多模态内容。
在很多“意想不到”的场景上,GenFlow都表现出了对于简单口语化诉求的深度理解,活干得又快又漂亮,让用户本来只是抱着试一试的心态,惊喜地发现得到的东西竟然能直接用于交付。
比如在GenFlow输入“我五一要在海南举办婚礼,帮我做一个图文并茂的婚礼策划和婚礼邀请函”,这样一个简单的口语化指令,但对于AI来说,它的复杂性在于——理解需求的工作流:一个完整的婚礼策划不但需要有实用的方案、大量的用户偏好和定制化内容,还涉及邀请函等物料的制作。
可以看到,GenFlow聪明地结合当地的习俗、场地和时间的特性,通过多轮对话和回顾历史记录来主动确认用户的喜好、预算、流程等,并通过模型推理解析需要用哪些多模态输出方式呈现给用户,这些是GenFlow“像人一样思考”的推理过程。到了多模态输出这一层,则会调用PPT工具、海报设计工具等,几分钟内即可同时生成高质量的婚礼策划PPT和邀请函海报,且生成的内容用户都可以在操作系统里直接编辑。
同时,相对于市面上的多智能体协作产品,GenFlow超能搭子不仅是立等可用的“现货”,也能实现分钟级交付,在生成质量上稳定性更高,还克服了同类产品无法多轮对话调优的缺陷。
第二个是百度网盘的AI笔记,这也是目前市场上第一个多模态AI笔记产品,而百度网盘思考的原点,是探索究竟什么是一个“好的笔记”。用户对于笔记的需求,无非就是要求信息全面、准确、知识呈现结构化、逻辑完整,重点知识可沉淀、再利用,以及笔记和学习资料能够进行深度融合,便于多次回顾、复习。
而现在用户的学习资料大多是视频、图像、文本等多种模态,现在市面上的笔记产品很难同时满足用户的上述需求,百度网盘充分发现了这一痛点,对用户的私域学习知识库进行了充分激活,也让学习内容和笔记实现了丝滑联动。
比如在观看网盘中存储的学习视频时,用户即可在网盘的播放界面侧边栏中,通过AI笔记能力自动生成全面、清晰、结构化的多模态AI笔记,并与视频内容完全关联。用户还可一键生成AI思维导图、概览视频结构,并可基于视频内容AI出题,测试知识掌握程度。未来,用户还可以在笔记中自主添加教材、资料等其他知识内容,还能基于知识进行AI全网搜索,从而生成更加详实、完整的AI笔记。
这两个能力其实只是百度文库、网盘海量能力的冰山一角,随着更多企业MCP化、加入沧舟OS等系统生态,构建自己的AI应用、Agent,更多的单点能力也会随之迸发出来。
能力之外,
开放生态的长期价值
而让更多的企业和开发者加入进来,也是整个AI行业能够把“做大的蛋糕”卖出去的关键。
所以,为了让生态和应用发挥最大价值,百度文库、百度网盘基于“沧舟OS”,率先将MCP充分运用到产品与生态的链接上,构建MCP Server-Client-Host三层体系,将文库、网盘的能力通过MCP Server形式开放,供更多企业和开发者使用。
从百度文库和网盘迅速把自身Server工具化也可以看出,现在基于MCP协议做架构创新的AI领域,比起激战,更像是一种竞合关系。
企业端的应用合作,不会只发生在数字世界。比如,三星作为硬件厂商,已经在拥抱MCP在内容消费端的价值。
目前,三星手机也在接入百度文库网盘文件上传、下载、检索、内容理解等多个MCP Server。接入以后,三星用户在手机的语音助手界面就可以直接实现文件上传网盘备份、云端分享、文档摘要总结和内容问答等功能。
另一方面,这些Server也在丰富三星手机系统的云存储能力,解决硬件自身针对大文件、多文件批量备份和分享的痛点。举个例子,图片影音文件“即看即存”、文件批量交付,以后就有机会在三星手机上轻松实现了。
同时,在IoT设备上,百度网盘也和牛听听达成了合作,牛听听是超600万高知家庭使用的儿童智能硬件头部品牌,百度网盘已经成为牛听听最受欢迎的第三方应用。
这些场景足够简单实际,能让普通人觉得AI聪明会干活,所以也是当下AI应用最迫切的需求场景切入点。
也就是说,只要解决的问题够多、够深,就能引起用户心智的快速认知和足够重视。所以,比起先发优势,比别的产品聪明好用才是AI最大的壁垒。而聪明好用,也是验证AI未来商业化空间的先决条件。
从沧舟OS的发布时间,可以看出百度文库和百度网盘对于AI领域的判断逻辑,也是站在用户亟须让AI聪明、能干活的内容创作需求,而非把技术突破强塞给市场去消化。
对此,开发者更能够感受到,未来不会有任何一家模型和一个AI应用能覆盖所有长尾需求。在每一个细分赛道谁能跑出来,目前还都尚未可知,但生态和系统的“展卷”却是必不可缺的。
2025年,我们都同意的一个观点是,好的AI应该主动思考,主动去判断自己怎么样才能像人一样工作,而不是让人通过新一轮的学习和培训去贴合AI的需求,本末倒置。为了省时提效而花大量时间学习如何提效,这是一个反直觉的矛盾。
而这个矛盾,模型本身的能力是解决不了的。只有从底层系统去发力,一层层简化开发、适配场景、组装应用,才能让AI同时拥有大脑、四肢和器官,从终端用户的口中来验证AI应用的iPhone时刻。
好的操作系统像水一样,水既是生存能源,也是航行方式,AI的想象空间也是如此。往小了看,它能为任何一个普通人提供知识和生产力;往大了说,它也会逐渐贯穿到一家企业、一个产业的生命周期中去,成为一种无所不能、无处不在的新质“元素”。
0 条