腾讯Marvis深度评测:六个AI智能体常驻你的电脑,系统级助手到底能做什么

2026年5月21日,腾讯上线了一款叫”Marvis”(马维斯)的桌面应用。名字拆开就是 Ma(马化腾)+ Jarvis(钢铁侠里的 AI 管家),用意不用多解释。
市面上的 AI 聊天工具大多是一个对话框,等你打字。Marvis 不一样。它跑在操作系统层,能读文件、改系统设置、控制应用程序,还能在你离开电脑后用手机远程操作 PC。支持 Windows、Mac 和 Android,官网直接下载,不需要邀请码。
六个 Agent 组成的虚拟办公室
打开 Marvis,你没有看到一个对话框。你看到一个卡通风格的虚拟办公室,里面住着六个 AI 角色,空闲时打盹、喝咖啡。来任务时各司其职:
| Agent | 职责 | 典型能力 |
|---|---|---|
| PM(主控Agent) | 任务调度与分发 | 理解复杂指令,拆解任务,分配给专业Agent |
| 文件Agent | 本地文件管理 | 语义搜索、自动聚类、文档内容分析、图片中文字识别 |
| 电脑Agent | 系统级操作 | 开关机诊断、启动项管理、电池健康检查、系统设置调整 |
| 应用Agent | 应用程序控制 | 打开/操作各类桌面软件、定时执行任务 |
| 搜索Agent | 网络信息检索 | 联网搜索、信息整合、实时数据获取 |
| 浏览器Agent | 网页交互 | 自动浏览网页、表单填写、信息采集 |
六个 Agent 并行干活。你说”帮我整理上周的所有 PDF,提取关键数据做成表格”,PM Agent 会把任务拆开:文件 Agent 定位和读取 PDF,浏览器 Agent 搜补充信息,应用 Agent 生成表格。你不用告诉它每一步怎么做。
TechNode 引用腾讯的说法称,Marvis 能完成目前市场上大多数 AI 智能体能处理的任务。这话不算夸张,因为它的核心差异在系统级集成,不在对话能力。
两种模式:效率 vs 隐私
Marvis 给你的第一个重要选择是运行模式:
效率模式:云端模型加本地处理混合。复杂推理上云,简单操作本地完成。速度快,适合日常办公。
隐私模式:完全由设备端大模型驱动。文档不离开本机,图片不离开本机,断网也能用。适合对数据合规敏感的行业,比如法律、医疗、金融。
隐私模式确实是个有诚意的设计。市面上大多数 AI 桌面工具都会把数据传云端处理,Marvis 在隐私模式下做到零上传。AIbase 的报道提到一个细节:L2 级”硬询问”机制。涉及金融交易、核心配置变更、批量文件删除这些高危操作时,系统强制二次确认,防止 AI 替你做了不该做的事。
跨设备控制:手机变 PC 终端
Marvis 的 Android 应用可以实时查看和控制 PC 桌面,即使 PC 在锁屏状态。这背后是腾讯应用宝团队在跨设备操控技术上的积累。
一个真实场景:你出差时家人打电话说电脑出了点问题。你掏出手机,用 Marvis 远程连上家里电脑,诊断问题、调设置、装软件。家人什么都不用碰。或者你在公司加班到一半要赶地铁,手机上继续操作办公室电脑,传完文件关机走人。
目前 PC 控制手机的流畅度还行,手机控制 PC 的延迟取决于网络。局域网内体验接近原生,跨网络就明显下降。
腾讯的 Agent 大军:Marvis 不是孤例
Marvis 不是一次单独的产品发布。Hello China Tech 的分析指出,2026 年 3 月至 5 月间,腾讯密集发布了一批 AI Agent 产品:
- WorkBuddy:办公生产力
- CodeBuddy:软件开发辅助
- QClaw:个人桌面助手
- DataBuddy:数据分析管道
- Ardot:UI/UX 设计
- Marvis:操作系统级助手
马化腾本人在朋友圈转发推广了这些产品,列出超过十几种 Agent 变体,说还有更多在路上。腾讯高级执行副总裁汤道生也公开表态,认为 AI 的应用范式该从聊天机器人转向智能体了。
这套策略的逻辑不难看懂:在每一个用户可能和 AI 交互的接触点上都插上旗帜,然后从生态内部优化产品。微信当年用”无处不在”的策略赢了即时通讯市场,腾讯想复制到 AI 时代。
但有一个现实问题绕不开:腾讯的底层模型还在追赶。元宝(腾讯的消费者 AI 应用)月活 5735 万,字节跳动的豆包是 3.45 亿,阿里通义千问 App 是 1.66 亿。公有云 IaaS 市场,腾讯云排第五,份额仅 8%。在增长最快的 MaaS(模型即服务)领域,火山引擎、阿里云和百度 AI 云三家就拿走了近九成。
这意味着 Marvis 这批 Agent 产品背着的期望很重:它们要在模型能力还没领先、云基础设施规模还偏小的情况下,证明”更好的分发和触达”能赢得市场。
和竞品比,Marvis 差在哪、好在哪
| 维度 | Marvis | 豆包/通义千问 | Manus AI | Claude/GPT桌面版 |
|---|---|---|---|---|
| 定位 | 系统级Agent | 对话+工具调用 | 云端自主Agent | 对话助手+有限工具 |
| 系统权限 | 深度OS集成 | 无 | 无 | 有限 |
| 本地文件操作 | 完整支持 | 上传后处理 | 上传后处理 | 上传后处理 |
| 离线能力 | 隐私模式支持 | 需联网 | 需联网 | 需联网 |
| 跨设备控制 | PC↔手机双向 | 无 | 无 | 无 |
| 多Agent架构 | 6个并行Agent | 单模型 | 多工具调用 | 单模型 |
| 用户量级 | 约96.8万月访问 | 豆包3.45亿MAU | N/A | N/A |
| 语言 | 仅中文 | 多语言 | 多语言 | 多语言 |
| 定价 | 免费,每日1000万Token | 免费+付费 | 付费 | 免费+付费 |
Marvis 的核心优势不在对话质量,在系统控制。它目前最大的限制是只支持中文,海外用户和英语场景基本用不了。
还有一个体验层面的差异:Marvis 的卡通虚拟办公室设计,六个 Agent 在屏幕上跑来跑去、打盹、喝咖啡。有人觉得亲切,有人觉得烦。如果你习惯极简终端界面,这个设计大概需要时间适应。但如果你把它看作一个 24 小时值班的团队,这种拟人化反倒降低了使用门槛。
每天 1000 万 Token,能做什么
腾讯给每个用户每天免费 1000 万 Token。以 GPT-4 级别的模型来算,大概够:
- 分析约 200-300 页 PDF
- 进行约 500 次常规对话
- 对约 1000 个本地文件建索引和检索
对个人用户来说,这个额度相当大方。Marvis 目前没有付费墙,策略是先用免费额度养用户习惯,未来通过基础配额加 API Key 接入的方式商业化。
什么样的人应该试试 Marvis
适合的场景:
- 每天要处理大量文档的研究者、学生、商务人士
- 电脑文件堆成山、经常找不到东西的人
- 经常需要远程操作办公电脑的人
- 对数据隐私有严格要求的法律、医疗、金融从业者
- 喜欢折腾新工具、愿意接受早期产品不完美的技术爱好者
不太适合的场景:
- 需要多语言支持的用户(目前只有中文)
- 只需要简单聊天助手的用户(杀鸡用牛刀)
- macOS 深度绑定用户(Mac 版功能落后于 Windows 版)
Marvis 本质上是个生产力工具。它解决的问题是让你电脑更好用,不是陪你聊天。
操作系统级 AI 的未来
AI 助手正在从浏览器里的聊天窗口搬到操作系统里常驻。当 AI 能直接操控系统、理解文件上下文、调度多个专业化 Agent 并行工作,它就不再是问你”有什么可以帮你”的那个对话框了,它直接帮你去做了。
腾讯在这条赛道上的动作速度值得关注。从 3 月产品预热到 5 月正式发布,比大厂通常的节奏快。但底层模型和市场口碑的追赶还需要时间。豆包 3.45 亿的 MAU 不是一天建起来的。
对用户来说,最务实的做法就是下载试试。反正免费,每天 1000 万 Token。你可能会碰到一些让你意外的时刻,比如当你说”把 Windows 那些乱七八糟的广告关掉”,然后它真的就关了。