腾讯Marvis深度评测：六个AI智能体常驻你的电脑，系统级助手到底能做什么 — BestGeneralAI Agents

2026年5月21日，腾讯上线了一款叫”Marvis”（马维斯）的桌面应用。名字拆开就是 Ma（马化腾）+ Jarvis（钢铁侠里的 AI 管家），用意不用多解释。

市面上的 AI 聊天工具大多是一个对话框，等你打字。Marvis 不一样。它跑在操作系统层，能读文件、改系统设置、控制应用程序，还能在你离开电脑后用手机远程操作 PC。支持 Windows、Mac 和 Android，官网直接下载，不需要邀请码。

六个 Agent 组成的虚拟办公室

打开 Marvis，你没有看到一个对话框。你看到一个卡通风格的虚拟办公室，里面住着六个 AI 角色，空闲时打盹、喝咖啡。来任务时各司其职：

Agent	职责	典型能力
PM（主控Agent）	任务调度与分发	理解复杂指令，拆解任务，分配给专业Agent
文件Agent	本地文件管理	语义搜索、自动聚类、文档内容分析、图片中文字识别
电脑Agent	系统级操作	开关机诊断、启动项管理、电池健康检查、系统设置调整
应用Agent	应用程序控制	打开/操作各类桌面软件、定时执行任务
搜索Agent	网络信息检索	联网搜索、信息整合、实时数据获取
浏览器Agent	网页交互	自动浏览网页、表单填写、信息采集

六个 Agent 并行干活。你说”帮我整理上周的所有 PDF，提取关键数据做成表格”，PM Agent 会把任务拆开：文件 Agent 定位和读取 PDF，浏览器 Agent 搜补充信息，应用 Agent 生成表格。你不用告诉它每一步怎么做。

TechNode 引用腾讯的说法称，Marvis 能完成目前市场上大多数 AI 智能体能处理的任务。这话不算夸张，因为它的核心差异在系统级集成，不在对话能力。

两种模式：效率 vs 隐私

Marvis 给你的第一个重要选择是运行模式：

效率模式：云端模型加本地处理混合。复杂推理上云，简单操作本地完成。速度快，适合日常办公。

隐私模式：完全由设备端大模型驱动。文档不离开本机，图片不离开本机，断网也能用。适合对数据合规敏感的行业，比如法律、医疗、金融。

隐私模式确实是个有诚意的设计。市面上大多数 AI 桌面工具都会把数据传云端处理，Marvis 在隐私模式下做到零上传。AIbase 的报道提到一个细节：L2 级”硬询问”机制。涉及金融交易、核心配置变更、批量文件删除这些高危操作时，系统强制二次确认，防止 AI 替你做了不该做的事。

跨设备控制：手机变 PC 终端

Marvis 的 Android 应用可以实时查看和控制 PC 桌面，即使 PC 在锁屏状态。这背后是腾讯应用宝团队在跨设备操控技术上的积累。

一个真实场景：你出差时家人打电话说电脑出了点问题。你掏出手机，用 Marvis 远程连上家里电脑，诊断问题、调设置、装软件。家人什么都不用碰。或者你在公司加班到一半要赶地铁，手机上继续操作办公室电脑，传完文件关机走人。

目前 PC 控制手机的流畅度还行，手机控制 PC 的延迟取决于网络。局域网内体验接近原生，跨网络就明显下降。

腾讯的 Agent 大军：Marvis 不是孤例

Marvis 不是一次单独的产品发布。Hello China Tech 的分析指出，2026 年 3 月至 5 月间，腾讯密集发布了一批 AI Agent 产品：

WorkBuddy：办公生产力
CodeBuddy：软件开发辅助
QClaw：个人桌面助手
DataBuddy：数据分析管道
Ardot：UI/UX 设计
Marvis：操作系统级助手

马化腾本人在朋友圈转发推广了这些产品，列出超过十几种 Agent 变体，说还有更多在路上。腾讯高级执行副总裁汤道生也公开表态，认为 AI 的应用范式该从聊天机器人转向智能体了。

这套策略的逻辑不难看懂：在每一个用户可能和 AI 交互的接触点上都插上旗帜，然后从生态内部优化产品。微信当年用”无处不在”的策略赢了即时通讯市场，腾讯想复制到 AI 时代。

但有一个现实问题绕不开：腾讯的底层模型还在追赶。元宝（腾讯的消费者 AI 应用）月活 5735 万，字节跳动的豆包是 3.45 亿，阿里通义千问 App 是 1.66 亿。公有云 IaaS 市场，腾讯云排第五，份额仅 8%。在增长最快的 MaaS（模型即服务）领域，火山引擎、阿里云和百度 AI 云三家就拿走了近九成。

这意味着 Marvis 这批 Agent 产品背着的期望很重：它们要在模型能力还没领先、云基础设施规模还偏小的情况下，证明”更好的分发和触达”能赢得市场。

和竞品比，Marvis 差在哪、好在哪

维度	Marvis	豆包/通义千问	Manus AI	Claude/GPT桌面版
定位	系统级Agent	对话+工具调用	云端自主Agent	对话助手+有限工具
系统权限	深度OS集成	无	无	有限
本地文件操作	完整支持	上传后处理	上传后处理	上传后处理
离线能力	隐私模式支持	需联网	需联网	需联网
跨设备控制	PC↔手机双向	无	无	无
多Agent架构	6个并行Agent	单模型	多工具调用	单模型
用户量级	约96.8万月访问	豆包3.45亿MAU	N/A	N/A
语言	仅中文	多语言	多语言	多语言
定价	免费，每日1000万Token	免费+付费	付费	免费+付费

Marvis 的核心优势不在对话质量，在系统控制。它目前最大的限制是只支持中文，海外用户和英语场景基本用不了。

还有一个体验层面的差异：Marvis 的卡通虚拟办公室设计，六个 Agent 在屏幕上跑来跑去、打盹、喝咖啡。有人觉得亲切，有人觉得烦。如果你习惯极简终端界面，这个设计大概需要时间适应。但如果你把它看作一个 24 小时值班的团队，这种拟人化反倒降低了使用门槛。

每天 1000 万 Token，能做什么

腾讯给每个用户每天免费 1000 万 Token。以 GPT-4 级别的模型来算，大概够：

分析约 200-300 页 PDF
进行约 500 次常规对话
对约 1000 个本地文件建索引和检索

对个人用户来说，这个额度相当大方。Marvis 目前没有付费墙，策略是先用免费额度养用户习惯，未来通过基础配额加 API Key 接入的方式商业化。

什么样的人应该试试 Marvis

适合的场景：

每天要处理大量文档的研究者、学生、商务人士
电脑文件堆成山、经常找不到东西的人
经常需要远程操作办公电脑的人
对数据隐私有严格要求的法律、医疗、金融从业者
喜欢折腾新工具、愿意接受早期产品不完美的技术爱好者

不太适合的场景：

需要多语言支持的用户（目前只有中文）
只需要简单聊天助手的用户（杀鸡用牛刀）
macOS 深度绑定用户（Mac 版功能落后于 Windows 版）

Marvis 本质上是个生产力工具。它解决的问题是让你电脑更好用，不是陪你聊天。

操作系统级 AI 的未来

AI 助手正在从浏览器里的聊天窗口搬到操作系统里常驻。当 AI 能直接操控系统、理解文件上下文、调度多个专业化 Agent 并行工作，它就不再是问你”有什么可以帮你”的那个对话框了，它直接帮你去做了。

腾讯在这条赛道上的动作速度值得关注。从 3 月产品预热到 5 月正式发布，比大厂通常的节奏快。但底层模型和市场口碑的追赶还需要时间。豆包 3.45 亿的 MAU 不是一天建起来的。

对用户来说，最务实的做法就是下载试试。反正免费，每天 1000 万 Token。你可能会碰到一些让你意外的时刻，比如当你说”把 Windows 那些乱七八糟的广告关掉”，然后它真的就关了。