QClaw 初探索——写文章、编程和文献整理

`QClaw` 是什么

QClaw是腾讯电脑管家推出的桌面AI助手，基于OpenClaw开源框架开发，支持微信直联远程操控电脑。内置Kimi-2.5模型和5000+技能生态，实现自动开发、学术研究等功能。官网：QClaw官网:https://qclaw.qq.com/

官方定义：随时随地，微信一下，QClaw 帮你搞定一切。

官网上的能力推介

由于目前还处于邀请制内测中，我昨天晚上才拿到内测码，今天完成了毕业论文预答辩之后就马不停蹄地试玩做了一波测评。主要的探索包括：让它帮我写文章、交代编程任务帮我完成，以及尝试做文献整理。

感兴趣的小伙伴也可以填表申请内测码：官方内测码申请:https://wj.qq.com/s2/25871229/abe7/

申请到了内测码之后，在官网上下载软件，登录微信，填入内测码即可使用；界面如下：

软件界面

功能测试

写文章

我有一个微信公众号：EatRice的智能建造之旅，但是我作为博士研究生，主业是写论文，小论文和大论文。而运营公众号和博客也需要写相关的作品。论文是有着高信息密度、高专业门槛的材料，而公众号和博客上的文章需要给出通俗易懂和简化描述的表达，因此身为博士生真的很难在两者之间找到一个平衡。

因此在装上QClaw之后，我就立刻马上马不停蹄日夜兼程筚路蓝缕地咨询了一下QClaw如何运营公众号，多多涨关注以及如何保持稳定更新（其实如果只是问这个，不需要用QClaw直接在大模型对话框里面问就好了）。但是！醉翁之意不在酒，在乎让它给我打工也！然后它叫我要聚焦一个专业垂直领域，然后多多出文章。我问它应该出什么文章，它说应该从 BIM 入门到精通开始。

OK! 那就干呗！麻烦你帮我在桌面上新建一个文件夹，然后帮我把文章写起来！

可以通过微信发指令给装好QClaw的机器执行任务

于是，它就真的在桌面上新建了一个文件夹，如下图所示。

真在桌面上创建了一个文件夹

我看文件夹有了，那就框框去写呗，然后它就框框写了。先让他写了两篇，我看全是文字，看的很枯燥乏味。于是我补充了一条新的要求，让它能够输出mermaid流程图或框架图，这样就图文并茂。

开始自动化写文章，等就完事了

看起来效果还不错，我进一步叫它帮我存档在我的文档托管平台上，它能够自动打开浏览器，识别登录面板，然后自动填充登录框，并且登录。但是登录之后就没有进一步的动作了，估计是工具链还没到达这么长。

能打开浏览器并自动输入账号密码进行登录

写代码

进一步地，我还有一些编码的工作打算让它做做试试，看看QClaw的自动化编码任务能做到什么程度。首先我告诉机器人，我的电脑上有一个项目，叫做plaxisproxy_excavation，我跟它说用vscode软件打开这个项目，并且帮我实现指定的功能。如下图所示：

最初给的任务指令

QClaw在 MAC 上通过find命令正确地在硬盘上找到了这个项目，并且成功用vscode软件打开了，但是编辑文件失败了，可能是由于对话中的任务链过长，如下图所示：

项目被正确识别，且被打开

然后我叫它进一步尝试修改，并且输出修改日志，他能够正确修改，并且输出了修改日志，而且还给了一个输出示例给我：

修改日志

新建的文件和输出的示例

其输出的IFC文件的示例能够被跑通，且能够通过指定的 IFC 可视化工具进行可视化，但是现在只是随机创建了几个元素。我需要一个基坑工程的 IFC 模型，然后叫它进一步规范化输出基坑工程的 IFC 模型示意图。此测试的目标是考察机器人能够正确地理解基坑工程模型的需求，同时基于 IFC 规范将其创建出来。如下图所示：

进一步更新 IFC 模型

生成的 IFC 初稿

由图可见，当前的助手理解这个复杂的需求还比较困难，先是没有任何实质性的修改，然后还发生了几次写文件失败的问题。但是QClaw默认不输出执行日志，所以仅凭当前的对话也无法判断出到底是哪里出现了问题。好在QClaw最后还是成功完成了目标生成，如下图所示：

进一步更新 IFC 模型

进一步更新的模型

但是生成的模型还有还有一些问题，我进一步让它完善修改：

进一步完善修改指令

但是这次生成的模型方向对了，但是文件不完整，无法成功地进行可视化渲染，我将文件传给了 ChatGPT，帮我分析出了文件缺失了部分字段，但是该修改的内容都成功修改了，如下图所示。

分析 IFC 无法渲染的错误原因

分析大致是因为生成这个文件时思维链达到了限制长度，导致方向对了，但是输出长度不够被直接截断了。最终更新后的可视化模型如下所示。

进一步优化后的 IFC 模型

当然，当前的状态仍然尚未达到工程可用的程度，但是通过当前的有限信息量的提示词能做到这样已经相当不错了。笔者认为，当前这一步的效果，以及前面几个步骤的成功率，与使用的大模型的基础能力以及限制的上下文长度有关。

收集整理文献

官网上给了一个文献整理的示例，我直接运行了这个示例，效果还不错，如下图所示：

默认任务

现在我们团队在研究开发用于处理 CAD 图纸信息的 Agent，然后想让它收集一些相关的参考文献，如下图所示：

任务执行情况

根据执行日志可以看到，模型先是对我提的需求做了分析，然后进一步地做了任务分解：

Agent 在 CAD 图纸识别中的应用框架
关键参考文献及其具体贡献
导出为 PDF 先生成内容文档，再转 PDF

方向基本正确，然后在执行pandoc命令，但是我电脑上没有安装这个工具，不知道它把软件放在哪里，调用还成功了。我进入到任务运行日志的文件夹中，发现文件被成功写入，如下图所示。

文件被成功写入

打开文件查看，整体效果还蛮不错，如下图所示。

文件内容

体验与认知

体验

一圈试玩下来，我对 QClaw 最大的感受是：它和普通的大模型对话框，已经不是同一类产品了。

如果只是聊天、问建议、写几段文案，那么它和我平时用的大模型对话差不太多；但一旦进入“打开软件”“创建文件夹”“修改本地项目”“登录网页”“调用本机工具链”这些动作层面，QClaw 的价值就一下子出来了。它不只是“会回答问题”，而是开始具备了一点“替我动手”的意味。这种从“会说”到“会做”的跨越，才是它让我觉得最有意思的地方。

从这次体验来看，我觉得 QClaw 当前最适合的场景，是那些目标明确、步骤相对标准化、容错空间比较大的任务。比如批量写一些结构固定的文章、帮忙搭好文件目录、打开指定项目、执行若干轮代码修改、整理文献资料、跑一些已经比较成熟的工作流。
这些任务的共同点是：人类已经知道自己想要什么，只是懒得一下一下点鼠标、敲命令、复制粘贴。这个时候，AI 代理的价值不是“替你思考全部问题”，而是把人从重复劳动里解放出来。

但与此同时，这次测试也让我很明确地看到它现在的边界在哪里。

首先，短链路任务明显比长链路任务稳定得多。像“新建文件夹”“打开项目”“按要求生成初稿”这种动作，QClaw 往往完成得很干脆；可一旦任务开始变长，涉及多轮理解、多次修改、多个软件之间切换，或者要持续保持上下文一致性，成功率就会显著下降。前面测试里无论是网页登录后续动作中断，还是 IFC 文件生成过程中出现写入失败、内容截断、文件不完整，本质上都说明了这一点：它会做，但还没稳到能一路丝滑做完。

其次，它对复杂专业需求的理解，已经有方向感，但离工程可用还有距离。
这次我拿基坑工程 IFC 模型去“拷打”它，其实就是在故意提高题目难度：不仅要理解工程对象本身，还要理解 IFC 规范表达，还要把结果组织成一个能被可视化工具正常渲染的文件。最后它确实做出来了一个能逐步逼近目标的结果，这说明它不是完全没有建模能力；但中间暴露出来的问题也很典型——方向能对，细节容易丢；局部修改能成功，全局完整性不一定保得住。换句话说，它已经能当“副驾驶”，但还当不了“总工程师”。

再进一步说，我觉得 QClaw 当前更像一个执行力很强、但仍然需要盯着的实习生。
你给它一个明确任务，它可以立刻开干；你发现偏了，再把它拽回来，它也能继续修；但你不能指望它在复杂任务里始终不跑偏，更不能默认它每一步都做对。很多时候，它最需要的不是“更强的自主性”，而是更长的上下文、更稳的工具调用，以及更透明的执行日志。尤其是在写代码和文件生成这类场景中，日志透明度几乎直接决定了可调试性。现在默认不怎么输出执行日志，很多问题就只能靠结果反推原因，这会让排错成本上升不少。

文献整理这个案例也很有代表性。
它对任务的分析和拆解其实是对的，说明模型在“理解任务意图”这一层没太大问题。像我这次让它去收集 CAD 图纸信息处理相关的参考文献时，它能够先把需求拆成“应用框架、关键文献与贡献、最终导出 PDF”这几个部分，整体思路是比较清晰的。后续在执行 pandoc 命令时，虽然我本机并没有提前把这个工具配置到一个很顺手的状态，它对本地工具位置的处理也不算特别聪明，但命令本身还是成功调用了。更关键的是，我到任务运行日志对应的文件夹里检查后，发现内容文件其实已经成功写出来了，而且打开看，整体质量还不错。
这说明现阶段的 Agent 产品，很多时候并不是“不会做”，而是最后一公里的工具衔接和环境适配还不够丝滑。模型负责理解任务和组织内容这一段，已经能交出比较像样的结果；真正影响体验的，往往是本机工具链、路径识别、格式转换这些执行细节。换句话说，在文献整理这类任务上，QClaw 已经具备了相当实用的雏形，只是距离“全流程无感完成”还差一点打磨。

认知

所以如果让我给 QClaw 当前的状态下一个判断，我会说：

它已经让我看到了桌面 Agent 的产品形态，但还没有完全走到“放心托付生产任务”的阶段。

它最让我兴奋的，不是某一条指令执行成功了，而是我能很明显地感觉到：以后我们和电脑交互的方式，可能真的会变。过去我们是自己找文件、开软件、点菜单、填表单；以后很可能是直接把目标告诉 Agent，让它去调度这些动作。这个方向一旦跑通，生产力工具的交互范式会发生非常大的变化。

当然，回到当下，QClaw 还处在一个很典型的早期阶段：惊喜很多，瑕疵也很多；能用，但还不够稳；能打动人，但还没到完全替人干活的程度。
可也正因为它还不完美，所以这类产品现在才特别值得体验。因为你能非常清楚地看到未来的轮廓，也能非常具体地摸到今天的天花板。

而对我来说，这次测下来最重要的认知其实只有一句话：

QClaw 不是一个“更会聊天”的 AI，而是一个已经开始尝试接管桌面执行流的 AI。
只要这个方向继续迭代下去，它后面真正值得期待的，就不只是“帮我回答问题”，而是“帮我把问题做完”。

写在最后

这里有一些使用的小 tips：

如果使用微信对话功能来指派任务的话，需要手动指出输出操作日志，否则很难推断他具体在做什么，结果怎么样；
给到的prompt还是需要尽可能详细，才能给出较好的结果；
使用 GUI 软件时目前只能单开对话，如果切换对话会导致当前的对话终止，一次只能执行一个任务。

当然我这短短几个小时的体验肯定还没有完整地开发QClaw的全部功能，后续我将陆续地试玩QClaw，尝试解锁更多的玩法，同时尝试量化分析具体任务的状态，并与大家分享体验，欢迎讨论！

哈哈哈哈哈最近一段时间的公众号推文有着落了，看我慢慢把QClaw生成的BIM系列教程分享给大家～🐶🐶🐶

欢迎关注我的微信公众号：EatRice的智能建造之旅

#QClaw #自动化工作流 #测评

QClaw 初探索——写文章、编程和文献整理

https://www.eatrice.cn/post/QClawTrying1/

作者

吃白饭-EatRice

发布于

2026年3月15日

许可协议

毕业论文排版（3）：优雅地实现公式自动编号、格式化对齐以及交叉引用下一篇

QClaw 初探索——写文章、编程和文献整理

QClaw 是什么

功能测试

写文章

写代码

收集整理文献

体验与认知

体验

认知

写在最后

`QClaw` 是什么