QClaw 初探索——写文章、编程和文献整理
QClaw 是什么
QClaw是腾讯电脑管家推出的桌面AI助手,基于OpenClaw开源框架开发,支持微信直联远程操控电脑。 内置Kimi-2.5模型和5000+技能生态,实现自动开发、学术研究等功能。官网:QClaw官网:https://qclaw.qq.com/
官方定义:随时随地,微信一下,QClaw 帮你搞定一切。

由于目前还处于邀请制内测中,我昨天晚上才拿到内测码,今天完成了毕业论文预答辩之后就马不停蹄地试玩做了一波测评。主要的探索包括:让它帮我写文章、交代编程任务帮我完成,以及尝试做文献整理。
感兴趣的小伙伴也可以填表申请内测码:官方内测码申请:https://wj.qq.com/s2/25871229/abe7/
申请到了内测码之后,在官网上下载软件,登录微信,填入内测码即可使用;界面如下:

功能测试
写文章
我有一个微信公众号:EatRice的智能建造之旅,但是我作为博士研究生,主业是写论文,小论文和大论文。而运营公众号和博客也需要写相关的作品。论文是有着高信息密度、高专业门槛的材料,而公众号和博客上的文章需要给出通俗易懂和简化描述的表达,因此身为博士生真的很难在两者之间找到一个平衡。
因此在装上QClaw之后,我就立刻马上马不停蹄日夜兼程筚路蓝缕地咨询了一下QClaw如何运营公众号,多多涨关注以及如何保持稳定更新(其实如果只是问这个,不需要用QClaw直接在大模型对话框里面问就好了)。但是!醉翁之意不在酒,在乎让它给我打工也!然后它叫我要聚焦一个专业垂直领域,然后多多出文章。我问它应该出什么文章,它说应该从 BIM 入门到精通开始。

OK! 那就干呗!麻烦你帮我在桌面上新建一个文件夹,然后帮我把文章写起来!

于是,它就真的在桌面上新建了一个文件夹,如下图所示。

我看文件夹有了,那就框框去写呗,然后它就框框写了。先让他写了两篇,我看全是文字,看的很枯燥乏味。于是我补充了一条新的要求,让它能够输出mermaid流程图或框架图,这样就图文并茂。

看起来效果还不错,我进一步叫它帮我存档在我的文档托管平台上,它能够自动打开浏览器,识别登录面板,然后自动填充登录框,并且登录。但是登录之后就没有进一步的动作了,估计是工具链还没到达这么长。

写代码
进一步地,我还有一些编码的工作打算让它做做试试,看看QClaw的自动化编码任务能做到什么程度。首先我告诉机器人,我的电脑上有一个项目,叫做plaxisproxy_excavation,我跟它说用vscode软件打开这个项目,并且帮我实现指定的功能。如下图所示:

QClaw在 MAC 上通过find命令正确地在硬盘上找到了这个项目,并且成功用vscode软件打开了,但是编辑文件失败了,可能是由于对话中的任务链过长,如下图所示:

然后我叫它进一步尝试修改,并且输出修改日志,他能够正确修改,并且输出了修改日志,而且还给了一个输出示例给我:


其输出的IFC文件的示例能够被跑通,且能够通过指定的 IFC 可视化工具进行可视化,但是现在只是随机创建了几个元素。我需要一个基坑工程的 IFC 模型,然后叫它进一步规范化输出基坑工程的 IFC 模型示意图。此测试的目标是考察机器人能够正确地理解基坑工程模型的需求,同时基于 IFC 规范将其创建出来。如下图所示:


由图可见,当前的助手理解这个复杂的需求还比较困难,先是没有任何实质性的修改,然后还发生了几次写文件失败的问题。但是QClaw默认不输出执行日志,所以仅凭当前的对话也无法判断出到底是哪里出现了问题。好在QClaw最后还是成功完成了目标生成,如下图所示:


但是生成的模型还有还有一些问题,我进一步让它完善修改:

但是这次生成的模型方向对了,但是文件不完整,无法成功地进行可视化渲染,我将文件传给了 ChatGPT,帮我分析出了文件缺失了部分字段,但是该修改的内容都成功修改了,如下图所示。

分析大致是因为生成这个文件时思维链达到了限制长度,导致方向对了,但是输出长度不够被直接截断了。最终更新后的可视化模型如下所示。

当然,当前的状态仍然尚未达到工程可用的程度,但是通过当前的有限信息量的提示词能做到这样已经相当不错了。笔者认为,当前这一步的效果,以及前面几个步骤的成功率,与使用的大模型的基础能力以及限制的上下文长度有关。
收集整理文献
官网上给了一个文献整理的示例,我直接运行了这个示例,效果还不错,如下图所示:

现在我们团队在研究开发用于处理 CAD 图纸信息的 Agent,然后想让它收集一些相关的参考文献,如下图所示:

根据执行日志可以看到,模型先是对我提的需求做了分析,然后进一步地做了任务分解:
- Agent 在 CAD 图纸识别中的应用框架
- 关键参考文献及其具体贡献
- 导出为 PDF 先生成内容文档,再转 PDF
方向基本正确,然后在执行pandoc命令,但是我电脑上没有安装这个工具,不知道它把软件放在哪里,调用还成功了。我进入到任务运行日志的文件夹中,发现文件被成功写入,如下图所示。

打开文件查看,整体效果还蛮不错,如下图所示。

体验与认知
体验
一圈试玩下来,我对 QClaw 最大的感受是:它和普通的大模型对话框,已经不是同一类产品了。
如果只是聊天、问建议、写几段文案,那么它和我平时用的大模型对话差不太多;但一旦进入“打开软件”“创建文件夹”“修改本地项目”“登录网页”“调用本机工具链”这些动作层面,QClaw 的价值就一下子出来了。它不只是“会回答问题”,而是开始具备了一点“替我动手”的意味。这种从“会说”到“会做”的跨越,才是它让我觉得最有意思的地方。
从这次体验来看,我觉得 QClaw 当前最适合的场景,是那些目标明确、步骤相对标准化、容错空间比较大的任务。比如批量写一些结构固定的文章、帮忙搭好文件目录、打开指定项目、执行若干轮代码修改、整理文献资料、跑一些已经比较成熟的工作流。
这些任务的共同点是:人类已经知道自己想要什么,只是懒得一下一下点鼠标、敲命令、复制粘贴。这个时候,AI 代理的价值不是“替你思考全部问题”,而是把人从重复劳动里解放出来。
但与此同时,这次测试也让我很明确地看到它现在的边界在哪里。
首先,短链路任务明显比长链路任务稳定得多。像“新建文件夹”“打开项目”“按要求生成初稿”这种动作,QClaw 往往完成得很干脆;可一旦任务开始变长,涉及多轮理解、多次修改、多个软件之间切换,或者要持续保持上下文一致性,成功率就会显著下降。前面测试里无论是网页登录后续动作中断,还是 IFC 文件生成过程中出现写入失败、内容截断、文件不完整,本质上都说明了这一点:它会做,但还没稳到能一路丝滑做完。
其次,它对复杂专业需求的理解,已经有方向感,但离工程可用还有距离。
这次我拿基坑工程 IFC 模型去“拷打”它,其实就是在故意提高题目难度:不仅要理解工程对象本身,还要理解 IFC 规范表达,还要把结果组织成一个能被可视化工具正常渲染的文件。最后它确实做出来了一个能逐步逼近目标的结果,这说明它不是完全没有建模能力;但中间暴露出来的问题也很典型——方向能对,细节容易丢;局部修改能成功,全局完整性不一定保得住。换句话说,它已经能当“副驾驶”,但还当不了“总工程师”。
再进一步说,我觉得 QClaw 当前更像一个执行力很强、但仍然需要盯着的实习生。
你给它一个明确任务,它可以立刻开干;你发现偏了,再把它拽回来,它也能继续修;但你不能指望它在复杂任务里始终不跑偏,更不能默认它每一步都做对。很多时候,它最需要的不是“更强的自主性”,而是更长的上下文、更稳的工具调用,以及更透明的执行日志。尤其是在写代码和文件生成这类场景中,日志透明度几乎直接决定了可调试性。现在默认不怎么输出执行日志,很多问题就只能靠结果反推原因,这会让排错成本上升不少。
文献整理这个案例也很有代表性。
它对任务的分析和拆解其实是对的,说明模型在“理解任务意图”这一层没太大问题。像我这次让它去收集 CAD 图纸信息处理相关的参考文献时,它能够先把需求拆成“应用框架、关键文献与贡献、最终导出 PDF”这几个部分,整体思路是比较清晰的。后续在执行 pandoc 命令时,虽然我本机并没有提前把这个工具配置到一个很顺手的状态,它对本地工具位置的处理也不算特别聪明,但命令本身还是成功调用了。更关键的是,我到任务运行日志对应的文件夹里检查后,发现内容文件其实已经成功写出来了,而且打开看,整体质量还不错。
这说明现阶段的 Agent 产品,很多时候并不是“不会做”,而是最后一公里的工具衔接和环境适配还不够丝滑。模型负责理解任务和组织内容这一段,已经能交出比较像样的结果;真正影响体验的,往往是本机工具链、路径识别、格式转换这些执行细节。换句话说,在文献整理这类任务上,QClaw 已经具备了相当实用的雏形,只是距离“全流程无感完成”还差一点打磨。
认知
所以如果让我给 QClaw 当前的状态下一个判断,我会说:
它已经让我看到了桌面 Agent 的产品形态,但还没有完全走到“放心托付生产任务”的阶段。
它最让我兴奋的,不是某一条指令执行成功了,而是我能很明显地感觉到:以后我们和电脑交互的方式,可能真的会变。过去我们是自己找文件、开软件、点菜单、填表单;以后很可能是直接把目标告诉 Agent,让它去调度这些动作。这个方向一旦跑通,生产力工具的交互范式会发生非常大的变化。
当然,回到当下,QClaw 还处在一个很典型的早期阶段:惊喜很多,瑕疵也很多;能用,但还不够稳;能打动人,但还没到完全替人干活的程度。
可也正因为它还不完美,所以这类产品现在才特别值得体验。因为你能非常清楚地看到未来的轮廓,也能非常具体地摸到今天的天花板。
而对我来说,这次测下来最重要的认知其实只有一句话:
QClaw 不是一个“更会聊天”的 AI,而是一个已经开始尝试接管桌面执行流的 AI。
只要这个方向继续迭代下去,它后面真正值得期待的,就不只是“帮我回答问题”,而是“帮我把问题做完”。
写在最后
这里有一些使用的小 tips:
- 如果使用微信对话功能来指派任务的话,需要手动指出输出操作日志,否则很难推断他具体在做什么,结果怎么样;
- 给到的prompt还是需要尽可能详细,才能给出较好的结果;
- 使用 GUI 软件时目前只能单开对话,如果切换对话会导致当前的对话终止,一次只能执行一个任务。
当然我这短短几个小时的体验肯定还没有完整地开发QClaw的全部功能,后续我将陆续地试玩QClaw,尝试解锁更多的玩法,同时尝试量化分析具体任务的状态,并与大家分享体验,欢迎讨论!
哈哈哈哈哈最近一段时间的公众号推文有着落了,看我慢慢把QClaw生成的BIM系列教程分享给大家~🐶🐶🐶
欢迎关注我的微信公众号:EatRice的智能建造之旅
![]()