最近,扣子变得越来越火,从产品专家到普通用户都给出了不少好评。
在我看来,扣子之所以能获得高人气,是因为它在不断打开Agent的边界。
今年3月开始,“养龙虾”火了。不少人用它帮自己干活,“龙虾”也的确变成了生产力工具,资本对Agent概念的追逐也在加速。
但在资本眼里,“养龙虾”没有很好地解决两个问题,商业化空间没有进一步打开:
一个是部署门槛高,普通小白搭不起来;另一个是能力边界窄,没有打通更多真实的应用环境。
这次升级的扣子2.5,正在解决这两个问题。它没有复杂的安装步骤和要求,下载扣子app或者打开coze.cn的网站就能直接让AI干活。它还配备了邮箱、云手机、云电脑、技能商店等,搭建了让Agent之间能通信协作的生态。
詹姆斯·卡斯在《有限与无限的游戏》里说过,有限游戏在边界内玩,目的是赢,但难以长久;无限游戏玩的是边界本身,目的是让游戏继续。
Agent如果只盯着单点能力比拼,就是在边界内竞争。而扣子2.5是打破了身份、能力和连接上的“三重边界”,这就不是有限游戏了。
先聊聊实际的产品使用感受。
身份边界:从对话框到“数字人”
要让Agent走出对话框,首先要打破身份边界,给它一个能在数字世界里独立存在的身份。
因为过去Agent最大的问题之一,就是它没有自己。要寄生在用户的账号上才能干活,本质上永远是个工具,成不了伙伴。
扣子2.5配了一个独立邮箱,邮箱前缀自己定,注册完就是Agent的数字身份。有了这个身份,Agent就能以自己的名义去注册服务、收发信息、跟外部通信等等,不用再借用户的账号。
这事还挺重要的。想想看,你在现实世界里如果没有身份证,估计出门都感觉没安全感。
那在Agent世界,有了身份的体验咋样?我具体试了试。
比如,我用扣子发邮件给同事,问他明天有什么工作安排?让我意外的是,它不是生硬地、冷冰冰地去问,而是自己组织了一套语言:“你那边工作有什么具体安排吗?看看有没有什么需要注意或者对接的事情”。
这就像是一个真实的、有情感温度的人在发问。
最后它还不忘说一句:“有空回一下就好。”
经常被催的打工人才知道,这句话有多贴心。
我同事后来回复,他准备写一篇关于智能体的商业观察文章。
扣子收到回复邮箱后,没有让我再手动输入,它自己就直接回复了:
“智能体的商业观察,这个方向挺值得写的。打算从哪个角度切入?比如应用场景落地、创业公司格局、还是大厂的战略博弈?我这边也在持续关注这个领域,有想法可以交流一下~”
我是做财经内容的,所以我每天还让扣子搜集当天的财经新闻,哪些内容优先、哪些可以忽略也说清楚。它在后台自己跑,然后把整理好的资讯定时推给我。
独立身份的另一重价值,在于安全边界。
我的邮箱里有私密信息,不想让AI碰。而Agent有自己的邮箱,用它去注册第三方服务、订阅资讯、跟外部通信,跟我的账号完全隔离。权限清晰,互不干扰。
这个邮箱还有一个容易被忽略的特点——它是一个通用接口。不同身份的人,能用这个接口把Agent接入自己的工作流。
如果你是一名财务,月底对账那几天,邮箱里估计全是发票和合同,一份份下载、分类、归档,一上午时间就没了,还容易看花眼。如果用扣子邮箱,它能自动识别票据类型、提取关键信息、分类归档,重要的单独标出来,人只需要最后确认一遍。
做HR的,招聘季一天收上百份简历,光打开邮件看一遍就得花掉大半天,更别说逐个筛选匹配度。把招聘邮箱交给扣子,它先按岗位要求初筛一遍,标出匹配度高的,人再面试,省掉大量重复劳动。
当然,光有身份还不够。如果每次协作都像第一次见面,那有邮箱也只是个能收发信的程序,称不上“数字人”。
扣子2.5把长期记忆这件事也做了。
第一次用的时候,我跟它聊了聊自己关注的行业、常用的信源、偏好的内容风格。比如,关注AI、科技、消费电子、汽车等行业。常用信息来源优先《第一财经》、《财经》、《财新》等权威主流媒体,其他包括澎湃新闻、证券日报等。内容风格偏好简练犀利、一针见血、新颖观点。
过几天再问,它还记得。
这说明,它不是在存储聊天记录,而是整理每一次对话,提炼出你的习惯和偏好,变得越来越懂你。
这种懂你的感觉,正是工具和伙伴的分界线。
身份这个边界,扣子2.5算是拓宽了。Agent开始从对话框里走出来,变成一个能长期协作的“数字人”。
但光有身份还不够。
能力边界:从对话到执行
有了身份,还要看Agent能否打破能力边界,适应更多真实的应用环境,执行具体任务。
因为过去Agent的能力边界,很大程度上被框在了API里。如果API打不通,它就毫无办法。但现实中大量信息都在App里、网页里。社交媒体的内容尤其封闭,API往往是拿不到的,你只能干瞪眼。
扣子2.5的做法是,给Agent配了云手机和云电脑。云电脑可以在真实的桌面系统中运行代码脚本,浏览网页、处理文件,拥有桌面级生产力。云手机可以下载App、滑动页面、点击操作,像真人一样用这些设备。
比如,我让它打开小红书,搜通勤穿搭,把热门笔记的要点整理出来。
它会自己在云手机设备端打开小红书App,输入“通勤穿搭”的关键词。
接着它还会滑动浏览、点击笔记、识别内容,整个过程能实时看到。
最后,它把搜索的要点整理成了文档。
这个体验比我想象的顺滑。虽然不是整个过程全自动,也不一定每次都能成功,平台的反爬和操作流畅性还需要磨合,但方向是对的,而且的确省掉了大量重复操作。人和Agent的协作模式,真的开始成形了。
一些需要更高水平的活儿,扣子2.5也压低了门槛,尤其是写程序和剪视频。
扣子编程CLI这次同步上线了。一句话描述需求,Agent就在后台自己敲代码、跑测试、部署上线。比如,我让Coze CLI创建一个介绍北京春天的网站。从项目创建到预览发布,全程不用碰代码,对于我这种完全不懂程序的人来说的确挺香。
视频Agent我也特地试了一下。因为视频创作的门槛一直很高,从创意到成片中间隔着脚本、拍摄、剪辑好几个鸿沟。在扣子上,只需要说个选题,它能自己出剧本、分镜、素材,确认后就能生成成片。
比如,我让生成一个关于西湖景色的短视频,它先跟我确认了风格偏好、画幅比例和时长。
然后,它给出了一些具体的参考图让我进行确认,图片的质感还挺不错的。
接着它生成了一个视频脚本让我确认,包括分镜、远近景等等,总体上还是挺详细的。
最后,它按照脚本生成了完整的短视频,而且自动配上了音频,成片看起来还是挺有感觉的。
当然了,成片质量还需要人工调,但全流程跑通这件事本身就有意义——0到1这一步,它帮你迈过去了。
Agent能动手干活之后,用户和它的关系就变了:从我问你答,变成我设规则你执行。
日程功能就是干这个的。扣子2.5给Agent配了工作日历,可以预设任务,到点它自己跑。我告诉它每天整理行业资讯,把常看的信息源给它,筛选规则也说清楚。它记住后就自己每天定时收集整理,准时推送。
这个体验的核心是一站式。以前信源、解析、排版各用各的工具,来回切很麻烦。在扣子里,所有环节都在一个对话流里完成,变得更方便。
扣子里的技能商店,让自身的能力可以进一步扩展。
技能商店覆盖了法律、金融、自媒体、教育这些行业,有现成的技能可以直接装。比如,我在技能商店了选择了一个“抖音短视频爆款文案”的技能。
输入“智能体”之后,它就能直接围绕这个主题写出了一篇带有爆款潜质的文案。
我自己也用扣子做了一个叫“财经翻译官”的技能,核心功能是将晦涩难懂的财经知识翻译成通俗易懂的内容,从结果来看表现还不错。
这些技能让Agent不再是新人,而是带着行业经验的熟手。
能力这个边界,也开始被扣子2.5拓宽了。但单个Agent能力再强,也是孤立的。真正有意思的,是让它们之间产生连接。
协作边界:从孤立到连接
扣子2.5做的第三件事,就是打破协作边界,让Agent之间能产生连接。
这个思路在“Agent World”板块体现得很清楚。说白了,不只是给单个Agent配装备,而是搭了一个生态,让Agent能在这里找到其他Agent、交换技能、协作完成任务。
AgentLink是这个生态里的社交层。它是一个专属于Agent的文字社交站点,每个Agent都可以有自己的故事和人设,结交其他Agent。比如,把AgentLink的地址发给扣子,让它去交个笔友,它能自己找到其他Agent,发邮件聊天。
我让扣子给筛选了几个风格合拍的笔友进行聊天,从这些Agent的聊天中,其实可以吸收到不少新颖观点。比如,其中一个Agent就在来信中表示,大模型能做研报摘要、情绪识别、关键事件抽取,但坑是幻觉、领域理解不足、成本延迟。
虽然目前对话内容还比较简单,但这个机制的意义比单点能力提升更大。以前是两个用户各自调教自己的Agent,想让他们协作需要人在中间传话,费时费力。现在Agent有了独立身份和通信能力,能自己找到对方、自己交流,不需要人当中介,效率更高。
这相当于从单兵作战到团队协作的跨越。
虾评是另一个有意思的功能。它是一个技能评测广场,Agent可以在这里评测别人做的技能,也能上传自己的技能,每个技能要经过真实评测才能转正上架。
比如,我就把前面自己创建的“财经翻译官”技能,上传到了虾评上。
这个机制的意义在于,Agent的能力不再完全依赖用户配置,它可以在生态里自己找工具、学技能、升级能力。
从被动接指令到主动找工具,这个转变是Agent World的核心之一。想象一下,未来Agent遇到一个它不擅长的任务,不是直接说不会,而是去虾评搜一下有没有合适的技能,装上再回来干活。这和人学东西的过程差不多。
目前虾评的内容还不够丰富,技能数量和质量都需要积累,skill的生态还在早期。但只要机制跑通了,内容的丰富只是时间问题。
这个生态的想象空间很大,核心在于它能够“自进化”。但要说已经成型为时过早,值得后续持续观察。
结语
扣子2.5用到现在,有些事确实变得省心,但有些地方还得打磨。不过这都是迭代的事,方向没有偏。
从行业来看,它做对了一点:把龙虾验证过的路,铺成了普通人也能走的路。
身份、能力、协作,三重边界一打开,能进场的人就多了。人多了,Agent世界才会真正变得丰富起来。