说明
Genspark Super Agent与Genspark Deep research(老)是两个完全不同的功能,Super Agent是通用Agent,但可以当做深度研究工具来用
Super Agent已经于4月2日正式上线
可以从首页 → 智能体里进入,即https://www.genspark.ai/agents?type=super_agent
Super Agent现在网上几乎搜不到资料或评测,以下自己测试的,新产品经常调整功能,如有不符,感谢指正
各家Deep research一般都是:节 → 小节 → 正文三层结构
Genspark是百度小度的CEO和CTO出来创业搞的,类似Monica,Heygen,Minimax,Kling都是中国人搞的但主要做出海
很多人说百度是中国人工智能和自动驾驶黄浦军校,自己做啥啥不行,次次起个大早,赶个晚集,但培养了很多人才,还真差不多
Genspark Super Agent vs Genspark Agentic Deep Research(新)
相同点
都是250402面市
应该是相同的底层,一个通用目的,一个专用目的
区别
Super Agent对标Manus,Agentic Deep Research对标O3 Deep research
本文写的是Super Agent,Agentic Deep Research还未测试
Genspark老的Deep research已经下线了
方法
Super Agent有以下两种输出模式
如果不在提示词里明确要求模式,则系统随机选其中一种
Ⓐ不输出文件模式(聊天/Markdown)
方法:明确写“不要输出html”,就会输出文本
优点:不会因html浪费token。
因为是多次输出,不受html输出32kt上限限制,实测最多一次要求5万字,输出41kt。一般不会出现无法继续的截断
缺点:每8k要自己输入“继续”,麻烦。有时忘了继续,间隔太久,会继续不上
Ⓑ输出文件模式(html)
方法:明确写“生成html报告”
优点:无需自己点继续。可以导出为pdf。有一个单独的html网页
缺点:其他Deep research那样强制限制规划字数以避免截断,Super Agent不规划字数,如果要求字数过多,到32kt上限,必然截断,办法:不要指定超过2万的字数。如果字数必须超过2万,就换用不输出文件模式
html截断时,不能用“继续”,如果输入“继续”会重头生成一个新的,仍然截断
html浪费1/4左右token和积分
html浪费1/4字数上限,就是32k里,一般浪费8k左右用在html上
减少浪费办法:一部分浪费是html标签占用的token,这部分无论怎样写提示词,都不会删除掉
另一部分浪费是html缩进,换行,空行,css造成的,这部分可以通过提示词删除掉,并不影响最终显示效果,能节省大约1/8的token
提示词为:“输出为html文件,禁用空格,禁用空行,禁用换行符\n
,禁止css,禁用<style>
,禁用style=
,禁用class=
”。如果没作用就在提示词前中后多粘贴几次,作为强调。有时遵从有时不遵从
如果写“输出.txt”,不会遵从指令,还是会输出html
主要优点
输出字数
Super Agent:输出字数多,字数遵从性好。要求30k字,html版上限可以2万多字,文本版可以3万多字。
其他Deep research:一般也就几千字,即便用提示词工程也很难突破1万字
tiga6367说:
O3:25K左右
Gemini:最多10K左右
Perplexity standard:3.5K左右
Perplexity high:最高6.8k
Grok3:3.5k左右
价格
Super Agent:比较便宜,按输出字数收费,24kt=100c,免费会员每天给200c,大概能使用满血1次,小输出几次
Genspark会员$25/月÷10000c=$0.25/100c,可以薅
用满血32k约150c=$0.375。
不会统计总消耗,要自己点左下角图标,自己用前后Credit数相减,算Credit消耗
按API算,输出100c($0.25) ÷ 0.024mt = $10/mt,比Claude API输出$15/mt还便宜,这还没算输入成本
因为没正式上线,不排除正式上线后涨价
O3:官价算Deep research占包月一半成本,也要$1/次(20多k字 )
Genspark Deep research(老):按次数收费,官网说每次200c,免费会员每天一次,但实测貌似没有扣积分
Gemini:免费会员每个月5次,$20会员每天20次
Perplexity:免费会员每天5次
Gork3:免费会员每天5次,$8会员每2小时10次
底模
Super Agent:底模强,推测用的是Claude3.7thinking或Mixture-of-Agents(不确定)
O3:底模是O3(以后可能改名GPT5),不是O3-mini,是现在唯一使用O3的途径。O3应该强于2.5和3.7
Genspark Deep research(老):用的是Mixture-of-Agents,不能选模型,具体怎么混合的不清楚
Gemini:250227之前用的是1.5pro,之后貌似改2.0flash thinking了
Perplexity:用的是r1。有一个隐藏的high模式,需要安装Complexity才能看到,可能用的r1或claude(不确定)
通用性
Super Agent:是通用智能体。但暂时没测试除了深度研究以外其他性能
O3:专用研究报告格式,让他做其他事,例如推理题,可能不遵从指令
Genspark Deep research(老),Gemini,Perplexity:都是专用研究报告格式。格式较规范但比较死板,通用性差
Grok3:是通用深度搜索
次要优点
技术
Super Agent:是新出的,正在内测,抄各家作业,技术可能更新一些
其他Deep research:都出了有段时间了,例如Gemini(241210),Genspark Deep research(老)(250127),O3(250202),Perplexity(250214),Grok3(250220)
过程透明
Super Agent:可以看到研究过程,所有来源网址,阅读全文的正文,思维链,html代码
O3:研究过程只有简单的目录
其他Deep research:通常都看不到研究具体过程
质量
字数是质量的重要组成部分,别家小几千字的“深度研究”,个人认为也就是“深度搜索”级别的,做学术研究或复杂的主题,字少根本说不清楚。
比如非虚构书籍一个章节都要一两万字,是有原因的。
Super Agent:质量明显不如O3,比其他家Deep research略强。如果2.5pro Deep research上线,应该也不错
O3:我用o3生成了100多篇研究,质量断档领先,用豆而且平均质量很高,很少浪费,不需要抽卡
其他Deep research:有个普遍问题就是内容之间关联性差,更像东抄西抄,罗列事实。
经常搜了几百个来源,一共输出几千字,平均到每个来源才几十字,所谓“研究”,更像是“目录”,说了很多个小节,每个小节几十上百字,蜻蜓点水,根本说不透。而且很多小节跟主题没太大关系
O3从不显示几百个来源什么的,感觉是认真阅读了10来篇来源全文,认真研究,融会贯通的感觉,一般只说20多个小节,每个小节800字都能说比较透
主要缺点
正文引用显示来源链接
Super Agent:不会显示来源链接
O3:有链接,而且直接跳转到引用段落,链接全部有效,没有失效或瞎编的
其他Deep research:有链接,但点击显示原文开头,不会跳转到引用段落
次要缺点
稳定性
Super Agent:偶尔中途会出错,可以点“重试”,通常不扣钱
阅读原文全文数量
O3:一般阅读10篇左右
章节编号遵从指令
因为报告经常需要人工修改,删减,合并,拆分,调整顺序等,如果生成编号,人工编辑后反倒容易编号跳跃或错乱。不如不要编号,或者由word/Obsidian等自动生成章节编号
Super Agent:要求不要编号,有时遵从,有时不遵从
O3:无此问题
参考文献概述字数
Super Agent:上限300字
O3:上限600字
截断
Super Agent: 对字数指令遵循能力较强,但没有字数上限观念。到32k就截断,
O3:没出现过截断现象
其他Deep research:字数要求高,就不会遵从,因此通常不会截断
Bug
Super Agent: 编辑提示词有时会自己重复一遍
Using Tool | Search 或 Scholar Search → View不能切换。办法:先点一下Using Tool | Read → View
Super Agent vs Manus
相似点
都是通用Agent
都有回放功能
都是中国人开发的产品出海
区别
Genspark用的Mixture-of-agents多模型混合,具体怎么混的不知道,输出风格像Claude
Manus海外版的Claude3.7thinking底模,国内版用的qwen-qwq
Manus比较贵,大概$1.5/10分钟,最大输出30~60分钟,包月有$40和$200两档,很难薅羊毛
Super Agent比较便宜,免费每天也可以用1~几次,包月$25,容易薅羊毛
Manus可以调用的工具很多,直接使用远程服务器的Linux虚拟机,理论上Linux能运行的浏览器,桌面软件,代码运行环境他都能运行
Super Agent是否在虚拟机里执行不清楚,自称80+工具,可以浏览网页,截图,打电话(限美日)
实践
实践1:Super Agent 不指定格式 250402
提示词:要求3万字
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:3次24条
Using Tool | Search:0条
Using Tool | Read:4次全文阅读,合计40k词,其中1次失败
Using Tool | Think:0.4k字
规划目录:10章36节
输出:未指定格式,随机用的文本格式,30.5k字=36kt,继续4次,输出完整,消耗150c,中间出错一次点恢复继续
参考文献:
链接:https://www.genspark.ai/agents?id=531e7165-a8ea-4de8-ab28-a144981821dd
实践2:Super Agent Html版 250402
提示词:要求6万字
Using Tool | Parallel Search:1次50条
Using Tool | Scholar Search:2次14条
Using Tool | Search:0条
Using Tool | Read:10次全文阅读
Using Tool | Think:0.4k字
规划目录:7章无节
输出:消耗162c,未指定格式,输出两个版本,两个版本没关系
html版:16.7k中+3.3k英,32kt,其中html占用了10kt,截断没输出完
html版链接:AI时代超级个体研究报告
文字版:5.5k中+0.5k英,
字版链接:https://www.genspark.ai/agents?id=209da50b-6602-4d66-8315-7f9dd09df18a
参考文献: 16个,每来源概述要求1000字,实际输出300字
实践3:Super Agent 尝试输出txt失败 250402
提示词:5万字,输出为.txt文件,不要输出html版,不要输出pdf版
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:5次35条
Using Tool | Search:2次20条
Using Tool | Read:6次阅读来源全文
Using Tool | Think:300字
规划目录:11章
输出:未遵循指令,仍输出html版,输出25k正文+7khtml=32k截断,写完大概一半,消耗约150c
要求继续不遵从,会重新创建一个html版,重新消耗150c,仍然截断
链接:https://www.genspark.ai/agents?id=20e3c706-4c44-47b4-84ca-aa4f869df612
参考文献:
实践5:Super Agent 禁止html 250402
提示词:输出1k字,阅读1来源全文,严禁输出文件,参考文献概述600字
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:1次8条
Using Tool | Search:1次10条
Using Tool | Read:7次,不太遵从指令
Using Tool | Think:
规划目录:
输出:文本。输出2.8k中(不含参考文献)
链接:https://www.genspark.ai/agents?id=aa1e007a-6779-43bc-adf3-c37f4e2f7223
参考文献:5条,每条概述230字
实践6:Super Agent Html版 250402
提示词:输出为html文件,html不要使用任何缩进,空行,换行符。输出1k字,阅读1来源全文,严禁输出文件,参考文献概述600字
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:1次8条
Using Tool | Search:1次10条
Using Tool | Read:7次,不太遵从指令
Using Tool | Think:
规划目录:
输出:文本。输出2.8k中(不含参考文献)
链接:https://www.genspark.ai/agents?id=aa1e007a-6779-43bc-adf3-c37f4e2f7223
参考文献:5条,每条概述230字
实践7:Super Agent md版 250402
提示词:5万字
Using Tool | Parallel Search:0条
Using Tool | Scholar Search:3次7条
Using Tool | Search:9次90条
Using Tool | Read:9条
Using Tool | Screenshot:6次,
使用屏幕捕获工具获取被robots.txt阻止的内容(linkedin)
卡在CF验证(Medium)
没卡(psychologytoday)
卡在Cookie页面(nature)
Using Tool | Think:
规划目录:
输出:27k中+3k英=41kt,消耗201c
链接:https://www.genspark.ai/agents?id=a8d5e87d-d14c-484c-b39d-a7c70b526aca
参考文献:上百条,没有概述
实践8:Genspark Deep research(老) 250402
提示词:要求3万字
搜索:266来源,
输出:输出3k中+0.2k英,完全不遵从字数指令。
参考文献:7个,要求每来源概述1000字,实际0字
文字版链接:https://www.genspark.ai/spark?id=e371ac65-ae04-4d17-a174-c66da5f7ff45
评价:基本就是个目录,根本没法用
输出这么少,来源多有啥用,平均每个来源输出仅10个字!
充其量只能算Deep search,根本算不上Research
实践9:O3 Deep research 250325
提示词:要求3万字
输出:14k中2k英
参考文献:14个,如果要求概述字数可以每来源600字
链接:超级个体与AI时代的研究 | Chat01