🔥【原创长文】Genspark Super Agent vs 各家Deep Research vs Manus

说明

Genspark Super Agent与Genspark Deep research(老)是两个完全不同的功能,Super Agent是通用Agent,但可以当做深度研究工具来用
Super Agent已经于4月2日正式上线
可以从首页 → 智能体里进入,即https://www.genspark.ai/agents?type=super_agent
Super Agent现在网上几乎搜不到资料或评测,以下自己测试的,新产品经常调整功能,如有不符,感谢指正
各家Deep research一般都是:节 → 小节 → 正文三层结构
Genspark是百度小度的CEO和CTO出来创业搞的,类似Monica,Heygen,Minimax,Kling都是中国人搞的但主要做出海
很多人说百度是中国人工智能和自动驾驶黄浦军校,自己做啥啥不行,次次起个大早,赶个晚集,但培养了很多人才,还真差不多

Genspark Super Agent vs Genspark Agentic Deep Research(新)

相同点

都是250402面市
应该是相同的底层,一个通用目的,一个专用目的

区别

Super Agent对标Manus,Agentic Deep Research对标O3 Deep research
本文写的是Super Agent,Agentic Deep Research还未测试
Genspark老的Deep research已经下线了

方法

Super Agent有以下两种输出模式
如果不在提示词里明确要求模式,则系统随机选其中一种

Ⓐ不输出文件模式(聊天/Markdown)

方法:明确写“不要输出html”,就会输出文本
优点:不会因html浪费token。
因为是多次输出,不受html输出32kt上限限制,实测最多一次要求5万字,输出41kt。一般不会出现无法继续的截断
缺点:每8k要自己输入“继续”,麻烦。有时忘了继续,间隔太久,会继续不上

Ⓑ输出文件模式(html)

方法:明确写“生成html报告”
优点:无需自己点继续。可以导出为pdf。有一个单独的html网页
缺点:其他Deep research那样强制限制规划字数以避免截断,Super Agent不规划字数,如果要求字数过多,到32kt上限,必然截断,办法:不要指定超过2万的字数。如果字数必须超过2万,就换用不输出文件模式
html截断时,不能用“继续”,如果输入“继续”会重头生成一个新的,仍然截断
html浪费1/4左右token和积分
html浪费1/4字数上限,就是32k里,一般浪费8k左右用在html上
减少浪费办法:一部分浪费是html标签占用的token,这部分无论怎样写提示词,都不会删除掉
另一部分浪费是html缩进,换行,空行,css造成的,这部分可以通过提示词删除掉,并不影响最终显示效果,能节省大约1/8的token
提示词为:“输出为html文件,禁用空格,禁用空行,禁用换行符\n,禁止css,禁用<style>,禁用style=,禁用class=”。如果没作用就在提示词前中后多粘贴几次,作为强调。有时遵从有时不遵从
如果写“输出.txt”,不会遵从指令,还是会输出html

主要优点

输出字数

Super Agent:输出字数多,字数遵从性好。要求30k字,html版上限可以2万多字,文本版可以3万多字。
其他Deep research:一般也就几千字,即便用提示词工程也很难突破1万字
:smiling_face:tiga6367说:
O3:25K左右
Gemini:最多10K左右
Perplexity standard:3.5K左右
Perplexity high:最高6.8k
Grok3:3.5k左右

价格

Super Agent:比较便宜,按输出字数收费,24kt=100c,免费会员每天给200c,大概能使用满血1次,小输出几次
Genspark会员$25/月÷10000c=$0.25/100c,可以薅
用满血32k约150c=$0.375。
不会统计总消耗,要自己点左下角图标,自己用前后Credit数相减,算Credit消耗
按API算,输出100c($0.25) ÷ 0.024mt = $10/mt,比Claude API输出$15/mt还便宜,这还没算输入成本
因为没正式上线,不排除正式上线后涨价
O3:官价算Deep research占包月一半成本,也要$1/次(20多k字 )
Genspark Deep research(老):按次数收费,官网说每次200c,免费会员每天一次,但实测貌似没有扣积分
Gemini:免费会员每个月5次,$20会员每天20次
Perplexity:免费会员每天5次
Gork3:免费会员每天5次,$8会员每2小时10次

底模

Super Agent:底模强,推测用的是Claude3.7thinking或Mixture-of-Agents(不确定)
O3:底模是O3(以后可能改名GPT5),不是O3-mini,是现在唯一使用O3的途径。O3应该强于2.5和3.7
Genspark Deep research(老):用的是Mixture-of-Agents,不能选模型,具体怎么混合的不清楚
Gemini:250227之前用的是1.5pro,之后貌似改2.0flash thinking了
Perplexity:用的是r1。有一个隐藏的high模式,需要安装Complexity才能看到,可能用的r1或claude(不确定)

通用性

Super Agent:是通用智能体。但暂时没测试除了深度研究以外其他性能
O3:专用研究报告格式,让他做其他事,例如推理题,可能不遵从指令
Genspark Deep research(老),Gemini,Perplexity:都是专用研究报告格式。格式较规范但比较死板,通用性差
Grok3:是通用深度搜索

次要优点

技术

Super Agent:是新出的,正在内测,抄各家作业,技术可能更新一些
其他Deep research:都出了有段时间了,例如Gemini(241210),Genspark Deep research(老)(250127),O3(250202),Perplexity(250214),Grok3(250220)

过程透明

Super Agent:可以看到研究过程,所有来源网址,阅读全文的正文,思维链,html代码
O3:研究过程只有简单的目录
其他Deep research:通常都看不到研究具体过程

质量

字数是质量的重要组成部分,别家小几千字的“深度研究”,个人认为也就是“深度搜索”级别的,做学术研究或复杂的主题,字少根本说不清楚。
比如非虚构书籍一个章节都要一两万字,是有原因的。
Super Agent:质量明显不如O3,比其他家Deep research略强。如果2.5pro Deep research上线,应该也不错
O3:我用o3生成了100多篇研究,质量断档领先,用豆而且平均质量很高,很少浪费,不需要抽卡
其他Deep research:有个普遍问题就是内容之间关联性差,更像东抄西抄,罗列事实。
经常搜了几百个来源,一共输出几千字,平均到每个来源才几十字,所谓“研究”,更像是“目录”,说了很多个小节,每个小节几十上百字,蜻蜓点水,根本说不透。而且很多小节跟主题没太大关系
O3从不显示几百个来源什么的,感觉是认真阅读了10来篇来源全文,认真研究,融会贯通的感觉,一般只说20多个小节,每个小节800字都能说比较透

主要缺点

正文引用显示来源链接

Super Agent:不会显示来源链接
O3:有链接,而且直接跳转到引用段落,链接全部有效,没有失效或瞎编的
其他Deep research:有链接,但点击显示原文开头,不会跳转到引用段落

次要缺点

稳定性

Super Agent:偶尔中途会出错,可以点“重试”,通常不扣钱

阅读原文全文数量

O3:一般阅读10篇左右

章节编号遵从指令

因为报告经常需要人工修改,删减,合并,拆分,调整顺序等,如果生成编号,人工编辑后反倒容易编号跳跃或错乱。不如不要编号,或者由word/Obsidian等自动生成章节编号
Super Agent:要求不要编号,有时遵从,有时不遵从
O3:无此问题

参考文献概述字数

Super Agent:上限300字
O3:上限600字

截断

Super Agent: 对字数指令遵循能力较强,但没有字数上限观念。到32k就截断,
O3:没出现过截断现象
其他Deep research:字数要求高,就不会遵从,因此通常不会截断

Bug

Super Agent: 编辑提示词有时会自己重复一遍
Using Tool | Search 或 Scholar Search → View不能切换。办法:先点一下Using Tool | Read → View


Super Agent vs Manus

相似点

都是通用Agent
都有回放功能
都是中国人开发的产品出海

区别

Genspark用的Mixture-of-agents多模型混合,具体怎么混的不知道,输出风格像Claude
Manus海外版的Claude3.7thinking底模,国内版用的qwen-qwq
Manus比较贵,大概$1.5/10分钟,最大输出30~60分钟,包月有$40和$200两档,很难薅羊毛
Super Agent比较便宜,免费每天也可以用1~几次,包月$25,容易薅羊毛
Manus可以调用的工具很多,直接使用远程服务器的Linux虚拟机,理论上Linux能运行的浏览器,桌面软件,代码运行环境他都能运行
Super Agent是否在虚拟机里执行不清楚,自称80+工具,可以浏览网页,截图,打电话(限美日)


实践

实践1:Super Agent 不指定格式 250402

提示词:要求3万字
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:3次24条
Using Tool | Search:0条
Using Tool | Read:4次全文阅读,合计40k词,其中1次失败
Using Tool | Think:0.4k字
规划目录:10章36节
输出:未指定格式,随机用的文本格式,30.5k字=36kt,继续4次,输出完整,消耗150c,中间出错一次点恢复继续
参考文献
链接https://www.genspark.ai/agents?id=531e7165-a8ea-4de8-ab28-a144981821dd

实践2:Super Agent Html版 250402

提示词:要求6万字
Using Tool | Parallel Search:1次50条
Using Tool | Scholar Search:2次14条
Using Tool | Search:0条
Using Tool | Read:10次全文阅读
Using Tool | Think:0.4k字
规划目录:7章无节
输出:消耗162c,未指定格式,输出两个版本,两个版本没关系
html版:16.7k中+3.3k英,32kt,其中html占用了10kt,截断没输出完
html版链接AI时代超级个体研究报告
文字版:5.5k中+0.5k英,
字版链接https://www.genspark.ai/agents?id=209da50b-6602-4d66-8315-7f9dd09df18a
参考文献: 16个,每来源概述要求1000字,实际输出300字

实践3:Super Agent 尝试输出txt失败 250402

提示词:5万字,输出为.txt文件,不要输出html版,不要输出pdf版
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:5次35条
Using Tool | Search:2次20条
Using Tool | Read:6次阅读来源全文
Using Tool | Think:300字
规划目录:11章
输出:未遵循指令,仍输出html版,输出25k正文+7khtml=32k截断,写完大概一半,消耗约150c
要求继续不遵从,会重新创建一个html版,重新消耗150c,仍然截断
链接https://www.genspark.ai/agents?id=20e3c706-4c44-47b4-84ca-aa4f869df612
参考文献

实践5:Super Agent 禁止html 250402

提示词:输出1k字,阅读1来源全文,严禁输出文件,参考文献概述600字
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:1次8条
Using Tool | Search:1次10条
Using Tool | Read:7次,不太遵从指令
Using Tool | Think
规划目录
输出:文本。输出2.8k中(不含参考文献)
链接https://www.genspark.ai/agents?id=aa1e007a-6779-43bc-adf3-c37f4e2f7223
参考文献:5条,每条概述230字

实践6:Super Agent Html版 250402

提示词:输出为html文件,html不要使用任何缩进,空行,换行符。输出1k字,阅读1来源全文,严禁输出文件,参考文献概述600字
Using Tool | Parallel Search:0次
Using Tool | Scholar Search:1次8条
Using Tool | Search:1次10条
Using Tool | Read:7次,不太遵从指令
Using Tool | Think
规划目录
输出:文本。输出2.8k中(不含参考文献)
链接https://www.genspark.ai/agents?id=aa1e007a-6779-43bc-adf3-c37f4e2f7223
参考文献:5条,每条概述230字

实践7:Super Agent md版 250402

提示词:5万字
Using Tool | Parallel Search:0条
Using Tool | Scholar Search:3次7条
Using Tool | Search:9次90条
Using Tool | Read:9条
Using Tool | Screenshot:6次,
使用屏幕捕获工具获取被robots.txt阻止的内容(linkedin)
卡在CF验证(Medium)
没卡(psychologytoday)
卡在Cookie页面(nature)
Using Tool | Think
规划目录
输出:27k中+3k英=41kt,消耗201c
链接https://www.genspark.ai/agents?id=a8d5e87d-d14c-484c-b39d-a7c70b526aca
参考文献:上百条,没有概述

实践8:Genspark Deep research(老) 250402

提示词:要求3万字
搜索:266来源,
输出:输出3k中+0.2k英,完全不遵从字数指令。
参考文献:7个,要求每来源概述1000字,实际0字
文字版链接https://www.genspark.ai/spark?id=e371ac65-ae04-4d17-a174-c66da5f7ff45
评价:基本就是个目录,根本没法用
输出这么少,来源多有啥用,平均每个来源输出仅10个字!
充其量只能算Deep search,根本算不上Research

实践9:O3 Deep research 250325

提示词:要求3万字
输出:14k中2k英
参考文献:14个,如果要求概述字数可以每来源600字
链接超级个体与AI时代的研究 | Chat01

References(参考)

链接:使用Genspark Agent生成的研究報告「不是深度研究功能」

83 Likes

感谢这么专业的评测 请问佬友这个链接回放生成过程是怎么做到的

28 Likes

genspark自带的,复制网址或点右上角这个图标,可以换个浏览器,在别人账号登录或者退出登录状态下,就显示回放,在自己登录状态下,不会显示回放

估计是模仿manus

27 Likes

好的 感谢 我用安卓客户端发现pdf无法导出 只有网页版用浏览器打印功能才能保存为pdf

24 Likes

谢谢分享去看看

4 Likes

感谢分享!!!

4 Likes

一会试试,谢谢分享

4 Likes

谢谢分享啊

4 Likes

感谢大佬分享

4 Likes

感谢大佬的分享,如果是输出为markdown格式,会不会好些呢?

4 Likes

如果输出文件,强制为.html(可导出pdf),不能生成.txt或.md

markdown只能在要求“不要输出文件"的情况下使用,并且需要每8k,继续一次。好处是markdown省1/4左右token,输出字数上限多1/4

5 Likes

我试了好几次,输出8K以上经常截断。换号,换节点也不管用。

4 Likes

文本(markdown)到8k一定会截断。但是可以多次继续,最终总字数可以3万字左右

只有要求输出为文件,才不会截断,但因为html浪费了很多token,总字数上限只能2万多一点

3 Likes

没有让它生成(markdown格式)。就只是提问题,让它写报告,一直出现截断。

4 Likes

如果不要求,他随机选不输出文件(markdown),或输出html。

如果要求"输出文件",会强制html,不会8k截断,但到32kt(2万字多点)会截断

如果要求"不要输出文件",会强制不输出文件(markdown),会8k截断,但是可以一直输入继续,直到32kt(3万字),能不能更多字还没试,另外markdown与html的质量有没有区别也还没仔细比较

3 Likes

我终于明白了,7K-8K是普通问题的普通回复的输出上限。
你的第一个问题的链接。# AI时代的超级个体:从互联网到人工智能的范式转变与机遇重构

发现也是,每到7K字左右,就要回复它【继续】才能继续。 :joy:

2 Likes

这个和gemini 2.5 pro 用站里大佬在github做的深度研究,那个单次输出近40K量还是有很大差距。(这个也是我见过的最高记录,gemini 2.5 pro深度研究报告写了37K)

我昨天pua2.5pro,他写了62kt(600s),但是书籍总结,不是深度研究。以前让总结2.5只肯写10kt左右

1 Like

感谢分享,收藏了

gemini 2.5 pro 37K的深度研究,我至今只成功了一次。可能是触发了关键(让它找30种常见癌症,进行分析。它自己就自动每一种癌症写了800字以上,加上其他章节9K左右。单次输出37K的研究就这样出现了。)

还有一次触发了29K的记录,也是类似的逻辑,分析每一个阶段。一共28个阶段。就到29K的字数了。

我感觉深度研究报告15K-25K比较好。低于15K不够深度研究 ,高于25K看着累:rofl:

2 Likes