个人开发的侧边栏AI助手,增加deep research功能,可配置apikey使用

Hi~个人开发的侧边栏AI助手(类Sider/Monica/Merlin,缝的没那么多,不过增加了一些agent功能)

新版本(2.3.1)起增加了deep research功能,以及所有功能开放自定义apikey(openai sdk兼容api)使用~希望大家使用和反馈下哈

基本功能几句带过

ai对话,各种模型,思考/联网,上传文件对话,截图对话,页面文章总结/对话,网页总结/对话,油管B站 pdf arxiv总结/对话,多网页对话,自定义apikey

说一下最近更新的功能和特殊agent功能:

deep research

也可配置apikey使用,在设置那里可以改使用的模型和最大页面/最大深度/token限制/最大时长
策略还在优化中
和一些免费提供的平台以及开源的比:
目前确实还没达到grok等那种质量,不过不限次数可以自定义key用,后面版本希望能工程手段更改进质量
和开源的比策略上差不多了,比较特别的是开源的除了apikey,一般是依赖firecrawl或jina ai或无头浏览器,所以一般要么要firecrawl等的apikey要么运行更麻烦,我的扩展可以任意openai sdk兼容的api,且不用其他apikey,更易用了
为啥不用firecrawl、jina ai的apikey:因为是在扩展的offscreen直接打开搜索页和直接打开真实网页,然后网页转markdown(offscreen,不会显式打开),很易用和省钱了,但是需要注意的是。。因为是直接打开真实网页,默认google搜索,太频繁可能会触发google的429。。。过一段时间才好(后面会增加多种搜索api可选),另外可能有一定的性能影响(相当于你多打开了接近10个标签吧,读取html或超时后会自动关)
P.S 目前的默认配置大概一次会花9w-14w tokens(按total_tokens算,如果按输出token算的话可能5-10w左右吧),建议谨慎用便宜的模型或者本地模型

数据抓取、监控和自动化

开发者模式:目前agent逻辑在后端,需要这样用——进入设置页,连点6次logo就会alert已打开了,然后再配自定义key就可以用数据抓取、监控、自动化(还在开发)了
需要说明的是,前面的功能自定义apikey用,所有逻辑在前端,但这两个功能逻辑还在后端,所以apikey会加密传后端后使用,介意的话可以新建临时apikey用哈~保证没存没日志

数据抓取:

在网页说一句话就可以获取网页(列表或者离散的)数据了,可以下载为json或excel格式,并且抓取规则是记录下来的,可以保存这个动作,然后在类似结构的页面replay这个动作,是不需要再次消耗llm tokens的。以及根据这个动作设置定时网页监控,并支持触发监控规则后推送到浏览器通知、邮件、webhook、tgbot

自动化workflow:

也是说一句话就可以自动操作网页了,目前还在开发完善,复杂的还实现不了且有点bug(求反馈),和browser use/skyvern/eko以及openai的operator比,复杂决策和复杂任务的还比不上,不过优点是执行更快、更便宜,而且不强制要求视觉模型。目前正在修改和刷测试用例( WebVoyager benchmark, miniwob等)中,未来两三个版本应该可以达到它们的benchmark通过率。另外特别的是,和保存抓取动作一样,自动化的流程也是记录下来的,可以重放,可以修改workflow节点的变量后重放,可以编辑删除合并workflow节点。比如填写了一个网页的表单,你可以保存动作后,用输入prompt或用excel模板数据来生成新的变量的workflow,也可以手动编辑变量删除合并节点,并重放填表单。也可以用excel模板来loop data跑自动化workflow (如果用过automa类似的扩展的,可以理解为在开发一个ai版本的这种功能,对话自动化,并且同步生成workflow,可以replay/loop data/repeat data循环)

未来版本

工程优化deep research策略,完善自动化
未来的未来版本接入mcp…

欢迎使用和反馈谢谢~

23 个赞

第一 支持一下

1 个赞

支持支持

1 个赞

能不能给个中文,照顾咱文盲一下 :kissing_face_with_closed_eyes:

1 个赞

汗…一开始没设计好i18n,现在改工作太大了,忙不过来sorry - - 不优先欸,应该都是很简单的单词的

1 个赞

支持支持

1 个赞

支持支持

1 个赞

太强了,大佬

支持一下大佬,已经用上了网页分析的功能,感觉不错的
我觉得如果能够做成悬浮显示的就好了,现在这样会挤占网页原本的布局,有点麻烦

emm…以后可以考虑两种,我反而喜欢侧边栏类的,不会破坏网页给我加元素

我用zen啊 :rofl:

也有道理,如果有两种可选就好了


你这介绍不对啊,Windows是shift+alt+s啊 :rofl:

汗~看的真细,感谢…下次改

我说咋按不出来呢 :bili_001:

对文盲不友好,咋不中文优先呢。。

图片不能直接粘贴进去 而且在消息内没有预览

没预览故意的。。咳咳~一点不用费我服务器或cdn储存~粘贴进去我可以优化加一下

光速回复哈哈哈 蹲一下

历史记录是存在浏览器本地存储吗