【预告】PowerAgent:调用语言模型 API ,对话操控Windows系统

不是,就是问问有没有用什么框架或者开发平台

2 Likes

大佬太强了 :tieba_087:

3 Likes

头像回来了 :tieba_087:

3 Likes

哈哈哈,用回最开始的头像,动图没有回来 :tieba_087:

4 Likes

1 Like

我今晚也在做这个,巧啊佬

2 Likes

交流经验啊佬,你那个做了工作流吗

1 Like

我就是要给模型足够的权限,可以迅速执行任务

1 Like

我没用工作流,直接functioncall了,简单粗暴 :lark_012:,学校之前的一个科创项目,这两天快结题了,就搞点花活,给那些老顽固秀一下

1 Like

不过佬,你管理员权限说给就给么,我总觉得不太合适,就没继续

1 Like

你加了命令行吗 我觉得命令行的权限是最高的,能控制的东西最多

我可以加上用户确认的功能,用户确认后才执行

我也这样觉得,万一权限给太多,一不小心给我搞没点东西,都没地方哭 :bili_017:

全用cmd来操作吗,可以添加些快捷键什么的

佬,你的GUI界面能参考一下吗

加上比较好。我本来只是想做一个电脑上的语音助手,agent还是太复杂了

1 Like

你这个场景,可以接下字节的语音流式识别、合成,基于 RTC 的,还有打断什么的,届时效果应该会很不错。

1 Like

上次看了字节的 demo,语音交互的实时性效果都挺不错

1 Like

mark

gui很简单的,我直接claude37写了一个,

2 Likes