【弗洛伊德资源推荐时间】HackTheBox推出了AI红队工程师的职业课程

与谷歌合作的AI红队成员职业路径计划旨在培训网络安全专业人员,以评估、利用和保护AI系统。该计划涵盖了prompt注入、模型隐私攻击、对抗性AI、供应链风险和部署威胁,并结合理论与实践练习。该计划与谷歌的安全AI框架(SAIF)保持一致,确保其与现实世界的AI安全挑战相关。学习者将获得操控模型行为、制定AI特定红队策略以及对AI驱动应用进行攻击性安全测试的技能。该路径将逐步扩展相关模块,直至完成。

链接:AI Red Teamer Job Role Path | HTB Academy

目前推出了两章,后续会继续更新。

这两章我看完了,觉得质量很不错。

AI安全肯定会是未来的风口,推荐一下。

另外,HackTheBox和TryHackMe的课程都附带实验室教程,所以我只建议看正版,也不贵。

68 个赞

大佬怎么看prompt注入?感觉防不胜防啊

1 个赞

我今天刚挖到了一个prompt注入漏洞,算是我初次尝试AI安全:rofl:

防御措施感觉和传统安全的核心思路是一致的:

  • 输入验证和过滤
  • 上下文隔离

可能还多一个模型调优。

大佬太强了,顶大佬

E兔新年好

1 个赞

大神有兴趣可以看看这个帖子哈

学习了学习了

2 个赞

感谢大佬分享

感谢分享

这种挖到了会有 bonus 吗?

佬友好厉害

确定这是我能看懂的吗 :tieba_087:

非常经典的注入攻击!这招对最新的chatgpt、claude已经不灵了,ds还没免疫。

PS:这两天DS系统提示词有变化~

有的,但是具体多少钱我还没收到通知

prompt注入不仅仅是“套话”来获取敏感信息,目前的prompt注入主要是让AI执行非预期的越权操作。

我上个月看了个案例,是让AI单开了一个可以执行命令的终端,很有意思。

2 个赞

哦我的意思是防止用户套出系统提示词是没必要的

确实,目前基本上套不出什么了,采用双模型架构导致指令解析模型与任务执行模型物理隔离,以前那种让AI说出API之类的不灵了。

1 个赞

佬是在什么平台挖啊?

主要在yeswehack,需要上传身份信息才能挖,禁止自动化扫描,竞争小一些

1 个赞

OKOK有机会去看看