三花 AI 一觉醒来发生了什么?欢迎阅读
智谱清影 CogVideoX-5B: 开源视频生成模型
SDXL Kohaku-XL-Zeta:最好的二次元模型
Flux 多合一 ControlNet 专业版
DisTrO:开启全球共享 AI 训练新时代
Anthropic AI 系统提示词现已公布
今天的内容不多,欢迎大家交流
智谱清影 CogVideoX-5B: 开源视频生成模型
早在 7 月份,智谱公布了他们的视频生成模型 CogVideoX(清影),昨晚他们的官推宣布 CogVideoX-5B 即将开源(大概率今天),diffusers 框架已经提前完成了适配。
SDXL Kohaku-XL-Zeta:最好的二次元模型
曾号称最好的二次元模型 Kohaku 现已开源全新版本 Zeta,该版本从 Kohaku-XL-Epsilon rev2 改进而来,主要特性如下:
-
出图更稳定,并且不再需要长提示词。
-
支持更多风格
-
对自然语言有更好的支持
-
训练集约 846 万张图片
Flux 多合一 ControlNet 专业版
之前 InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro
该模型支持 7 种控制模式,包括 canny (0), tile (1), depth (2), blur (3), pose (4), gray (5) 和 low quality (6),并且还能和其他 ControlNet 一起使用。
DisTrO:开启全球共享 AI 训练新时代
Nous Research 发布了 DisTrO(分布式互联网训练)的初步报告,这或许会成为一个革命性的系统,它旨在实现使用世界上所有的计算能力来训练共享的开源 AI 模型
DisTrO 大幅减少了 GPU 之间的通信需求,减少幅度达到 1000 倍至 10000 倍,即使在网络较慢的情况下也是如此,并且不影响收敛速度。
目前代码和完整论文还没开源,值得期待。
Anthropic AI 系统提示词现已公布
Anthropic 在他们的最新文档里的更新日志里新增了一个“系统提示词”模块,用于记录网页和客户端的默认提示词的更新。
以 Claude 3.5 Sonnet 为例,用到了非常多的提示工程技巧:
-
角色与背景设定:明确身份、知识范围和能力,确保用户对其期望合理。
-
指令清晰化:通过限制行为(如不道歉、不执行超出能力的任务)来确保输出的精准性。
-
分步推理:在处理复杂任务时,进行逐步思考,以减少错误。
-
响应适应性:根据问题的复杂性调整回答长度,以提高效率。
-
错误意识:提醒用户 Claude 可能出现的“幻觉”错误,增强透明度。
其他的 Opus 和 Haiku 的完整提示词都在链接里头,这里就不贴代码块了。