三花 AI 一觉醒来发生了什么?欢迎阅读
diamond:实时渲染 CS:GO 的扩散模型
INTELLECT-1:首个去中心化 10B 大模型训练正式启动
将 OpenAI SearchGPT 设置为默认搜索引擎
GAGAvatar:开源 3D 数字人头框架
OpenAI 开源轻量级多智能体框架 swarm
F5-TTS 开源可商用 TTS 模型
JujoHotaru LoRA:实现表情包自由
阿里妈妈推出 FLUX.1-Turbo-Alpha:8 步快速生成图像
diamond:实时渲染 CS:GO 的扩散模型
diamond 是一款专为模拟 CS:GO(反恐精英:全球攻势)设计的扩散世界模型,允许玩家通过键盘和鼠标操作角色。该模型代码和数据集完全开源,在 RTX 3090 上能够达到 10 fps 的运行速度,成为继 Doom 之后的第二款实时游戏生成模型。fal.AI 还为此专门搭建了一个在线试玩网站,真是太酷了!
INTELLECT-1:首个去中心化 10B 大模型训练正式启动
有史以来第一个去中心化训练的 10B 模型现已正式启动!你可以在官方网站查看训练进度,并贡献你的算力。目前,训练进度已经达到了 2.08%,其中算力提供最多的是 samsja,甚至超过了 Hugging Face 的贡献。
将 OpenAI SearchGPT 设置为默认搜索引擎
OpenAI 的 SearchGPT 虽然只对部分美国用户推出了UI,但是可以直接通过 URL 地址来直达搜索结果页面,并 100% 触发 search 功能,快试试将你的浏览器默认搜索引擎替换为:https://chatgpt.com/?hints=search&q=%s 吧
演示视频来自大佬 btibor91。 我测试了下非常好用,L 站的 oaifree 也是支持的,佬友们可以尝试下:Shared Chat
GAGAvatar:开源 3D 数字人头框架
GAGAvatar 是首个能够通用化的 3D 高斯头像框架,它能够将单张图片转换为 3D 模型,并支持从参考视频中克隆表情和头部动作。代码和数据集完全开源!
OpenAI 开源轻量级多智能体框架 swarm
OpenAI 最近悄悄开源了一个名为 swarm 的多智能体框架,这个框架看起来相当轻量。不过,官方明确表示,这个框架仅用于实验性探索和教育目的,不建议在生产环境中使用。从写法上看,swarm 比 AutoGen 要简单得多。关注我,我会为你持续跟进后续动态!
F5-TTS 开源可商用 TTS 模型
F5-TTS 是最新开源可商用 TTS 模型,支持中英文语音生成和克隆。官方提供了在线演示,虽然中文效果和多音字识别的稳定性有待提升,但速度表现不错,且贵在可商用。
JujoHotaru LoRA:实现表情包自由
JujoHotaru LoRA 是一系列专门用于控制人物表情的 LoRA,现已支持 SDXL。模型包括闭眼、Wink、没睡醒、屑、傻笑、惊讶、眼角调整、漫画眼、滑稽眼、各种表情包眼、各种嘴型/口型等。此外,还提供了夜景、2D 转 2.5D、高光等 LoRA。非常的强呀,这下表情包自由了!远不止我介绍的那些,官方有大量的演示,有兴趣的不要错过!
阿里妈妈推出 FLUX.1-Turbo-Alpha:8 步快速生成图像
FLUX.1-Turbo-Alpha 是阿里妈妈推出的一款支持 8 步出图的 LoRA,基于 FLUX.1-dev 模型进行训练。其最大特点是在略微牺牲质量的情况下大幅提高速度,同时还适配 Flux-dev 的局部重绘、ControlNet 模型等相关生态。