三花 AI 一觉醒来发生了什么?欢迎阅读
2024 年时代百大 AI 人物
又一个 Flux LoRA 画廊
ComfyUI 提示词管理工具
谷歌首尾帧图生视频演示发布
Claude AI 企业版 GitHub 集成开源平替
字节 Loopy:又一个数字人头技术
零一万物开源了 Yi-Coder 系列模型
面壁智能 MiniCPM 3.0 性能超 GPT-3.5
2024 年时代百大 AI 人物
今年的 TIME100 AI 是《时代》杂志评选的第二版,今年的榜单上有 91 位是新人物,最小的仅 15 岁,最大的 77 岁,其中来自我国的有字节 CEO 梁汝波、百川智能创始人王小川、中央网络安全和信息化委员会办公室主任庄荣文、中国政法大学数据法治研究院教授张凌寒等,完整榜单在这里:TIME100/AI
又一个 Flux LoRA 画廊
之前介绍过 FLUX LoRA the Explorer,整理 24 款不同的 Flux LoRA ,今天的这个来自 Shakker-Labs 整理 FLUX LoRA Gallery,暂时包含了 7 款不同 LoRA,其中有之前很火的现实与插画融合,还有当下最火的游戏《黑神话悟空》。
ComfyUI 提示词管理工具
ComfyUI Prompt Gallery 可以用来管理你提示词,帮助我们快速编写提示词,有点像 easyuse 的某个节点。
不过这个节点专门适配了新 UI,并且支持 Navimixu 大佬的 PonyXL Wildcards Vault ,目前该项目还在积极开发中。
另外再顺带介绍一个 ComfyUI 下用来预览加载图片列表的插件 Load Image Gallery ,这下图片特别多的时候也不怕不知道哪个是哪个了,如下所示:
谷歌首尾帧图生视频演示发布
来了来了,前几天介绍的 Generative Inbetweening 现已发布演示,来自我们的 Space 小王子 @fffiloni 发布的:svd_keyframe_interpolation
Claude AI 企业版 GitHub 集成开源平替
昨天才公布的 Claude AI 企业版最主要的功能之一现在已经有人发布了开源版本的插件,目前还没有提交到 Chrome 插件商店,不过你可以自己 clone 下玩,需要两个仓库配合的来:
-
claude_github_link:chrome 扩展
-
claude_github_cloudflare_worker: github auth
不过主要缺点是没有那么大的上下文可用,本质就是下载文件并上传,但是可以帮我们省点时间,小白用户建议等到作者发到商店时再试。
零一万物开源了 Yi-Coder 系列模型
Yi-Coder 是专为编码任务而生的模型,提供 1.5B 和 9B 两种参数,虽然参数量较小,但表现优于其他 10B 参数以下的模型,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够与 DeepSeek-Coder 33B 相媲美。官方公众号有完整介绍,可以一看:零一万物正式开源 Yi-Coder 系列模型
字节 Loopy:又一个数字人头技术
Loopy 就像百度的 Hallo, 阿里的 Emo 等技术,能够通过语音输入,同步生成人像的面部动作,包括嘴唇、表情和头部姿势,目前只有论文,暂时没有期货开源的仓库,关注我替你持续跟进。
类似的技术开源的闭源的非常多,可以在三花上搜一下【数字人头】
面壁智能 MiniCPM 3.0 性能超 GPT-3.5
OpenBMB 开源了其端侧模型小钢炮 MiniCPM3.0 4B,官方有公众号专门介绍:端侧 ChatGPT 时刻到来,不做多的介绍,宣称的主要特点有:
-
无限长文本,性能超越 Kimi
-
端侧最强 Function call,性能比肩 GPT-4o
-
量化后仅需 2.2G 内存,iPad 端侧推理能达到 18-20 tokens/s
吐槽一下,只要定语够多,我是最强 AI 日报(手动滑稽