250106三花AI日报：罗永浩 Jarvis 发布 J1 Assistant；如意图生视频模型；DDUF 扩散模型单文件格式新标准；TangoFlux 极速文本转音频生成模型；字节开源口型同步扩散模型

ke_jun · 2025 年1 月 6 日 00:11

罗永浩 Jarvis 发布 J1 Assistant：安卓用户的 AI 新助手

罗永浩旗下的 AI 初创项目 Jarvis 近日发布了名为 J1 Assistant 的聚合类 AI 助理软件。目前，该软件仅支持部分安卓机型。用户可以通过长按发送语音至联系人、谷歌搜索引擎、ChatGPT 或创建备忘录。UI 设计颇具锤子科技风格，当前版本为 0.8.3-beta1。感兴趣的朋友可以在J1 Assistant 官网下载体验。

Create AI 开源 Ruyi-Mini-7B 图生视频模型，专为消费级 GPU 设计

Create AI （原图森未来）开源了Ruyi-Mini-7B图生视频模型。这款模型专为消费级 GPU 设计，支持生成 360p 和 720p 分辨率、最长 5 秒的视频。

据Create AI官网介绍，Create AI 似乎正在利用大模型技术开发 AAA 级开放世界游戏《金庸群侠传》。

ebook2audiobook 2.0 发布：全新WebUI与 1000 种语言

知名开源电子书转有声书项目ebook2audiobook 发布了 2.0 版本。新版本支持本地语音克隆与有声书生成，覆盖了 1000 种语言，并配备了全新的 WebUI 界面。

此外，安装脚本也得到了优化，使用更加便捷。想体验新功能的佬友，可以访问在线版本进行试用。

DDUF：统一扩散模型分发与权重保存的单文件格式

DDUF（DDUF’s Diffusion Unified Format）是一种为扩散模型设计的单文件格式，旨在统一不同的模型分发方法和权重保存格式。它将模型的所有组件打包到一个文件中，并且与语言无关，支持远程解析。目前社区热门的模型已经有专门的 DDUF 格式了，之前看到一大堆文件就头疼，以后就好了。

TangoFlux：极速文本转音频生成模型

TangoFlux 是一个开源的极速文本转音频（TTA）生成模型，在单个 A40 GPU 上仅需 3.7 秒即可生成 30 秒的 44.1kHz 音频。佬友们可以在线体验看看，速度确实飞快，生成的质量也算还行。

字节开源 LatentSync：高效口型同步扩散模型

LatentSync 是字节开源的用于口型同步的扩散模型，只需提供角色视频和要同步的音频即可生成。该模型对硬件的要求适中，仅需 6.5 GB 的 GPU 即可运行，适合大多数开发者和研究人员使用。此外，@fffiloni大佬还提供了一个在线演示可以玩一下。

harlan9868 · 2025 年1 月 6 日 00:15

欢迎来到AI满天飞的时代

Luis · 2025 年1 月 6 日 00:22

全是AI，楼上说得好啊！

wwow · 2025 年1 月 6 日 00:43

这是AI?

Flail7127 · 2025 年1 月 6 日 00:48

搞无人驾驶的去做 AIGC 游戏了，它家开源的 Naive UI 在 Vue3 早期获得了不少开发者青睐。

我记得搞车的理想也做了个 AI 理想同学。

jcjrobert · 2025 年1 月 6 日 01:08

每日看报

ZoroAster · 2025 年1 月 6 日 01:11

2和3都有点意思

md5 · 2025 年1 月 6 日 01:17

现在AI太恐怖了

handsome · 2025 年1 月 6 日 01:35

来了，看报

aepax · 2025 年1 月 6 日 02:27

DDUF? GGUF生出来的,这俩有啥具体区别

shangguan · 2025 年1 月 6 日 02:33

每日一看

callmejiange · 2025 年1 月 6 日 02:41

老罗这UI有点过时了啊

aphoba · 2025 年1 月 6 日 02:45

这是罗永浩细红线做的？？

Dr.Mike · 2025 年1 月 6 日 02:54

新年开始卷了啊

SGYH · 2025 年1 月 6 日 03:04

都在做 AI 应用啊，不知道到最后能活几个

starvip · 2025 年1 月 6 日 03:14

恰恰很喜欢锤子的风格，发布会的 R1 用到现在，喜欢拟物风

vvc · 2025 年1 月 6 日 03:16

每日看报

QAWS12g · 2025 年1 月 6 日 03:17

https://admin.jarvis.cx
跟这个有啥关系不

XiaoHuang · 2025 年1 月 6 日 03:28

这是每日的AI简报，你也来看了？

xxpsj · 2025 年1 月 6 日 03:42

每日年报

话题		回复	浏览量
241231 三花AI日报：华佗 GPT-o1：专为医学推理设计的开源 LLM；一站式 AI 游戏开发资源导航；Switti 文本生成图像模型；AnimateDiff 到 Runway：AI 视频生成对比前沿快讯人工智能	16	543	2024 年12 月 31 日
241223 三花 AI 日报：OpenAI 推出嵌入式 Realtime API SDK；OpenAI 发布 o3 模型；腾讯 ARC 开源 ColorFlow 前沿快讯人工智能	12	550	2024 年12 月 24 日
241230 三花AI日报：统一多模态运动生成大模型；一键将普通视频转为 3D 视频；智谱开源最新CogAgent-9B；AndroidWorld 基准测试第一模型前沿快讯人工智能	17	373	2024 年12 月 30 日
241212 三花AI日报：谷歌推出 Gemini 2.0 Flash Experimental；谷歌发布多款 AI Agent 项目；开源的跳舞视频生成技术；OneDiffusion 正式开源；前沿快讯人工智能	16	645	2024 年12 月 13 日
241226 三花AI日报：DIFF-INSTRUCT*：性能飞跃的文生图模型；3D 姿势到视频生成技术；Pika 2.0：表情包服装秀视频演示前沿快讯人工智能	16	363	2024 年12 月 26 日

250106三花AI日报： 罗永浩 Jarvis 发布 J1 Assistant；如意图生视频模型；DDUF 扩散模型单文件格式新标准；TangoFlux 极速文本转音频生成模型；字节开源口型同步扩散模型