250109三花AI日报：微软开源 phi-4 模型；Adobe 发布透明视频生成；SAI 开源 SPAR3D 一秒生成3D模型；字节 S T A R 视频超分模型；Gazelle 多人注视检测在线版；

ke_jun · 2025 年1 月 9 日 01:29

字节跳动开源 S T A R 视频超分模型：利用 T2V 技术实现高清修复

S T A R 是字节跳动开源的一个利用 T2V（Text-to-Video）模型对视频进行超分辨率的方法。无论是 AI 生成的视频还是现实中的视频，S T A R 都能进行高清修复。预训练模型（基于 I2VGen-XL 和 CogVideoX-5B）及推理代码现已发布，有兴趣的佬友可以自己试试。

Gazelle 是一个开源的多人注视检测技术，能够精准地检测人们的目光方向和注视对象。

现在，Gazelle 的在线版本已经发布，社区提供了两个不同的演示：gaze-demo 和 Gaze-LLE-demo。

phi-4 是微软刚刚开源的最强小参数模型，其参数仅为 14B。

在各种基准测试中，phi-4 对比同参数量的模型表现优异，甚至在 GPQA 和 MATH 基准测试中超过了 GPT-4o。这个模型最初于去年 12 月 12 日发布，现在竟然直接开源了，并且基于 MIT 协议，可随意商用。

TransPixar 是 Adobe 最新发布的一项创新技术，能够通过文本和图像生成透明背景的视频。

不仅支持创建烟雾和反射等透明元素，还提供了高度逼真的视觉效果。可以看看演示视频，效果相当不错。也可以在 Hugging Face 体验在线版本，不过在线版限制了帧率和推理步骤。代码是开源的，有兴趣的可以直接本地部署。

SPAR3D 是 SAI 最近开源的一项图生 3D 技术，能够在短短一秒内从单张图片生成可编辑的 3D 模型。这项技术对于商业和非商业用途均免费开放，只要年收入小于 100 万美元即可使用。目前，代码和模型都已经公开发布。

NeuralSVG 是一款创新的工具，能够根据文本提示生成有序且可编辑的矢量图形。通过简化和分层 SVG 输出，NeuralSVG 解决了传统 SVG 生成结构过于复杂、难以二次编辑的问题。

官方展示的效果非常出色，生成的 SVG 文件不仅结构清晰，还支持分层编辑，极大地方便了设计师和开发者。目前，NeuralSVG 尚未开源，但我会持续跟进最新动态，第一时间为大家带来更新。关注我，不错过任何重要信息！

aepax · 2025 年1 月 9 日 01:30

嘿嘿第一逮到

jcjrobert · 2025 年1 月 9 日 01:31

来了袄，每日看报

Terrasse · 2025 年1 月 9 日 01:32

第三第三

pla · 2025 年1 月 9 日 01:34

L站需要自己的战地报

handsome · 2025 年1 月 9 日 01:35

来了，看报

baipiaodang · 2025 年1 月 9 日 01:35

phi4 好像挺猛的

hugohe · 2025 年1 月 9 日 01:36

每日看报留言

stevessr · 2025 年1 月 9 日 01:39

每日一报纸

hellozzhyouok · 2025 年1 月 9 日 01:42

每日一看

Qiner · 2025 年1 月 9 日 01:44

持续关注那个生成矢量模型.jpg

Piao · 2025 年1 月 9 日 01:48

Check

wwow · 2025 年1 月 9 日 01:51

进来看看

Timmy_0 · 2025 年1 月 9 日 01:54

phi4能超越gpt-4o？才14b，那不是无敌了

vvc · 2025 年1 月 9 日 01:58

每日看报

shangguan · 2025 年1 月 9 日 02:17

每日看报

wangwar · 2025 年1 月 9 日 02:27

240109是指24年的1月9日吗？

linuxlove · 2025 年1 月 9 日 02:29

今天内容不错，看报看报

Mufeng_OEN · 2025 年1 月 9 日 02:31

感谢老板，昨天收到了奖品

cnm · 2025 年1 月 9 日 02:58

怎么是24年

话题		回复	浏览量
241202 三花 AI 日报：纯浏览器 AI 生图； Viggle AI 梗图视频制作；Sana 文生图模型；瞬间年轻30岁；AI 驱动的高效带货视频生成技术前沿快讯人工智能	6	522	2024 年12 月 2 日
241112 三花 AI 日报：阿里 Qwen2.5-Coder 全系列开源；Vision Pro 与 ComfyUI 结合；轨迹控制视频插帧在线使用；谷歌开源诺奖项目 AlphaFold 3 前沿快讯人工智能	11	573	2024 年11 月 12 日
241113 三花AI日报： VSCode AI Toolkit：集成大模型调试与微调；ChatGPT Canvas 即将支持代码沙盒；字节豆包团队推出 SeedEdit；将拍桌声转为高保真鼓声前沿快讯人工智能	10	523	2024 年11 月 13 日
241104 三花 AI 日报：基于 SDXL 的高清修复模型；In-Context LoRA：通过提示词生成连贯图像；PromptFix：多功能修图神器；Suno 推出Personas；Runway 推出高级运镜功能；MimicTalk：快速创建 3D 数字人头前沿快讯人工智能	13	521	2024 年11 月 4 日
241125 三花 AI 日报：从数字脸到数字人；全球首个去中心化训练的 10B 模型完成；多功能漫画创作工具；绘画转线稿草图； RAG-Diffusion 精确布局与图像重绘前沿快讯人工智能	8	501	2024 年11 月 25 日