241012三花AI日报：轻松替换视频背景；生成提示词的提示词；无需编程的提示词优化 WebUI；视觉语言模型的新标杆

ke_jun · 2024 年10 月 12 日 00:57

三花 AI 一觉醒来发生了什么？欢迎阅读

开源工具 video-background-removal：轻松替换视频背景
ChatGPT 官方用于生成提示词的提示词
FLUX.1 LoRA：生成角色一致的真实与卡通照片
DSPyUI：无需编程的提示词优化 WebUI
谷歌推出 Ovis 1.6 Gemma 2 9B：视觉语言模型的新标杆

开源工具 video-background-removal：轻松替换视频背景

video-background-removal 是一个开源的小工具，它利用 BiRefNet 模型进行视频背景的分割，并使用 moviepy 库输出结果。用户可以用任何颜色、图像或视频替换输入视频的背景，实现视频背景自由。

ChatGPT 官方用于生成提示词的提示词

OpenAI 在其官方文档中新增了Prompt generation ，详细解释了之前发布的 Playground Generation 功能的工作原理，并附带了相关提示词。提供了两种模式——结构化提示词和 Schema 模式，未来可能会使用 DSPy 等工具进行优化。完整提示词可以在文档中查看，老规矩太长就不贴了。

FLUX.1 LoRA：生成角色一致的真实与卡通照片

一个有趣的 FLUX.1 LoRA 能够生成四张角色一致的真实照片，并在中间叠加一个该角色的卡通形象。
这种不知道能否配合PulID之类的使用，感觉非常适合发小红书呀，感觉也可以复刻一个可以指定角色的工作流

DSPyUI：无需编程的提示词优化 WebUI

DSPy 是一种提示词优化技术，它通过编程方式替代传统的基于字符串的提示词工程。DSPy 允许用户通过内置模块定义如 ChainOfThought、ReAct 等提示词技巧。

DSPyUI 提供了一个 WebUI，使得用户无需编程即可通过 DSPy 优化、微调及评估提示词。

谷歌推出 Ovis 1.6 Gemma 2 9B：视觉语言模型的新标杆

Ovis 1.6 Gemma 2 9B 是谷歌 Gemmaverse 模型家族的最新成员，它是一个视觉语言模型。该模型在多项基准测试中的平均分表现出色，不仅与商业模型 Claude-3.5 比肩，还超越了开源模型 Qwen2vl-7b。

isbn9877007 · 2024 年10 月 12 日 01:01

dspyui这个是真的牛，dspy会像comfyui一样慢慢成熟的，还有谢谢三花

Flail7127 · 2024 年10 月 12 日 01:02

例行看报

aepax · 2024 年10 月 12 日 01:36

来了来了,每日看报

Li_bai · 2024 年10 月 12 日 01:50

来看报

handsome · 2024 年10 月 12 日 03:03

来了，每日看报

shangguan · 2024 年10 月 12 日 03:09

感觉叠加卡通后发小红书挺方便的

话题		回复	浏览量
24815 三花 AI 日报资源荟萃人工智能	6	294	2024 年8 月 29 日
24820 三花 AI 日报资源荟萃人工智能	6	345	2024 年8 月 29 日
24812 三花 AI 日报资源荟萃人工智能	11	391	2024 年8 月 29 日
241028 三花AI日报：谷歌 AI 驱动的无限角色养成游戏；一键生成诺贝尔奖风格头像；小熊猫模型：超越 FLUX.1.1-pro 的文生图新星； IC-Light V2: 基于 Flux 的图像重打光模型前沿快讯人工智能	15	514	2024 年10 月 28 日
24919 三花AI日报：英伟达可商用角色扮演小模型；Logo 设计模型 Playground v3；YouTube Dream Screen；谷歌 NotebookLM：陪读小助手；CogVideoX-I2V：开源图生视频前沿快讯人工智能	10	417	2024 年9 月 19 日