241101 三花AI日报:万能变声器模型;首款 AI 生成式游戏;阿里更好的角色一致性;ChatGPT 新 Web 搜索工具;

Cartesia 推出 Voice Changer:万能变声器模型

Voice Changer 是由 Cartesia 推出的新模型,能够将任何语音转换为其他音色,同时保留源音频的情感,就像是一个变声器。这个功能可以广泛应用于配音、有声读物、游戏等领域。每月有 1 万字符的免费额度,你们可以自己试试。

阿里 SDXL-EcomID:更好的角色一致性

SDXL-EcomID 是阿里开源的一种新方法,旨在提升角色一致性。它结合了 PuLID 和 InstantID 的优点,提供了更好的背景一致性、面部关键点控制、更真实的面部表现以及更高的相似度。此外,阿里还提供了原生实现的 ComfyUI 节点,包括写真工作流和换脸工作流,效果相当不错。有类似需求的用户可以试试看。

OpenAI 与 Claude AI 客户端双双上新

OpenAI 和 Claude AI 近期在客户端领域展开了一场‘军备竞赛’。OpenAI 宣布其高级语音模型现已支持 ChatGPT 的 Mac 和 Windows 客户端。紧随其后,Claude AI 也不甘示弱,迅速上线了其 Mac 和 Windows 客户端,未来 AI 客户端市场将如何发展,让我们拭目以待。

OpenAI ChatGPT 上线新 Web 搜索工具

ChatGPT 现在可以根据提示词或手动启动新的搜索功能,当搜索天气、股票、体育、新闻和地图时,用户界面将更加友好。

这一新功能将上线 Web 和全端客户端,并已向 Plus 和 Team 订阅用户推出。新的搜索模型是 GPT-4o 的微调版本,搜索接口直接对接 OpenAI 合作的数据提供方。未来还将推出搜索购物、旅行计划等功能,白嫖用户也不用急,未来几个月内将向所有免费用户开放。

Oasis:首款 AI 生成式游戏,开启无限探索

Oasis 是首款可玩的 AI 生成式游戏,基于《我的世界》训练的实时互动世界模型。玩家可以通过键盘输入生成帧,进行移动、跳跃、破坏方块等操作,每次游戏都能构建和探索全新的地图。

目前开发团队正在计划开源模型架构、权重和研究。官网可以直接玩,不过我试了好久只能渲染第一帧,不知道为啥,你们快试试看。


如果你喜欢《一觉醒来 AI 界发生了什么》系列的话,请 关注点赞分享 三连警告,这对我真的很重要

15 个赞

普号也有搜索,但和演示中的有点差异,不知道是不是之前申请 SearchGPT waitlist 的缘故

1 个赞

b 站终于不自动播放了

AI变声器啊??

有没有佬解释下,在前端技术上,天气数据是怎么做到动态渲染生成的?比如这些图标

来了,每日看报

感谢佬友分享AI日报

加入了searchGPT排队的普号也可以用搜索,不过简体中文的新闻搜索居然直接是国内新闻。。。

emmm,央视网和央视新闻 :rofl:

1 个赞

数据结构化了想怎么渲染就怎么渲染,技术上还是挺简单的,rehype remark 之类的。