241112 三花 AI 日报:阿里 Qwen2.5-Coder 全系列开源;Vision Pro 与 ComfyUI 结合;轨迹控制视频插帧在线使用;谷歌开源诺奖项目 AlphaFold 3

ComfyUI Web Viewer:Vision Pro 与 ComfyUI 结合体验

comfyui-web-viewer 是一个开源的 ComfyUI 插件,旨在将苹果的 Vision Pro 与 ComfyUI 结合,让你在 VR 环境中管理工作流、预览生成结果,甚至通过手柄进行实时控制。作者还撰写了一篇详细教程,教你如何结合手柄控制 Live Portrait,就像视频中演示的那样,真是太酷了。

Shakker Generator 推出 FLUX.1 的 IP-Adapter

Shakker 在其自家的创意平台上推出了适用于 FLUX.1 的 IP-Adapter,如视频演示所示,效果相当不错。为了防止你不知道,Shakker 是一家在 FLux 开源生态中贡献非常多的公司,包括各种 LoRa 和 ControlNet,他们还提供类似 civitai 的模型托管服务。

Framer 在线版:支持轨迹控制的视频插帧技术

前几天介绍的 Framer 现在推出了在线使用,这是一种支持用户通过交互式点进行轨迹控制的视频插帧技术。比起 ToonCrafter 插帧,Framer 最大的特点是支持轨迹控制,效果还是不错的,有需求的不要错过了。

谷歌开源诺奖项目 AlphaFold 3

AlphaFold 3 是谷歌最近开源的备受瞩目的项目,这个项目在今年荣获了诺贝尔生物学奖。虽然我不是很懂,但听起来确实很厉害。佬友们快去找找有没有 typo 需要 fix,发个 PR,以后也可以吹吹参与过诺奖项目了!

阿里发布 Qwen2.5-Coder:32B 模型超越一众开源模型

阿里通义刚刚开源了 Qwen2.5-Coder 全系列模型 ,本次带来了 0.5B、3B、14B、32B 四个尺寸,其中 32B 模型以碾压姿态超越了一众开源模型,甚至比肩 GPT4o 和 Claude 3.5 Sonnet。官方还演示了如何结合 Cursor 在 1 分钟内实现一个贪吃蛇游戏,并通过 Open WebUI 实现了类似 Claude Artifacts 的功能。此外,通义官网还即将上线代码模式,支持一句话生成网站、小游戏和数据图表等各类可视化应用。


15 个赞

阿里的AI能比肩sonnet3.5了吗

基准测试似乎是这样的,不过具体还得实际体验。

Cursor 里我还是觉得 Sonnet 3.5 好用太多了。

来了,每日看报

1 个赞

来了来了,来看报了

有大佬体验过吗

天天都是赶超4o和克劳德 :tieba_025:

1 个赞

不赶超不好意思发布 :tieba_025:

1 个赞

QWen2.5-Coder-32B现在在哪可以体验到?

非常好日报!

感谢!最后我在Huggingface上找到api了