Thera:首个内置物理观测模型的任意尺度超分辨率技术
Thera 是第一个具有内置物理观测模型的任意尺度超分辨率技术,从基准测试来看,性能非常的好。
佬们可以在官方演示上玩一下,提供的几个 demo 效果看起来非常不错
Cohere 开源 Command A:企业级大模型,成本效益超越 GPT-4o 和 DeepSeek-V3
Command A 是 Cohere 开源的一款专为企业需求优化的大模型,显著降低了硬件成本。
官方宣称,在与 GPT-4o 和 DeepSeek-V3 的对比中,Command A 在企业级任务中表现同样出色,效率更高。更重要的是,相较于使用 API,自部署访问成本降低了 50%。
完整细节可以查看Command A 的官方博客。
LBM:单步实现多功能图片风格转换
LBM(Latent Bridge Matching)是一种图片风格转换技术,它能够在单一步骤中实现多种图生图任务,如对象移除、法线和深度调整以及重新照明等。
目前,LBM 技术已经开源,感兴趣的朋友可以在线体验感受下
百度发布文心大模型 4.5 及 X1
百度昨天发布了新的文心大模型,其中包括基础模型 4.5 和推理模型 X1。百度宣称 X1 的能力接近 DeepSeek R1,价格便宜了一半。
网友们对实际效果的评价一般,CEO 李彦宏表示后续会开源,正如今年 2 月份的宣布,4 月 1 日后文心也会全面免费。
怎么说呢,难用归难用,能开源总是好的。
米哈游创始人蔡浩宇推出 AI 驱动的互动叙事游戏《群星低语》
“Whispers from the Star”(群星低语)是一款由米哈游(miHoYo)的创始人蔡浩宇创立的游戏开发公司 Anuttacon 打造的科幻题材互动叙事游戏。这款游戏以 AI 技术为核心,旨在重新定义互动叙事的体验。
官方的目标是突破传统对话树的限制,提供开放式、个性化和沉浸式的实时交互体验。
已经开启封闭内测阶段,仅支持苹果 iOS 12 以上设备,有兴趣的可以去官网申请体验。
腾讯混元即将开源全新 3D 模型
腾讯混元宣布即将发布一款全新的 3D 模型,大概率会开源,大家可以期待一下。
WeShopAI:一个闭源的虚拟试穿
WeShopAI 是又一个虚拟试穿的在线演示,类似于可灵的虚拟试穿。同样,它只是调用了其 API,并没有开源。
效果还行,佬们可以玩玩看,感觉大概率是给其引流用的?