241225 三花AI日报：阿里 QVQ：开源多模态推理模型；xAI 推出 Grok 网页版，支持多种输出模式；字节开源 Midscene.js：AI 驱动的自动化测试

ke_jun · 2024 年12 月 25 日 01:02

QVQ-72B-Preview：开源多模态推理模型

QVQ-72B-Preview 是阿里通义团队基于 Qwen2-VL-72B 构建的开源多模态推理模型，专注于增强视觉推理能力，目前还是实验性研究模型。

该模型在 MMMU 基准测试中取得了 70.3 的分数，显著超越了 Qwen2-VL-72B-Instruct。在剩下的三个专注于数学和科学问题的基准测试中，有效缩小了与 o1 模型之间的差距。

你们可以在线演示玩一下在线演示。

通义的模型命名也是越来越可爱了。

Grok 网页版现已在澳大利亚推出，无需登录即可访问，支持四种输出模式：“Smart”（默认）、“Draw”（使用“/imagine” 命令创建图像）、“Search”（使用“搜索…”）和“Model Only”（禁用搜索）。

除了 Web 版本，部分国家和地区也推出了 iOS App，美区还没有，需要再等一下。几天前 xAI 官方还宣布获得了 60 亿美元的 C 轮融资，马斯克要发力了。

字节的 web-infra 团队开源的 Midscene.js 采用了多模态大语言模型，能够直观地“理解”你的用户界面并执行必要的操作，轻松完成 e2e 测试。

官方还提供了一个浏览器插件，可以快速体验其核心功能。通过这个插件，用户可以用自然语言与任意网页联动，调用交互、提取、断言三种接口，无需搭建代码项目，极大地简化了测试流程。

佬们圣诞快乐

Camelliawhisper · 2024 年12 月 25 日 01:04

圣诞快乐

handsome · 2024 年12 月 25 日 01:04

来了，看报

Qiner · 2024 年12 月 25 日 01:06

好好好，坐等硅基更新。

sureai · 2024 年12 月 25 日 01:17

看报看报了

kindmesdilabso · 2024 年12 月 25 日 01:20

QvQ

aepax · 2024 年12 月 25 日 01:20

再等一两个月
千问 Q~Q-72B-Preview发布

ZoroAster · 2024 年12 月 25 日 01:21

先是QWQ现在又有QVQ，千问颜文字系列模型

jcjrobert · 2024 年12 月 25 日 01:29

圣诞快乐~

vvc · 2024 年12 月 25 日 01:40

每日看报

hugohe · 2024 年12 月 25 日 01:43

每日看报学习

littlejets · 2024 年12 月 25 日 01:44

每日看报

linuxlove · 2024 年12 月 25 日 02:16

圣诞快乐！看报，看报！

jcc · 2024 年12 月 25 日 02:20

就等轨迹流动大善人了

yqyan · 2024 年12 月 25 日 02:29

Qwen 的推理模型都废话巨多，费 token 啊

zhouyilong · 2024 年12 月 25 日 02:30

学习了

Johnsonkg · 2024 年12 月 25 日 02:33

大厂也卷不动预训练这一套了

Dr.Mike · 2024 年12 月 25 日 02:41

grok现在是什么水平

shangguan · 2024 年12 月 25 日 02:42

今日已阅，圣诞快乐各位

clover_cn · 2024 年12 月 25 日 02:56

麻了

话题		回复	浏览量
241128 三花AI日报：阿里通义开源国产推理模型；GUI 自动化 Agent；OneDiffusion：多功能生图模型； OpenAI 的 Sora API 泄露事件回顾前沿快讯人工智能	11	550	2024 年12 月 18 日
241216 三花 AI 日报：Grok 免费开放；PIKA AI 发布 2.0 模型；Meta Motivo：开源人体动作生成模型；开源的多人注视检测技术前沿快讯人工智能	12	531	2024 年12 月 16 日
241106 三花AI日报：英伟达开源 ConsiStory 角色一致性技术；腾讯混元大开源；HelloMeme 表情克隆技术；xAI API 每月白嫖 25 美刀前沿快讯人工智能	3	379	2024 年11 月 6 日
DeepSeek-V3 已悄咪咪上线网页端以及 API 开发调优人工智能	196	1987	2024 年12 月 25 日
241217 三花 AI 日报：最强开源虚拟试穿模型；OpenAI 增强 ChatGPT 搜索功能；Midjourney 推出 Moodboards 功能；开源对象运动控制技术前沿快讯人工智能	5	431	2024 年12 月 18 日