开源多模态大模型，Qwen2.5-VL 不出，让 InternVL2.5 先冒头了

yqyan · 2024 年12 月 9 日 04:26

2024/12/05，InternVL2.5 系列发布。覆盖率从1B参数到78B参数的多模态大语言模型。InternVL2_5-78B 是首个在MMMU benchmark上得分超过70的开源模型。

yqyan · 2024 年12 月 9 日 04:26

#人工智能添加

AlphaCat · 2024 年12 月 9 日 04:47

我发现在OpenWebUI调用这些多模态模型API的token还是比较低的有的只有64k，如何解决哪些大图片或者视频的解析啊？

Qiner · 2024 年12 月 9 日 04:49

等硅基。不过这个是基于 Llama 好像，中文还是看好 Qwen 一点。

yqyan · 2024 年12 月 9 日 05:04

2B，8B，26B 基于 InternLM2.5，1B，4B，38B，78B 基于 Qwen2.5，书生（InternLM）的中文支持也很好啊

Qiner · 2024 年12 月 9 日 05:08

硅基那个是基于 Llama 3 的，倒不是不好，只是 Qwen 的更好所以优先用千问那个书文在候补席看饮水机。

yqyan · 2024 年12 月 9 日 05:14

硅基这个是 InternVL2，前几天刚刚升级到 InternVL2.5，简单尝试，InternVL2.5 给出的数据并不过分夸张，从体验上来讲，目前的 InternVL2.5 绝不逊色于 Qwen2-VL。期待 Qwen2.5-VL 尽快推出，

Qiner · 2024 年12 月 9 日 05:16

坐等硅基上架，我就这一个白嫖渠道。。

yqyan · 2024 年12 月 9 日 05:20

如果只是要尝试一下的话，官网和抱抱脸都可以。

Johnsonkg · 2024 年12 月 9 日 08:48

这小模型分数太高了

handsome · 2024 年12 月 9 日 11:06

硅基冲冲冲！

话题		回复	浏览量
零一万物给我气笑了属于是开发调优人工智能	10	1035	2024 年12 月 7 日
🌈 硅机流动上架目前最大的开源视频生成模型：HunyuanVideo 前沿快讯 AFF , AIGC , 人工智能 , 纯水	13	537	2024 年12 月 9 日
241128 三花AI日报：阿里通义开源国产推理模型；GUI 自动化 Agent；OneDiffusion：多功能生图模型； OpenAI 的 Sora API 泄露事件回顾前沿快讯人工智能	11	541	2024 年12 月 18 日
视觉模型自由了，硅基流动支持了视觉模型，又快又稳。又有得玩了资源荟萃 AFF , 人工智能	31	1399	2024 年11 月 16 日
📢 无AFF，硅基流动 Deepseek-VL2 视觉模型已上架可用。前沿快讯人工智能 , SiliconFlow	16	540	2024 年12 月 18 日