高推理速度的Qwen2.5-Coder-32B和Qwen2.5-72B api

zzzx9 · 2024 年12 月 10 日 16:48

https://cloud.sambanova.ai/apis 高速度的Qwen2.5-72B-Instruct和Qwen2.5-Coder-32B-Instruct，可以用于沉浸式翻译，20rpm
沉浸式调成最大token 2600，最大段落1000 ，体验很好

WyInnovate · 2024 年12 月 10 日 23:30

感谢大佬！！！

F-droid · 2024 年12 月 10 日 23:35

之前用llama3.1 405b，最开始的时候是逆向的它家的网页版。后来限制必须登陆了，就申请了它家的key，真没想到它家也有qwen了，就是不知道仍然免费不？

zzzx9 · 2024 年12 月 11 日 00:11

免费 rpm20

F-droid · 2024 年12 月 11 日 00:23

这么点小公司，我以为它早就被薅秃了，没想到还活着

zzzx9 · 2024 年12 月 11 日 01:01

还没有付费计划，估计和groq一样花风投的钱换市场

F-droid · 2024 年12 月 11 日 01:17

风投：我成冤大头了

liuxixigua · 2024 年12 月 11 日 01:38

多谢分享，对于不用于生产的用途，体验很好

yuyuyang · 2024 年12 月 11 日 01:55

感谢分享，现在这俩我用的是cloudflare worker部署的huggingface转api，个人给nextchat用感觉也够了

zzzx9 · 2024 年12 月 11 日 01:59

这个上下文长度限制了8k，适合做翻译，速度特别快

handsome · 2024 年12 月 11 日 03:13

qwen现在推理还是qwq好吧

zhubaiwan-oozzxx · 2024 年12 月 11 日 03:19

我去快到起飞

qingyu · 2024 年12 月 11 日 03:44

我基本用的都是官网 “qwen-max” 模型

Bubble7766 · 2024 年12 月 11 日 06:53

我经常遇到429错误,撞到速率限制了

我设置了这两个值,还有什么需要设置的吗

Cassianvale · 2024 年12 月 11 日 07:02

我也是这样…

gaozi · 2024 年12 月 11 日 07:09

看起来很香，感谢分享

zzzx9 · 2024 年12 月 11 日 07:22

他这个rpm只有20，最后弄三四个号的密钥一起填进去，轮训
用，分离就可以

zzzx9 · 2024 年12 月 11 日 07:22

他这个rpm只有20，最后弄三四个号的密钥一起填进去，轮训
用，分离就可以了

jjojooeff · 2024 年12 月 11 日 07:36

那是沉浸式翻译的问题
就算设了最大段落，仍然会因为网站的元素判定做单独请求
可以在开发者设置那边设置只翻译部分元素作为缓解
或者用Cursor撸个代码，把单独的元素引导到别的AI或者不翻译

sph · 2024 年12 月 11 日 08:55

看起来很香，感谢分享

话题		回复	浏览量
【白嫖分享】沉浸式翻译+DeepSeek 资源荟萃	201	11359	2024 年11 月 27 日
推荐自己的deepl api服务，效果不错资源荟萃 DeepLX , API , DeepL , 配置优化 , 纯水	102	5173	2024 年12 月 15 日
Cloudflare免费模型食用指南资源荟萃人工智能	68	4041	2024 年12 月 8 日
自建了一个api做国内，开放号池免费让佬们使用福利羊毛 ChatGPT , OpenAI , AFF , 人工智能	78	2762	2024 年12 月 16 日
DeepLX 免费 API （作者发福利了）福利羊毛 DeepLX	301	13156	2024 年12 月 15 日