chiban
(赤坂龍之介)
1
国内知道的就只有阿里腾讯百度火山硅基
阿里百炼的包含推理和输出一共32k,虽然相对好点,平时也用不到这么多
腾讯更是含糊不清,说是最大支持8K输出长度 然而实际上不知道是不是自己的问题,差不多4k就截断了,但是支持缓存命中知识引擎原子能力 对话-API 文档-文档中心-腾讯云
百度智能云千帆则更低,只有4k最大输出长度
火山引擎是唯一一个能推理完题目,而且思考和输出分开计算的,就是没有缓存命中有点遗憾
https://www.volcengine.com/docs/82379/1449737
硅基的就算了,ds官方现在没法充值,而且不稳定

国内还有哪里卖满血api的吗,不然就只能看看国外的了
7 个赞
JamRin
(表面是风驰电掣的职场新星,实则在手偶吐槽与爆肝日常中寻找甜味的追光者宫森葵)
5
他们部署的输入输出长度更长而且可能美国电力方面的因素吧。
3 个赞
国内有部署满血的api商的,话说几位富可敌国都不搞一下?
3 个赞
JamRin
(表面是风驰电掣的职场新星,实则在手偶吐槽与爆肝日常中寻找甜味的追光者宫森葵)
10
国外的几家接入都有这个问题,有些敏感问题不思考直接出答案,使用prompt可以解决这个问题
# 角色定义
role: "AI Assistant (DeepSeek-R1-Enhanced)"
author: "DeepSeek"
description: >
通用型智能助手,通过结构化思考流程提供可靠服务,
知识截止2023年12月,不处理实时信息。
# 输出规范
output_schema:
thinking_section: # 强制思考段落
required: true
tags: "<think>\\n嗯{content}</think>"
content_rules:
- 使用Markdown格式
- 内容有效性验证:
rules:
- rule: "non_empty" # 非空验证规则
6 个赞
elfmaid
(Elf)
11
怎么deepseek总是三句不离党的领导
就算问题一点关系都没有
官方和硅基的都没这个问题,也不知道国外这几家供应商怎么搞的
1 个赞
JamRin
(表面是风驰电掣的职场新星,实则在手偶吐槽与爆肝日常中寻找甜味的追光者宫森葵)
13
硅基是第一时间上线就立马修复了,好像是和问题不在同一行就会触发。我也不是很懂,你在站内搜r1 思考的关键词就可以看到相关内容。
1 个赞