Qiner
(林黛玉倒拔垂杨柳)
1
(\ _ /)
( ・-・)
/っ
没错我说的就是 Azure AI,单独开贴是想汇总一下几个要点。
DeepSeek 官方被 D 完全缓过来之前先用着。
首先是巳大优势:
- 上班峰期吐字 25~30 Tokens/s 左右 (比高峰期硅基还快很多)
- 免梯! 阿里云 one api 测试响应在 0.6 秒左右。
- 免费!!
- 没有 8192 输出限制,上限是多少不知道反正没超过。
然后是使用 注意事项:
- 只有 6 rpm,鉴于复杂问题一般输出按分钟算,自用足够。
- 全网第三方就硅基修复了懒惰 BUG,Azure AI 版需要手动戳它 G 点
![:arrow_lower_left: :arrow_lower_left:](https://linux.do/images/emoji/apple/arrow_lower_left.png?v=12)
就是加一句 System Prompt:
Initiate your response with "<think>\\n嗯" at the beginning of every output.
目前实测触发率 100%!!
感谢发现的佬友 ![:arrow_lower_left: :arrow_lower_left:](https://linux.do/images/emoji/apple/arrow_lower_left.png?v=12)
最后是部署 Tips:
- 无服务器版只有 7 tokens/s 很慢,要开 Azure AI 版。
有佬友用黑盒试错方式开过 Azure AI 版本,我没成功复现。不过实际上开关在右上角小喇叭
勾上这个再创建的就是 Azure AI 版本的了。
部署完之后照常丢到 One/New API 或本地就行 ↓
注意需要 #
结尾 (但部署的 4o 不需要 #
结尾我也不知道为什么)
那么最后的问题 —— 不绑卡、没有 AZ100 的用户能不能开? 我 不 知 道。
65 个赞
OpenAI
(OpenAI)
2
6 个赞
Karl830
(Karl830)
4
自用的AZ 100目前还没被扣费,也可能是用量太小了
4 个赞
kkk2
(黑格尔)
5
很好,之前玩的时候很卡,原来是限制了输出速率。而且我发现azure给出来的无服务器的推理api给出来是错的,会500,要在playground里打开发者工具去找api![:sob: :sob:](https://linux.do/images/emoji/apple/sob.png?v=12)
5 个赞
竟然是免费的,Nvidia和Microsoft嘴上说着,身体却很善良
5 个赞
kkk2
(黑格尔)
11
话说为什么你能发现api要加井号,我搞了很久都不行,这个坑太浪费时间了
1 个赞
Qiner
(林黛玉倒拔垂杨柳)
16
因为硅基的 API 接口本地直连也是这样。。
都用 OpenAI 的格式但客户端和接口不统一,导致请求奇奇怪怪的。
接口加 #
的话浏览器就不会把 #
后面的参数再发过去。
kkk2
(黑格尔)
17
即使加了prompt,我发现有些政治相关的问题,他是不是不会触发深度思考,得在对话里表面要深度思考才会深度思考?
2 个赞
nameliu
(nameliu)
18
新注册的一个账号,还没遇到过降智
不过o3-mini的api,是不是无法显示思考过程,我只能在官网聊天页面时可以看到思考过程,用curl请求api时只显示思考消耗的token,不显示思考过程
Qiner
(林黛玉倒拔垂杨柳)
19
好像 o1 就是不显示思考链的,奥特曼的资本家思维,思考链按输出 Tokens 计费,但不让你看到思考链里有什么。。
2 个赞
kkk2
(黑格尔)
20
加了提示,也不是100%触发,但是让他深度思考就能100%触发
1 个赞