✨ 【喜马拉雅山】让 Claude 写了个递归爬资料,准备建个 RAG 【完结】

https://linux.do/t/topic/294680

目前只进展到第②步…… 还没校正完数据,目前任务挂起中,有空再继续。

② 的注意点有 3 个:

  1. 虽然 Gemini 支持 200 万最高上下文,但 50 万 Tokens 吐一次 300s 左右(吐一次都是 8192 最长),而切成 6 万左右 Tokens 一般 10s 就开始吐字了,效率会高很多,用 ffmpeg 拼接音频时看着控制差不多就行最好一次刚好能吐完。之后就是流水线作业了 (ffmpeg 语句直接让大模型写就行)
  2. System Prompt 能矫正大部分角色名但还是会遗漏很多,需要后期校正主要角色名称的同音字,已经实测大模型「大海捞针」列出所有角色不可行,这一步让 AI 写了几个 Python 处理脚本有空再贴出来。
  3. 最后是脚本代码优先让 Claude 写,但 Claude 也不是万能遇到 BUG 不要死磕,有时 Claude 解决不了的问题丢 Gemini Exp 一轮就解决了。。