大佬们,这个怎么实现

第一个需求,可以使用 语音合成
第二个需求,可以使用 音频转文字
调用接口
关联链接