终于第50天了,求靠谱便宜的录音转文字平台,顺便求赞

突然发现讯飞转写变成订阅制了,少量转写可以用Amazon Transcribe,每月60分钟免费,自己常规使用够了,用chatgpt帮我写了个从transcribe下载的json转对话形式的小python,大佬轻虐。

import json
import os

def format_time(seconds):
    seconds = float(seconds)
    hours = int(seconds // 3600)
    minutes = int((seconds % 3600) // 60)
    seconds = seconds % 60
    return f"{hours:02}:{minutes:02}:{seconds:06.3f}"

def process_transcript(json_filename):
    # 读取JSON文件
    with open(json_filename, 'r', encoding='utf-8') as file:
        json_data = json.load(file)

    current_speaker = None
    dialogues = []

    for item in json_data['results']['items']:
        if 'start_time' not in item or 'end_time' not in item:
            continue

        speaker_label = item['speaker_label']
        content = item['alternatives'][0]['content']
        start_time = item['start_time']
        end_time = item['end_time']
        
        if speaker_label != current_speaker:
            dialogues.append((speaker_label, content, start_time, end_time))
            current_speaker = speaker_label
        else:
            _, prev_content, prev_start, _ = dialogues[-1]
            dialogues[-1] = (speaker_label, prev_content + content, prev_start, end_time)

    # 生成TXT文件名
    base_filename = os.path.splitext(json_filename)[0]
    txt_filename = f"{base_filename}.txt"

    with open(txt_filename, 'w', encoding='utf-8') as f:
        for speaker, transcript, start, end in dialogues:
            formatted_start = format_time(start)
            formatted_end = format_time(end)
            f.write(f"{speaker} ({formatted_start} - {formatted_end}):\n")
            f.write(transcript + "\n\n")

# 假设你的JSON文件名为 'example.json'
json_filename = '1.json'
process_transcript(json_filename)

终于熬到第50天了,求大佬们给个赞,另外顺便求推荐其他靠谱便宜的录音转文字平台 :pray:

3 个赞

开个Plus用chat2api?

1 个赞

whisper

1 个赞

chat2api试试?要不就跑一下本地的whisper

1 个赞

没试过这个,这个能识别多人语音么?

网易见外试试 网易见外工作台 (youdao.com)

1 个赞

感谢推荐,我去试试~

我推荐通义听悟

1 个赞

还有一个飞书妙记
主页 - 飞书妙记 (feishu.cn)

2 个赞

感谢推荐~~~

这个是蛮好用的,请教下这个是不是只能当场录音转,因为我试着想上传mp3文件没找到地方

向会议那种吗?不行

1 个赞

能上传的

1 个赞

感谢感谢,我一直在手机上找没找到 :joy:

手机在视频会议选项里面,有个妙记

飞书妙计是免费的,而且可以传很长的,还可以分享,自己矫正

1 个赞

通义听悟

1 个赞

飞书妙计

1 个赞

用groq的whisper large v3,中文识别比medium和small好不少(cf大善人家的whisper 效果就不行)。
于是我手工写了个api转换,适配openai格式。

2 个赞