可以是windows下面的,也可以是docker部署的,txt或者pdf转makedown格式的软件。
16 个赞
3 个赞
TXT => Markdown …? 你改个扩展名便是… 两者都是纯文本。总不能想的是凭空给你变出格式来吧?
PDF => Markdown 听着也不是很靠谱,PDF的转换通常较为困难,而且Markdown显然只能算PDF逻辑上的子集,PDF能表达的MD不一定可以表达
Pandoc很适合输出PDF,我不清楚PDF作为输入的情况
4 个赞
pdf转markdown:
pandoc没法把pdf作为输入吧
txt转markdown
里面有demo,你可以看看你自己的txt和demo一样不
多谢各位大佬,marker好像对机器性能要求比较高。我试一下pandoc吧
PDF 也是有区别的,对于那种扫描版的 PDF,请上 gemini,普通的 pdf 转换和 ocr 识别不行
ABBYY表示不服,唯一的缺点是它被思杰马克丁代理了
哈哈, 佬友跟我的想法一模一样
MinerU 这个项目超级好。
1 个赞
TXT给你转Markdown不太现实,因为文本格式没有层级标题概念,转不了。PDF倒是可以试试。
llm 可以通过 Prompt 自动排版,啥格式都有,你那个软件能识别公式并转成 latex 吗
pandoc不支持把pdf作为输入
这个对于自建,机器要求挺高的
……先用别的软件转换一下呗
有什么在线的网页可以直接实现转换么
这个不错 有在线体验
不知道是否有次数限制