大家本地都部署过什么多模态模型,有哪些比较推荐于做结构化数据提取,比如表单票据信息提取的吗?
试试LayoutLM系列
多模态的本地模型GPU得跑到冒烟吧。 你说的结构化提取得结合OCR,还不一定理想
试试最近阿里云开源的qwen-2.5 ?