本地部署多模态模型

大家本地都部署过什么多模态模型,有哪些比较推荐于做结构化数据提取,比如表单票据信息提取的吗?

1 个赞

试试LayoutLM系列

多模态的本地模型GPU得跑到冒烟吧。 你说的结构化提取得结合OCR,还不一定理想

试试最近阿里云开源的qwen-2.5 ?