NeatChat现已全面支持上传文件 v1.1.19

最近两次更新

NeatChat现已初步支持上传文件(非RAG),也能将复制的超长文本转为附件,不会再像之前一样复制100k左右就卡死了。
灵感来自NextChat 有内存泄漏问题 ..... - #10,来自 Qiner
但是由于没有RAG,所以过大的文件是没有必要的,模型也检索不过来,所以限制最大上传为10w字符(超过自动截断),当然可承载的最大字符(不卡死的情况下)应该能有个100w左右。不过我测试1000w直接给我服务器干死机了


支持的文件后缀:
.bash , .bat , .c , .cer , .conf , .cpp , .cr , .cs , .csr , .css , .csv , .doc , .docx , .go , .h , .hpp , .html , .ini , .ipynb , .java , .js , .json , .jsx , .key , .kt , .less , .m , .md , .pdf , .pem , .php , .pl , .pp , .ppt , .pptx , .ps1 , .py , .rb , .rdp , .rs , .r , .scss , .sh , .sql , .svg , .swift , .tex , .toml , .ts , .tsx , .txt , .vue , .xls , .xlsx , .xml , .yaml , .yml ,.zsh甚至还支持一些简单的zip文件。
另外由于doc文件过于老旧,找不到很好的提取或者转换的办法,会提取二进制来使用,效果比较差,推荐手动转为docx文件。
UI暂时比较潦草,但是这个上传文件的按钮不会存在太久,后面会配合ocr模型(非视觉用ocr,视觉原生请求,给所有模型识图的能力),与上传图片的按钮融合成上传附件的按钮,这种方案已经比较成熟。但是我需要一个好的提示词,有人知道ocr模型最佳的提示词吗 :tieba_001:

37 Likes

佬真的太勤快了!我github里面里面有提醒更新

6 Likes

看成NextChat了, :person_bowing:

6 Likes

你也太强了!

6 Likes

太有实力啦

6 Likes

:tieba_087: bro 太强了

6 Likes

佬,用@来定义模型类型的这个功能,有个不知道是bug的bug。
我部署了LLM红队jimeng2api
接入NeatChat的时候:
如果填的是-all,jimeng,就可以正常调用。
如果填的是-all,+jimeng@ByteDance的话,就会提示没有提供key。
我理解是按后面这么写的话,程序是去请求官方的api,所以说key有问题。
是我设置的方法不对吗?

5 Likes

这还是官方遗留导致的bug,你@字节,就会以字节的请求接口去请求,如果你没有填写字节的api,就会弹没有可用什么的,直接无视你现在的接口,后面我会彻底清除官方的这种规则,你应该参考我给的规则列表,去@一个不被官方认可的类别
比如

4 Likes

太强了佬:+1::+1::+1:

6 Likes

谢谢佬。。但是你这个表也没有字节的:joy::joy::joy:(先用着吧,除了丑点也没啥又不是不能用

10 Likes

字节那个不是豆包吗

11 Likes

我去,最近没注意,NextChat抱歉看错了 NeatChat竟然也支持自动获取模型和文件上传了!太棒了 :kissing_smiling_eyes:

11 Likes

对啊,字节的模型不是叫豆包吗

11 Likes

字节的模型叫豆包不影响即梦是字节的哇哈哈哈哈
即梦–抖音–字节,大概是这样

13 Likes

OCR提示词,我这刚好抄了有一个

请识别图片中的内容,注意以下要求:

##前置说明##
不要输出任何额外的解释或说明

##对于验证码图片##
1.只输出验证码字符,不要加任何额外解释
2.忽略干扰线和噪点
3.注意区分相似字符,如0和O、1和l、2和Z等
4.验证码通常为4-6位字母数字组合

##对于普通文本##
1.普通文本保持原样,不要使用LaTeX格式
2.保持原文的段落格式和换行
3.明显的换行使用\\n表示

##数学公式##
1.所有数学公式和数学符号都必须使用标准的LaTeX格式
2.行内公式使用单个 $ 符号包裹,如:$x^2$
3.独立公式块使用两个 $$ 符号包裹,如:$$\\sum_{i=1}^n i^2$$
4.确保所有数学符号都被正确包裹在 "$" 或 "$$" 中
12 Likes

昨天换上佬的,看上去舒服多了 :rofl:

13 Likes

太强了佬!插一嘴、这个@的bug真的巨坑无比

蹲一个搜索详细定位到消息位置的功能 :yum:

13 Likes

能不能想openwebui那样支持向量模型,然后不用ocr呢

13 Likes

我对rag了解还是比较少,我研究两天了,好像rag本身也就是专注文本类型的,对于图片,要实现rag,大部分也都是ocr成文本之后再向量化然后存入向量数据库,我没研究过openwebui的图片上传有没有集成到rag里(我用的不多,我再学习下吧 :lark_157:

11 Likes

我也不太了解这些,我只知道我在webUI配置了向量模型 不开启ocr也可以识别pdf

14 Likes