tianzhen
(tianzhen)
1
最近两次更新
NeatChat现已初步支持上传文件(非RAG),也能将复制的超长文本转为附件,不会再像之前一样复制100k左右就卡死了。
灵感来自NextChat 有内存泄漏问题 ..... - #10,来自 Qiner
但是由于没有RAG,所以过大的文件是没有必要的,模型也检索不过来,所以限制最大上传为10w字符(超过自动截断),当然可承载的最大字符(不卡死的情况下)应该能有个100w左右。不过我测试1000w直接给我服务器干死机了
支持的文件后缀:
.bash
,
.bat
,
.c
,
.cer
,
.conf
,
.cpp
,
.cr
,
.cs
,
.csr
,
.css
,
.csv
,
.doc
,
.docx
,
.go
,
.h
,
.hpp
,
.html
,
.ini
,
.ipynb
,
.java
,
.js
,
.json
,
.jsx
,
.key
,
.kt
,
.less
,
.m
,
.md
,
.pdf
,
.pem
,
.php
,
.pl
,
.pp
,
.ppt
,
.pptx
,
.ps1
,
.py
,
.rb
,
.rdp
,
.rs
,
.r
,
.scss
,
.sh
,
.sql
,
.svg
,
.swift
,
.tex
,
.toml
,
.ts
,
.tsx
,
.txt
,
.vue
,
.xls
,
.xlsx
,
.xml
,
.yaml
,
.yml
,
.zsh
甚至还支持一些简单的zip文件。
另外由于doc文件过于老旧,找不到很好的提取或者转换的办法,会提取二进制来使用,效果比较差,推荐手动转为docx文件。
UI暂时比较潦草,但是这个上传文件的按钮不会存在太久,后面会配合ocr模型(非视觉用ocr,视觉原生请求,给所有模型识图的能力),与上传图片的按钮融合成上传附件的按钮,这种方案已经比较成熟。但是我需要一个好的提示词,有人知道ocr模型最佳的提示词吗
37 Likes
buyan
7
佬,用@来定义模型类型的这个功能,有个不知道是bug的bug。
我部署了LLM红队
的jimeng2api
。
接入NeatChat的时候:
如果填的是-all,jimeng
,就可以正常调用。
如果填的是-all,+jimeng@ByteDance
的话,就会提示没有提供key。
我理解是按后面这么写的话,程序是去请求官方的api,所以说key有问题。
是我设置的方法不对吗?
5 Likes
tianzhen
(tianzhen)
8
这还是官方遗留导致的bug,你@字节,就会以字节的请求接口去请求,如果你没有填写字节的api,就会弹没有可用什么的,直接无视你现在的接口,后面我会彻底清除官方的这种规则,你应该参考我给的规则列表,去@一个不被官方认可的类别
比如
4 Likes
buyan
10
10 Likes
awz707
(awz707)
12
我去,最近没注意,NextChat抱歉看错了 NeatChat竟然也支持自动获取模型和文件上传了!太棒了 
11 Likes
buyan
14
字节的模型叫豆包不影响即梦是字节的哇哈哈哈哈
即梦–抖音–字节,大概是这样
13 Likes
buyan
15
OCR提示词,我这刚好抄了有一个
请识别图片中的内容,注意以下要求:
##前置说明##
不要输出任何额外的解释或说明
##对于验证码图片##
1.只输出验证码字符,不要加任何额外解释
2.忽略干扰线和噪点
3.注意区分相似字符,如0和O、1和l、2和Z等
4.验证码通常为4-6位字母数字组合
##对于普通文本##
1.普通文本保持原样,不要使用LaTeX格式
2.保持原文的段落格式和换行
3.明显的换行使用\\n表示
##数学公式##
1.所有数学公式和数学符号都必须使用标准的LaTeX格式
2.行内公式使用单个 $ 符号包裹,如:$x^2$
3.独立公式块使用两个 $$ 符号包裹,如:$$\\sum_{i=1}^n i^2$$
4.确保所有数学符号都被正确包裹在 "$" 或 "$$" 中
12 Likes
7li7li
(7li7li)
18
能不能想openwebui那样支持向量模型,然后不用ocr呢
13 Likes
tianzhen
(tianzhen)
19
我对rag了解还是比较少,我研究两天了,好像rag本身也就是专注文本类型的,对于图片,要实现rag,大部分也都是ocr成文本之后再向量化然后存入向量数据库,我没研究过openwebui的图片上传有没有集成到rag里(我用的不多,我再学习下吧
)
11 Likes
7li7li
(7li7li)
20
我也不太了解这些,我只知道我在webUI配置了向量模型 不开启ocr也可以识别pdf
14 Likes