人生搜索引擎免费用:开源版哈利波特“冥想盆”登 GitHub 热榜,支持中文

它还接入了 GPT-4,能够对这些“记忆”进行更深一步的操作,使得用户可以通过提出问题、创建摘要等方式与系统进行交互。

而就在 Rewind 功能更加完备的过程中,它也收获了资本的青睐。

截至今年初,Rewind 已经完成了两轮融资,共计 2790 万美元,估值约为 3.5 亿美元(25.34 亿人民币),而且两轮中都有 OpenAI CEO Sam Altman 和 a16z 的身影。
具体而言,Pensieve 拥有以下几个特点:

  • 简单安装,只需通过 pip 安装依赖项即可开始;
  • 所有数据均本地存储,允许完全本地操作和自主数据管理;
  • 实现全文和向量搜索;
  • 与 Ollama(一个支持本地部署 LLM 的开源框架)集成,增强搜索能力;
  • 支持 Mac 和 Windows(Linux 支持正在开发中);
  • 兼容任何 OpenAI API 模型(例如,OpenAI、Azure OpenAI、vLLM 等);
  • 允许用户选择和设置语言模型(包括中文和英文);
  • 允许通过插件扩展功能;

下面重点介绍大家关心的几个问题。

第一,需要占用多少存储。

作者贴心预估了一下,每月按 20 个工作日计算,产生的截图文件约 8GB。截图会进行去重,如果连续截图内容变化不大,那么只会保留一张截图。

SQLite 数据库大小取决于索引的截图数量,10 万张截图索引后约占用 2.2GB 存储空间。

第二,关于功耗和硬件设备。

Pensieve 默认需要两个计算密集型任务:1)一个是 OCR 任务,用于从截图提取文本;2)另一个是嵌入任务,用于提取语义信息和构建向量索引;

对于前者,作者使用 CPU 执行,并针对不同的操作系统优化以最小化 CPU 使用。

而对于后者,作者认为可以按照自己的设备进行选择:

  • NVIDIA GPU 设备优先使用 GPU;
  • 苹果设备优先使用 Metal GPU;
  • 其他设备使用 CPU;

当然,为了避免影响用户日常使用,Pensieve 还采取了优化措施。

一方面,Pensieve 能够根据用户的活动模式动态调整索引构建的频率。也就是说,在用户使用电脑时,它会降低索引构建的优先级,以减少系统资源的占用。

另一方面,Pensieve 在设计时考虑了电池使用寿命,通过监控电池状态,当电池电量低于某个阈值时,会自动减少资源消耗,以延长电池使用时间。

第三,隐私安全如何保证。

Pensieve 作者提出了 4 点措施来保证用户隐私,包括:

1、代码是完全开源且易于理解的 Python 代码,允许任何人审查以确保没有后门或恶意软件。

2、本地化数据存储。Pensieve 将所有数据存储在用户的本地设备上,而不是上传到云端服务器。

3、易于卸载:Pensieve 提供了简单的卸载过程,用户可以轻松地从系统中移除。

4、数据处理完全由用户控制。用户可以自由选择何时启动或停止记录,以及如何管理和查询自己的数据。

另外,作为一个独立项目,Pensieve 所使用的机器学习模型(包括 VLM 和嵌入模型)都允许由用户选择。
GitHub:

9 Likes

类似的项目很多了,开源的openrecall,windrecorder,screenpipe都是很出名的;

2 Likes

screenpipe看起来是最成熟的了,一看 storage impact: 1 FPS ≈ 30 GB/month, 5 FPS ≈ 150 GB/month,两眼一黑,佬有用过吗,这款内存清理做的怎么样

1 Like