它还接入了 GPT-4,能够对这些“记忆”进行更深一步的操作,使得用户可以通过提出问题、创建摘要等方式与系统进行交互。
而就在 Rewind 功能更加完备的过程中,它也收获了资本的青睐。
截至今年初,Rewind 已经完成了两轮融资,共计 2790 万美元,估值约为 3.5 亿美元(25.34 亿人民币),而且两轮中都有 OpenAI CEO Sam Altman 和 a16z 的身影。
具体而言,Pensieve 拥有以下几个特点:
- 简单安装,只需通过 pip 安装依赖项即可开始;
- 所有数据均本地存储,允许完全本地操作和自主数据管理;
- 实现全文和向量搜索;
- 与 Ollama(一个支持本地部署 LLM 的开源框架)集成,增强搜索能力;
- 支持 Mac 和 Windows(Linux 支持正在开发中);
- 兼容任何 OpenAI API 模型(例如,OpenAI、Azure OpenAI、vLLM 等);
- 允许用户选择和设置语言模型(包括中文和英文);
- 允许通过插件扩展功能;
下面重点介绍大家关心的几个问题。
第一,需要占用多少存储。
作者贴心预估了一下,每月按 20 个工作日计算,产生的截图文件约 8GB。截图会进行去重,如果连续截图内容变化不大,那么只会保留一张截图。
SQLite 数据库大小取决于索引的截图数量,10 万张截图索引后约占用 2.2GB 存储空间。
第二,关于功耗和硬件设备。
Pensieve 默认需要两个计算密集型任务:1)一个是 OCR 任务,用于从截图提取文本;2)另一个是嵌入任务,用于提取语义信息和构建向量索引;
对于前者,作者使用 CPU 执行,并针对不同的操作系统优化以最小化 CPU 使用。
而对于后者,作者认为可以按照自己的设备进行选择:
- NVIDIA GPU 设备优先使用 GPU;
- 苹果设备优先使用 Metal GPU;
- 其他设备使用 CPU;
当然,为了避免影响用户日常使用,Pensieve 还采取了优化措施。
一方面,Pensieve 能够根据用户的活动模式动态调整索引构建的频率。也就是说,在用户使用电脑时,它会降低索引构建的优先级,以减少系统资源的占用。
另一方面,Pensieve 在设计时考虑了电池使用寿命,通过监控电池状态,当电池电量低于某个阈值时,会自动减少资源消耗,以延长电池使用时间。
第三,隐私安全如何保证。
Pensieve 作者提出了 4 点措施来保证用户隐私,包括:
1、代码是完全开源且易于理解的 Python 代码,允许任何人审查以确保没有后门或恶意软件。
2、本地化数据存储。Pensieve 将所有数据存储在用户的本地设备上,而不是上传到云端服务器。
3、易于卸载:Pensieve 提供了简单的卸载过程,用户可以轻松地从系统中移除。
4、数据处理完全由用户控制。用户可以自由选择何时启动或停止记录,以及如何管理和查询自己的数据。
另外,作为一个独立项目,Pensieve 所使用的机器学习模型(包括 VLM 和嵌入模型)都允许由用户选择。
GitHub: