[开源日报 | 16GB 内存版树莓派 5 售价 120 美元;鸿蒙原生版微信正式上架;RAG 的未来;AI 眼镜在 CES 井喷]
# 2025.1.10
今日要闻
谷歌和 Linux 基金会合作创建基金,支持基于 Chromium 的开源浏览器
谷歌和 Linux 基金会宣布合作成立 “Supporters of Chromium-based Browsers” 基金,旨在营造一个可持续发展的开源贡献环境,促进 Chromium 生态系统的健康发展,并为希望为该项目做出贡献的开发者社区提供资金支持。
根据介绍,Supporters of Chromium-Based Browsers 将提供一个中立的空间,让开发人员和更广泛的开源社区能够合作支持 Chromium 生态系统内的项目。“通过促进协作,该集体的目标是消除创新障碍,扩大采用范围,并确保 Chromium 生态系统内的项目获得蓬勃发展所需的资源。”
该基金将由 Linux 基金会管理,Chromium 项目本身将继续遵循现有的治理结构。目前,Meta、Microsoft 和 Opera 已经成为首批承诺支持这一计划的成,他们将共同为基于 Chromium 的浏览器相关的开源项目提供关键的资金和开发支持。
16GB 内存版树莓派 5 正式上市,售价 120 美元
树莓派基金会正式宣布推出 16GB 内存版树莓派 5,售价 120 美元(约 881 元人民币),并同步推出 “树莓派碳移除信用额度”,用于抵消生产和处置树莓派过程中产生的碳排放。
官方表示相比较树莓派 4,树莓派 5 的性能提升了 3 倍,为了满足大型语言模型、计算流体力学等对内存需求较高的应用场景,以及支持运行 Ubuntu 等 Linux 发行版,推出了 16GB 内存版本。
树莓派 5 开发板搭载博通 BCM2712 芯片,其优化的 D0 步进版本支持大于 8GB 的内存,官方联合美光公司,封装了 8 个 16Gbit LPDDR4X 芯片,从而首次提供 16GB 内存版本。
鸿蒙原生版微信正式上架鸿蒙应用市场
1 月 9 日,鸿蒙原生版微信正式上架鸿蒙应用市场。
微信鸿蒙版已支持视频号、折叠消息转发、群红包、转账、小程序等功能,与普通版微信功能基本相同。此外,微信鸿蒙版还可以直接调用系统原相机,在拍摄照片和视频时可以变焦,拍照 / 录制视频时效果更佳。
目前,微信、支付宝、抖音、京东、淘宝、美团、WPS Office 等 TOP 应用均已上架,原生鸿蒙生态版图的最后一块 TOP 应用终于完成。
xAI 推出独立 Grok 应用,上架苹果商店
埃隆・马斯克(Elon Musk)旗下人工智能公司 xAI 正在为其聊天机器人 Grok 测试独立的 iOS 应用程序。目前该应用程序已在美国、澳大利亚和印度等多个国家的应用商店上线。
独立 App 的 Grok 可以访问来自网络和 X 的实时数据,并提供生成式 AI 功能,例如重写文本、总结长段落、少量问答,还可以从文本提示生成图像。
应用介绍指出:“Grok 是一款人工智能助手,旨在最大限度地真实、实用和好奇。它可以回答任何问题,生成引人注目的图像,并上传图片以更深入地了解你的世界。”
《2024 胡润中国人工智能企业 50 强》
1 月 9 日,胡润研究院发布《2024 胡润中国人工智能企业 50 强》,按照企业价值进行排名。
上市公司市值按照 2024 年 12 月 18 日的收盘价计算,非上市公司估值参考同行业上市公司或者根据最新一轮融资情况进行估算。这是胡润研究院首次发布该榜单。
今日观察
社交观察
Andrej Kaparthy 推荐了一下自己的工作方法
“我早上(刚做完 1 小时运动和喝完 1 杯咖啡后)的大脑非常渴望工作,我会直接处理最优先的事项。随着时间的推移,以及上下文窗口中每加载一个干扰项,我的精力就会逐渐减弱。”
看完这段,先不说方法是不是好用,我最大的感受是:虽然我们都说人类借鉴人脑机制研发人工智能,但是大模型的出现,也让我们多了一种新的理解人脑袋的方法。像这个工作法,就是类比了上下文窗口长度对模型性能的影响,和清空思路对工作效率的影响。
- 微博 高飞
自制的 168M 大语言模型・电子鹦鹉
在线体验:NanoLM - BD4SUR
开源仓库:GitHub - bd4sur/Nano: 电子鹦鹉 / Toy Language Model
其中有完整的模型结构 PyTorch 实现、训练和数据处理脚本,以及推理的 PyTorch 和 C 实现。
【背景】Nano 原本是从 Karpathy 大佬的 nanogpt 复刻而来,用来给炼丹炉煲机。起初对 LLM 并没有太大的兴趣,后来,从 2024H2 开始,小规模的语言模型逐渐受到关注,加上入手了 Jetson,于是(跟风)动了自己从头开始训练 LLM 的心思。
- 微博 归零归零归 ww
用 AI 辅助编程快速打造软件原型的最佳实践
吴恩达老师分享的用 AI 辅助编程快速打造软件原型的最佳实践:
我个人所使用的技术栈几乎每隔几周就会变化一次。市面上还有很多不错的替代方案,如果你能选定一个偏好的技术栈,并熟悉它的各个组成部分,你的开发速度就会大大提高。以下是我目前默认使用的组合,供大家参考:
- Python + FastAPI 构建 Web API
- Uvicorn 作为本地测试时的后端应用服务器在我的笔记本上运行并执行代码
- 云端部署:Heroku(适合小型应用)或 AWS Elastic Beanstalk(适合大型应用)。可用于部署作业的服务有很多,比如 HuggingFace Spaces、Railway、Google Firebase、Vercel 等等。它们都不错,熟悉其中一到两个服务就能简化你的开发流程。
- MongoDB 作为 NoSQL 数据库虽然传统的 SQL 数据库在效率和可靠性方面都非常优秀,但需要提前定义数据库结构(即 schema)会在原型阶段拖慢节奏。
- OpenAI 的 o1 和 Anthropic 的 Claude 3.5 Sonnet 用于编程辅助,常在做概念或设计层面的提示时使用。偶尔也会用 Cursor(在编写代码时)。
另外,我也使用许多 AI 工具来管理代理式工作流、数据摄取、检索增强生成 (Retrieval Augmented Generation) 等等。
- 微博 宝玉 xp
现有的 Agent 技术陷入一个误区 —— 人才是 Agent
现在的思路,让大模型去看屏幕、输入命令,浪费了大量上下文,十分低效。
LLM 最擅长的是思考,应该训练使唤人的大模型,换句话说,人是极好的 Agent。
LLM 将大目标,思考拆解,最终拆解出一系列,具备基本技能的人即可完成的工作。比如,LLM 说,帮我创建一个工程,帮我引入某某依赖,帮我测试一下这个页面……
-–
人才是最好的 Agent!未来的互联网公司,会向 Shield 一样,群英荟萃。有熟练具备基础开发能力的 Agent Wong,也有能熟练进行前端测试的 Agent May。
- 微博 Maeiee
媒体观察
AI 客服越来越多,人工客服为啥还被列为急需人才?
近年来,AI 客服的使用场景越来越丰富,多地却把人工客服岗位列入紧缺技能职业目录。记者采访了解到,人工客服从业者大多出身农村,岗位工作压力大、强度高、人员流动频繁是普遍现象。那么,人工客服短缺如何弥补?对此,专家建议,应实现人工客服与 AI 客服协同互补,同时做好人工客服的心理支持工作、保障从业者身心健康。
- 工人日报
RAG 的未来,走向繁荣、重塑还是消亡?
检索增强生成 RAG 技术通过提供可靠且最新的外部知识,有效提升了大语言模型的输出质量,极大地便利了各类任务,并对多个行业产生了日益显著的影响。随着 RAG 技术的持续进步和应用领域的扩展,其在企业实际落地中所面临的局限性与技术挑战也逐渐显现,亟需进一步的探索与改进。
- AI 前线
ChatGPT 卷入爆炸案刷屏,AI 安全正在成为最贵的学费
我们不可能扔掉利刃,放弃科技,唯有为其打造足够安全的刀鞘,让 AI 在造福人类的同时始终处于可控轨道。变与不变中,AI 安全治理或许才是 AI 行业永恒的话题。
- 机器之心
最前沿的 AI 论文,中国紧追美国
在人工智能(AI)研究实力方面,中国正在紧追美国。对顶尖研究成果云集的三大国际学会所采纳的论文进行分析后发现,在作者人数排名前十的机构中,有四家来自中国。中国机构已成功开发出可与美国相媲美的生成式 AI。以对立的中美两国为核心,全球的 AI 研究正在不断推进。日本正在不得不以美国为中心展开国际合作。
- 日经中文网
李开复:2025 年,大模型公司迎来商业模式的 “灵魂拷问”
其实大模型赛道的发展还不到两年,刚开始大家都是带着好奇心投身进去,但很多人没有看到,当时大模型的能力是不够的,难以打造出好的应用,企业也很难落地创造价值。其次是大模型当时的训推成本太高,就算找到一个好的应用(方向),也不一定做得起。但今天整个格局大大改变了,因为模型的水平在不断提升,它的成本在大幅度下降。
- 中国企业家杂志
AI 眼镜在 CES 井喷,中国厂商霸场,2 个方向 4 大技术最火
万物皆可 AI,AI 无处不在,深度暴走 4 万步逛遍 CES 2025 后,这是智东西记者最深刻的感受。而在一众 AI 智能硬件产品中,AI 眼镜无疑是最受关注的那一批,几乎每个 AI 眼镜展台都人山人海,参展者体验产品的热情也十分高涨。当我们回顾所看到的产品时发现,被国内外科技媒体蜂拥报道的热门 AI 眼镜产品,几乎都是中国品牌。
- 智东西
今日推荐
开源项目
sofastack/sofa-mosn
https://gitee.com/sofastack/sofa-mosn
MOSN(Modular Open Smart Network)是一款主要使用 Go 语言开发的云原生网络代理平台,由蚂蚁集团开源并经过双 11 大促几十万容器的生产级验证。 MOSN 为服务提供多协议、模块化、智能化、安全的代理能力,融合了大量云原生通用组件,同时也可以集成 Envoy 作为网络库,具备高性能、易扩展的特点。
每日一博
基于开放模型的推理时计算缩放
过去几年,大语言模型 (LLM) 的进程主要由训练时计算缩放主导。尽管这种范式已被证明非常有效,但预训练更大模型所需的资源变得异常昂贵,数十亿美元的集群已经出现。这一趋势引发了人们对其互补方法的浓厚兴趣, 即推理时计算缩放。推理时计算缩放无需日趋庞大的预训练预算,而是采用动态推理策略,让模型能够对难题进行 “更长时间的思考”。最著名的案例是 OpenAI 的 o1 模型,随着推理时计算量的增加,该模型在数学难题上获得了持续的改进:
开源之声
用户观点
罗永浩这锅 “锤味” 大乱炖,看着像是 Smartisan OS 以 AI 姿态回归
- 观点 1:不要吵,影响到我用 Jarvis 了
- 观点 2:开源社区禁止发娱乐圈新闻
- 观点 3:看成唾沫大乱炖了
- 观点 4:数年前锤子魅族,小米的 ui 是巅峰,如今锤倒了但这个软件看起来 ui 还是厉害,魅族的 flyme 也走了下坡路 (真可惜),米就说了,现在是个什么玩意儿,如今群魔乱舞广告乱跳的时代,我已经不敢推荐别人买国产手机了,哎,太 tmd 无语了
- 观点 5:很聪明,跑到海外首发
- 观点 6:罗致力于改变世界,大不了再带货还债,又好笑又佩服
- 观点 7:罗布斯
- 观点 8:主页的 logo 有点像极越的 logo
- 观点 9:太像了,就看命运像不像
- 观点 10:他还是忘不了他的 TNT
- 观点 11:个人解包看了下,要推出的 AI 硬件应该是一款蓝牙耳机
- 观点 12:AR 眼镜
必应 “穿上” Google 搜索的衣服,谷歌高管公开炮轰:微软太 Low 了!
- 观点 1:虽然谷歌也不是啥好鸟,但是微软真的下线越来越低了
- 观点 2:原来歪果仁也说 low
- 观点 3:new low 是歪果仁本来就有的用法吧
- 观点 4:俩卧龙凤雏
- 观点 5:当时看见必应这 b 样子就没绷住,和浏览器大战有异曲同工之妙
- 观点 6:确实 low,edge 从别的浏览器未经用户同意导入全部信息也很 low
- 观点 7:微软一直都这么 low 的,以前还会针对谷歌的产品负优化,比如在 edge 打开谷歌文档会卡顿掉帧
- 观点 8:google 文档也可以模仿 office 啊,50 步笑百步
- 观点 9:打不过就加入?