背景
大二双非本,人工智能专业,学校没有保研,非常想留在人工智能领域读研。
最近才知道csdiy(推荐cs224n和cs231n)
学习任何一门课程,不能因为别人推荐,就稀里糊涂去学,需要知道为什么需要学,学的东西可以做什么,我希望我把学习变成一个培养能力,学会深入思考的过程。
我习惯提前让AI帮助梳理近几年的课程内容,包括主要讲了哪些内容以及新增了哪些内容。比如Google AI Studio里面,可以给AI(如Gemini 2.0 Flash Experimental)传链接,让它格式化页面并汇总相关信息。
之前我认为自己只是在使用别人开发的框架,做不出有实际应用价值的成果,感觉自己有些随波逐流。所以,我希望能够从 拥有想法 到 实践想法,深入了解一下人工智能领域。
初步经历
我觉得我第一次接触做和人工智能沾一点边的事情,是我给自己提出一个问题:假如我身处没有神经网络的时代,并且有一个AI作为我的老师和搜索引擎,我能否依靠自己的思考一步步构建出一个完整的神经网络。
之后写一个提示词,进行初步问答,了解了那些看起来很让人头疼的名词,原来是我也想实现的“一些念想”。
现在我再来一遍,可能就会要求 AI ,不能以 比我考虑到的观点 更前沿的思想,来告诉我什么是“历史中胜出的方案”。而更希望它能帮我搜索,除了我的解决方案,以及“历史选择的方案”之外,是否还有一些被“埋没的思想”,并给出论文参考。任何事情都不可能是最优解,比如真的到了很久以后,transformer 或许不会再是最合适的框架,我认为 idea 的诞生不能只依靠极少数人,而是千千万万的思想汇聚在一起形成有深度且有温度的力量。
如果可以,也想让AI列出一些那个时期,智能体会犯的错。比如一些好玩的,9.11和9.9,“strawberry”中有几个字母“r”,可能我搜一下说是tokenizer的问题,那能不能再进一步或者深入几步思考?tokenizer 的历史是怎样的,在什么阶段人们发现需要这个东西从而创造了这个概念,同时期的其他想法为什么没能成为主导,tokenizer 的局限性在哪里,如果是我会怎么去设计。
问题思考
其实,一开始我想问的是“人工智能会有思想吗?会有自我意识吗?”
我搜索了类似的问题,但是我没有找到很多满意的回答,大部分回答都是 听君一席话,白读十年书
不过这一句话还是挺有道理的
“成为一个去思考意识来源的生物,而不是一个渴望创造人工意识的生物,也许是更明智的选择。”
既然连意识的来源我也想不明白,那么作为一个普通人,尽管我在人群中可能毫不起眼,但我也有自己的思想和意识。
【所以,意识和思想对我来说意味着什么?在人工智能上,虚拟的思想和意识又该如何体现呢?】
有时候我们看现在的 AI 也觉得好像活了一样,可能虽然说的话有深度,但是语言太流畅了,不像人能做到的。如果足够闲可以收集足够的数据集,也可以让他变成一个磕磕巴巴的AI,
所以 AI 只是没有做到我们想的,可以像一个生命一样,能拥有自主决策的能力。
但是,有没有可能让AI在表现上,几乎完全达到 我们认为的意识和思想,需要什么条件?
所以这边引出我想问的话题 “人工智能的上限可能是什么?”
人工智能的上限可能是什么
也许 AI 可以在各个领域都做到 top1 的极致
也许AI 可以成为无数鲜活想法的“汇集者”和“实现者”。
好多概念都是发展的必然趋势,RAG,Agent,都是暂时弥补 AI 无法自主做到的功能。举个小例子,AI 计算有欠缺,聪明的开发者会想到设计一个可以运行代码的沙盒环境辅助计算。
所以越来越感觉 设计者的思想深度 一定程度上决定了 AI的能力上限。
同样的人坐在一个宣讲会上,有的人会想,讲的好多话和我没什么关系,听着听着就不想听了,还是看看手机吧。
但是当有一种好奇心时,可能会思考:
-
为什么演讲的人可以如此淡定从容,他们一定经过反复练习,通过一次次试错慢慢改进 【通过练习和反馈学习】
-
发下来的小册子的主讲内容为什么这样排布,封面和背面怎么一下就吸引到我,这个内容的设计排版换一种设计会不会更好。【模型上可能是以领域专家的角度进行优化】【所以我自然想设计一个专家模型,或者一个混合专家模型】
-
为什么我可以在这个环境下专注,我开始从环境考虑,实际上也是因为我希望自我学习:灯光布局合理,音响两面都有,老师讲话很有特点,因为我喜欢的人也在专注学习,我也希望可以和她一样优秀,希望我值得被看一眼。【可能也不只是人工选择对模型有用的特征,不只是根据反馈(‘奖励’ 或者 ‘惩罚’)调整行为,不只是注意力机制】【所以会想如果人工智能各个领域能做到极致逐渐结合起来,机器也可以逐渐有我们感觉上的“思想”】
-
别人可能都在玩,但是我不可以这样做,抛去未来不愁生活的部分人,还有很多人没有意识规划人生,更没有意识去 探索和满足自己的好奇心 ,可能也是学生的想法很单纯,但是我知道我生来就对宇宙好奇,学习是突破认知的途径。【我对“人工智能”的理解是人基于对世界的全部认知,所能设计出的最强的智能体】
不得不说,deepseek R1不是一般的厉害,感觉之后的模型会越来越有创新力。