三七看书网

手机浏览器扫描二维码访问

本站弹窗广告每日仅弹出一次
尽可能不去影响用户体验
为了生存请广大读者理解

第17章 我是谁?(第4页)

有关意识的秘密,要从 1956 年初说起。在美国新罕布什尔州的达特茅斯学院,29 岁的计算机专家约翰·麦卡锡向洛克菲勒基金会申请科研经费,他提出了一个看似荒谬的创新性设想。没想到,基金会批准了这笔经费。同年 6 月,麦卡锡邀请信息论之父克劳德·香农、研究学习机的马文·明斯基、Ibm 公司的计算机专家纳撒尼尔·罗切斯特等人在达特茅斯学院开会。会上,他们提出了震惊科学界的观点:机器能够产生智能,能够进行推理、学习和自我改进。会后,麦卡锡撰写了达特茅斯会议议案,阐述了对实现机器智能的看法与建议。此次会议的重要意义在于“相信”,他们坚信智能并非人类独有,是可以被创造出来的,这在当时是极具超前性的想法,对有造物主的观念构成了巨大挑战。

达特茅斯会议之后,与会者回到各自的工作岗位,建立了人工智能的三大派别:符号主义、连接主义和行为主义,这三种主义是实现人工智能的不同路径。在很长一段时间里,这三大派别都未取得重大突破,但后来越来越多的科学家将关注点聚焦在连接主义上,因为其本质是模仿人类大脑,以大脑中的神经元和突触为对标,科学家们称之为神经网络。

1980 年,日本广播协会广播科学研究实验室的研究员福岛邦彦在《生物控制论》期刊上发表了一篇论文,题目是《神经认知机:一种不受位置偏移影响的模式识别自组织神经网络模型》。简单来说,福岛邦彦设计了一种能够识别图像的机器,当时计算机能力有限,只能识别手写数字和字母。计算机由主板、cpU、内存等硬件组合而成,它是如何识别图像的呢?这涉及到图像的本质。一张照片放大后是由一个个微小的像素组成,不同灰度的像素排列组合形成了图像,眼睛看到世间万物的原理也是如此。光反射进眼睛被视网膜中的光敏细胞捕捉,光敏细胞将光信号转换为电信号,通过视神经传递到大脑的视觉皮层,进而重构出看到的图像。福岛邦彦所做的就是用计算机模拟这一过程。

下面介绍一下神经网络的工作原理。以识别阿拉伯数字“3”为例,先扫描手写数字得到 28x28 像素的图像,将每个像素点对应一个神经元,共 784 个神经元,用 0 到 1 之间的数字标记,0 代表最黑,1 代表白色,中间灰度用不同数值表示。这 784 个神经元构成输入层,相当于人眼的光敏细胞。最后一层是输出层,假设有十个神经元对应 0 到 9 这十个数字。中间的层是隐藏层,通常不止两层,隐藏层越多神经网络越复杂,大脑也是如此。手写数字存在一定模式,比如数字 9 可看成一个圈加一个数,数字 8 是在一个圈下再加一个圈,数字 4 可看成竖竖横三个部分。以 9 为例,当它出现时会点亮下一层认为接近圈和数的神经元,大概有 8 到 10 个神经元被点亮,然后进入倒数第二层确认代表圈和数的神经元,最终在输出层得出结果。但实际上,仅从输入层计算复杂的非线性问题难度很大,于是计算机专家想到了人脑的经验机制。比如“杯弓蛇影”,弓的倒影和蛇相似,经验会影响判断,输出端也会反过来影响大脑对事物的认知。在图像识别中,当机器识别手写数字 2 时,可能会认为 3 和 6 的可能性最高而给出错误结果,这时可通过人工在输出层给出新权重,将 2 打成最高分,其他数字为 0,反向输入后机器就能学会识别类似的手写 2,这种训练方法就是反向传播,它是深度学习的核心训练方法之一。然而,神经网络存在“黑箱”问题,它由多层神经元组成,大量参数相互作用,决策基于统计规律,人类难以理解其逻辑,也很难解释每一层学习到的含义。人类大脑约有 860 亿个神经元,通过约 100 万亿个神经突触相互沟通协作,其运作原理同样神秘。

2017 年,谷歌的八位计算机专家发表了具有跨时代意义的论文《注意力机制是唯一需要的》,提出的 transformer 模型为后来的大语言模型(如 chatGpt)奠定了理论基础。这篇论文的了不起之处在于提出了自助注意力机制这一数学解决方案,让科学家坚信神经网络能产生类似智能的东西并回答问题。

接下来谈谈计算机回答问题。语言是一个终极概念,日常对话、手语、计算机编程语言、数学等都是语言。数学作为一种语言,具有结构、语法、普世性和精确性,大语言模型能从纯数学中模拟语言结构和模式。概括地说,语言是人类描述世界最简洁有力的工具,而且它远不止是工具,正如维特根斯坦所说“语言的边界就是思想的边界”,人类无法用语言描述未知事物,所以语言是人类思维的总和,大语言模型掌握了语言总和也就掌握了可描述世界的信息。

大语言模型的工作原理是用统计学方法推测下一个字出现的概率。以英文句子“who is the smartest thinker so far?”为例,先将单词分解成最小单位(token),每个 token 与高维空间中的向量相联系,向量有距离和夹角表示语义和语法的相似性或关系。如“man”和“woman”的距离理论上与“king”和“queen”相近,但由于“queen”在英文中有更多含义,所以“king”与“queen”的距离比“man”和“woman”更远。在预测句子中问题的答案时,如“which professor is harry potter's least favorite?”,模型会根据计算得出每个结果的概率值,选择概率最大的作为答案,如计算出“Snape”的概率为 0.78 分,就会选择“Snape”。对于复杂的侦探小说结尾的问题,如根据全文推测凶手,模型需要捕捉每个词的寓意和上下文关系,通过谷歌论文中的数学公式(涉及查询项目 query、键值 key 和向量 value,它们有大量参数,经过计算加权组合),衡量不同章节和段落的线索与角色关系,形成对整篇小说的整体理解。所以,大语言模型不仅需要复杂数学,还需要强大的算力支持。

在科学家的信念加持下,大语言模型取得了成功,虽然目前还不是真正意义上的人工智能,但人类向创造智能迈出了坚实一步。

说完这些,才进入真正关于意识的内容。1970 年,生物心理学教授哥登·盖洛普研究动物是否有自我意识。此前已有生物学家进行相关研究,比如把食物放在鸽子够不到的高处,鸽子会把木块移到食物下踩着去吃,但这可能只是本能反应,不能证明鸽子有意识。盖洛普设计了镜像测试实验,以大象为例,大象起初对镜子好奇并触碰,当研究人员在其头上画标记后,大象直接触摸自己头上的标记,而非镜子中的影像,这表明大象能理解标记在自己身上。美国国家地理频道用红毛猩猩重复实验,也得到了相同的结果。这说明很多高级动物和人类一样有自我意识,意识在不同物种间存在阶梯,可能并非神秘莫测,人类也并非特殊,意识是大脑进化的产物,是神经元放电现象,智能是自然进化的结果。

1956 年达特茅斯会议的科学家认定人类能创造智能,70 年后 chatGpt 问世。Gpt-1 发布时只有 1.17 亿个参数,回答问题效果不佳;Gpt-2 参数增加到 15 亿个时,竟无师自通学会了翻译;Gpt-3 参数提升到 1750 亿个,展现出复杂逻辑思维、生成代码能力,还能模拟情感生成文本,这些进化超出了设计者预期。专家推测这可能与神经元和突触规模有关,参数越大越可能涌现出超凡智力。目前人工智能尚无自我意识,可能是参数不够多,至于下一代 Gpt 是否会产生意识,尚无法确定,但很多计算机专家认为这只是时间问题。

简单总结,意识是神经元通过电信号和化学信号相互作用产生的高度复杂认知结果,既可以自然进化产生,也可能由人类创造。然而,有关意识的认知还有更颠覆的理论。1980 年初,神经科学家本杰明·利贝特进行了一项轰动科学界的实验。他用脑电图技术测量大脑活动,在被试者面前设置 60 秒计时器,被试者可自由选择时间按下按钮。利贝特原以为大脑先做选择,脑电波传递信号到手指后手指再按下按钮,但实验结果却令人震惊:手指按下按钮的信号早于大脑产生的信号约 200 毫秒,这被称为利贝特延迟。这表明行为发生前,大脑中的无意识过程已决定了动作,这引发了人们对意识是否决定行为的思考,进而对意识的本质产生了疑问:意识到底是什么?它真的存在吗?

1991 年,着名认知科学家丹尼尔·丹尼特出版了《意识的解释》这一经典着作。他认为人对意识的理解可能存在误区,人们以为大脑里有一个代表本我的“小人”,但这可能只是幻觉,意识或许并不存在,所谓意识只是神经活动和原子相互作用的自然现象,人们认为的自我只是原子活动的附带体验。人体由约 7x102? 个原子组成,其中氧原子约占身体总质量的 65%,碳原子约占 18%,氢原子约占 10%,这三种元素占比达 93%,其余 60 余种元素仅占 7%。一般情况下原子不灭,宇宙中的氢原子大多起源于 138 亿年前的大爆炸,原子存活时间可能比宇宙寿命还长。人死后原子回归自然,数百年后会随生态系统循环遍布全世界,我们身体里的原子可能来自岩石、河流、花草、昆虫,甚至可能有组成秦始皇和华盛顿的原子,我们吸入的每一口气里或许都有历史名人身上的原子。从这个角度看,人是原子不断装配组合的产物。

直到大语言模型出现,对意识的理解又有了新的可能。假设大脑神经元与神经网络工作方式类似,神经元在大脑中形成高维空间,大脑的思考与回答是在维度空间中寻找相近词汇形成答案,我们以为的有意识回答可能只是一种概率选择。大语言模型提示大脑的“黑箱”受输入层(包括眼睛、耳朵、鼻子、舌头、皮肤等身体器官的感知)和输出层(人生经历体验形成的经验)影响,输入层和输出层会反过来影响大脑对外部世界的认知。如果这一推想成立,那么意识可能是大脑中某种算法的结果。一个人读书多、知识丰富,提供给大脑的 token 就多,因为语言是我们看待世界的方式,能组合的词汇越多就越有思想;而人生经验丰富的人,反向输入大脑的经验多,大脑能通过经验调整内部参数,更善于解决问题;天才可能是大脑在某些方面优化得更好。当然,这只是一种猜想,丹尼特认为人类的自我是大脑活动编制出的叙事,在此基础上结合大语言模型的理解,有人提出人是生物化大语言模型的假想。

意识之谜仍无定论,但人类可能已接近答案。也许意识只是基因操控下的假象,至于命运之轮将人类带向何方,有待后续探讨。

热门小说推荐
情海沉浮

情海沉浮

情海沉浮情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,情海沉浮-烛影文思-小说旗免费提供情海沉浮最新清爽干净的文字章节在线阅读和TXT下载。...

风雪持刀人

风雪持刀人

风雪持刀人情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的历史军事小说,风雪持刀人-觉性-小说旗免费提供风雪持刀人最新清爽干净的文字章节在线阅读和TXT下载。...

万宁是条狗

万宁是条狗

万宁的青春,是疼痛的,迷茫的,兵荒马乱的。万宁的青春里,有陈烟,有陈尘,王二,有韩萌萌,有麻子,有周小姐,有鱼蛋……万宁的青春里,有友情,有亲情,也有爱情。仅以此文献给所有在泥淖中挣扎沉沦的人们。......

神秘复苏之诡墨

神秘复苏之诡墨

神秘复苏之诡墨情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,神秘复苏之诡墨-棋盘上的被子-小说旗免费提供神秘复苏之诡墨最新清爽干净的文字章节在线阅读和TXT下载。...

反向诱捕

反向诱捕

迟夏,29岁的母胎solo,长着一张校草脸却屡屡相亲失败的当代工作永动机。 机缘巧合,在第n次相亲中,好巧不巧地在茶馆里遇到了比狗还讨人嫌的死对头——左鹤鸣。 男人一身高定西装,雷打不动的领带遮住凸起的喉结,锐利的鹰眼隐匿于无框眼镜之下,黄金身材比例外加宽肩窄腰,完全不输那些个明星爱豆。 沉默片刻,皱着眉头问道:“迟经理,你是GAY?” 柜门早被焊死的迟夏怎么也没想到,相亲相到左鹤鸣就算了,竟被怀疑取向有问题。 这谁能忍? 当即作出反击:“好巧啊左总,你也是?” — 原以为那场阴差阳错的相亲不会再有后续,直到某天两人共处一室。 左鹤鸣拉过迟夏的手压在自己淌着水渍的八块腹肌上,声音低哑附在对方耳旁问道: “迟夏,真不试试?” 好不容易觉得自己跳出陷阱的迟夏眼一闭心一横,不知怎地稀里糊涂和对方滚上了床。 * 诡计多端的天才电影创投人(左鹤鸣)x敏感傲娇的达人运营分析师(迟夏) 名字三个字l的是攻 前期攻钓受/后期甜甜恋爱 死对头文学/单向变双向/都市爱情童话...