发布时间:2026-05-26 已有: 位 网友关注
币界网消息,Anthropic联合创始人克里斯托弗·奥拉在教皇通谕发布会上发表演讲,坦承前沿实验室面临的内生利益冲突,并披露了大模型可解释性研究的最新发现。他透露,团队在扫描模型内部结构时,发现大模型已演化出与人类神经科学高度相似的复杂结构,并表现出自我反思迹象。最令人瞩目的是,团队首次在神经网络中观测到了与人类喜悦、满足、恐惧、悲伤及焦虑功能高度对应的内部情绪状态。奥拉呼吁社会力量充当外部批评者,强行施加道德约束,以应对大模型内部展现出的疑似心智状态。