注册| 登录
手机版 关注微信
您现在位置:中国创新教育网 >> 教育资讯 >> 国际风向 >> 浏览文章

李飞飞:从感知到行动:构建以人为本的AI

来源:中国创新教育网 作者: 李飞飞 已有0人评论  2026/2/6 10:59:46  加入收藏

大家早上好。我正在等待幻灯片加载。希望各位在巴黎这个美好的清晨一切顺利。可以请工作人员播放我的幻灯片吗?好的,非常感谢。

我深感荣幸与激动,今天能与各位齐聚于此,发表开幕演讲。我期待参与一系列极具行动力的讨论,甚至见证一些具有开创性的决策。 

一、AI的起源:从生命演化到机器智能

对我们许多人而言,人工智能常被视作科技塑造现代世界的故事,一个关于未来的传奇。这正是我们齐聚于此的原因。但对我来说,它同样是一段追溯至生命起源的漫长历程,始于五亿年前。那时,“视觉”的概念尚未诞生,眼睛还未进化,没有任何生物见过世界,所有生命都处于黑暗之中。

当进化赋予简单生物感知与回应环境的能力——无论多么初级——一场进化军备竞赛就此开启。从被动感光开始,感知体验变得愈发丰富与主动。神经系统逐步演化,视觉升华为洞察,看见转化为理解,理解催生了行动。这些变革孕育了智能,永远改变了地球生命的轨迹。

快进到五亿年后的今天,人类智能让我们得以想象并塑造生活的方方面面。但我们不再满足于自然赋予的智能。好奇心驱使我们创造能匹敌、甚至超越人类的机器。这便是我们本周所探讨的划时代技术的起源,诞生于20世纪中期。

英国伟大的数学家阿兰·图灵,在计算机诞生之前便极具远见,从哲学层面探索如何赋予机器与人类媲美的认知能力。对我而言,他的著作始终是一项大胆的挑战——敢于像他一样想象“会思考的机器”。

 1956年酷暑,一群美国早期计算机科学家启动了首个探索“思考机器”的研究项目,并创造了“人工智能”这一术语——比它进入公众视野早了数十年。他们认为两个月就能破解智能大部分奥秘的想法,虽过于乐观,却令人钦佩。如今,距离那个“两个月项目”已过去820个月,我们取得了扎实的进步。 

二、现代AI的三大支柱

人们常误以为AI只是计算与工程的问题。但事实上,它始终是一场充满活力的高度跨学科探索。我们如今所处的现代AI时代,是三项深远且独特的科技与科学进步汇聚的成果。

 第一,感知算法研究——从动物到人类,生物如何理解世界——催生了受图灵猜想与达特茅斯愿景启发的数学模型。神经生理学家大卫·休伯尔与托斯坦·韦塞尔揭示了哺乳动物视觉皮层的神经处理分层结构,斩获诺贝尔奖,彻底革新了我们对视觉处理的认知。与此同时,心理学家弗兰克·罗森布拉特搭建了最早的神经网络原型之一——感知器。这项工作启发了数代计算机科学家,从福岛邦彦到杰弗里·辛顿、杨立昆、约书亚·本吉奥,最终形成了我们今天熟知的深度学习神经网络,赋予机器卓越的感知能力。

第二,认知科学家深入研究人类心智,揭示了我们感知环境的深邃复杂性。他们的研究表明,大脑并非封闭在头颅黑暗中的孤立机器,而是从诞生起就渴求知识的学习者,从每一缕光线、每一次触碰、每一丝声音中汲取养分。对我这样一位21世纪初成长起来的科学家而言,当时感知算法几乎是领域的全部焦点,而认知科学让我看到了“规模”的重要性。进化与发育依靠海量数据驱动人类学习。我与合作者、学生们提出假设:同样的原理适用于机器——只不过数据来自数字设备与互联网,而非生物感官。这启发了我实验室的ImageNet项目——首个互联网规模的AI训练与评估数据集。我们关于“数据是解锁神经网络等高容量算法关键”的假设,以前所未有的方式重振了该领域,引发了全球利用大数据推动AI发展的浪潮,如今被称为AI的“规模定律”。

第三,若没有强大的计算基础设施,以上成就皆无从谈起。这一切始于20世纪40年代提出的冯·诺依曼架构——至今仍被沿用的计算范式——并在70年代初催生了首批微处理器。有趣的是,视频游戏产业推动了硅芯片速度的飞跃。90年代初,一个专注于提升游戏图形画质的小型产业,在数十年间成长为全球巨头。英伟达等公司开发出越来越强大的图形处理器(GPU),恰好成为神经网络从互联网规模大数据中学习的最后一块拼图。所以,在场的游戏玩家们:我们欠你们一份感谢!

2012年,我的实验室在ImageNet挑战赛中首次将算法、数据、算力三大要素规模化融合,一夜之间彻底改变了整个领域。那是机器首次能够理解并可靠描述数百万张复杂图像。我们今天习以为常的能力,在当时是未解难题,宛如科幻小说中的场景。那是里程碑链条上的第一块多米诺骨牌,此后每一项突破的到来速度都愈发迅猛。

三、AI的新阶段:从语言到空间与具身智能

十多年后的今天,我们仍在探索那次突破的深远影响。始于学术好奇心的AI,如今吸引着商界领袖、企业家、行业分析师乃至政治家的持续关注,热度不减。我们已进入历史学家必将定义为首个真正AI时代的十年。无论以何种指标衡量——计算机科学学位、AI项目、投资、初创企业——人工智能革命都在不断拓展边界。

过去几年,AI迎来又一次惊人飞跃:大型语言模型(LLM)。这些模型将三大要素推向前所未有的规模——全新的Transformer架构、覆盖几乎整个互联网的训练数据、以及最先进的芯片。其结果是机器能力的又一次爆发式增长,超越了过去十年。我们如今理所当然地期待AI能用自然语言流畅对话,回答几乎所有问题,甚至生成复杂的图像、音频、音乐与视频。ChatGPT的飞速成功——创下用户采用速度纪录——充分彰显了这项创新对日常生活的深远影响。

 但人类智能远不止于语言。一个全新篇章正在开启:AI的感知能力正拓展为更主动的角色。在我从事的计算机视觉与机器人研究中,AI开始在数字与物理3D空间中创造、理解、推理与互动。我们称之为空间智能与具身智能。

举一个简单的例子:我们的视觉智能能轻易识别出猫、盆栽、桌子与一杯牛奶。但感知仅仅是观察吗?我敢打赌,你们许多人不只是看到那杯牛奶——而是本能地想伸手去拿,防止它打翻。这个简单的例子揭示了一个深刻的转变:从被动观察到主动行动。这标志着我认为我们即将迎来的转折点——AI从旁观者进化为与我们并肩的行动者。 

进化告诉我们,智能的真正力量不仅是思考,更是以思想驱动行动。人类的空间智能缔造了文明——从古埃及金字塔到工业革命,从科学发现到艺术表达。AI将如何拓展我们的空间与具身智能,改变我们与世界的关系?它将帮助我们创造、发现、构建什么?

 以下是空间智能快速发展的一瞥:从复杂日常视频的语义标注,到艺术风格迁移,到从文本提示生成视频的生成式AI,再到从任意图像构建3D世界——包括将梵高著名的《夜晚的咖啡馆》转化为虚构3D空间。同样令人振奋的是,机器人技术——一种具身AI形式——正飞速进步。我实验室的项目将机器人学习与大语言、视觉模型结合,使机器人能在开放的现实环境中执行日常人类任务,远超上一代高度预编程机器人的能力。

四、以人为本的AI:三大核心价值观

这些是激动人心的可能性。但如果AI真正从“思考机器”转变为“行动机器”,我们共同引导这项技术的责任将变得无比紧迫。我认为,将此刻称为关乎文明走向的关键时刻毫不夸张。这正是我们本周齐聚于此的原因。

这个问题多年来一直指引着我的研究。虽然没有简单答案,但我的所有努力都贯穿一个核心主题:以人为本的AI,根植于三个朴素而深刻的价值观:尊严、能动性、社区。

第一,尊严。 随着技术日益强大,我们面临一个根本问题:是什么定义了我们作为人类的本质?抛开我们能完成的任务,作为个体的内在自豪感、自主决策与行动的能力,是我们身份的核心。我深受鼓舞的是,这项技术能够守护并恢复尊严——尤其是对最脆弱的群体。例如,在斯坦福,我的合作者与学生研发了一款完全通过非侵入式脑电图(EEG)脑电波记录、由人类意念控制的机械臂。我们的AI算法将这些意念解码为指令,引导机械臂完成一份完整的日式寿喜烧——这是帮助瘫痪患者重获自主能力的关键一步。

第二,能动性。 我实验室研究的核心原则,是探索AI如何增强而非取代人类能力。与历史上每一次重大技术变革一样,AI将重塑劳动力市场。但我相信,AI能赋予我们力量——从创意创作到医疗健康,从科学发现到制造业。AI的技能与人类互补,为我们提供与这位数字或物理伙伴协作、提升自身能力的机会。我在AI医疗领域十年的研究表明,AI有无数方式提升医疗质量、减轻医护人员负担。例如,AI驱动的智能摄像头可改善医院手部卫生规范、记录患者康复锻炼情况、协助手术器械管理。

第三,社区。 过去十年,技术常常将我们割裂——信息茧房、愤怒诱饵、两极分化层出不穷。AI正处在十字路口。一条路通向个性化内容遮蔽真实社交联结、强化偏见的世界;另一条路通向AI帮助构建更宏大、更优质、更具凝聚力社区的世界——比如教育工具,为所有年龄段的人拓展学习机会。例如,利用AI与VR技术为阅读障碍大学生提供个性化学习支持,以及布法罗大学开发的AI专家系统,弥补言语语言病理学家的短缺,为3–10岁有言语语言障碍的儿童提供早期干预。

五、AI治理与未来展望

今天,关于AI的公共讨论太多被耸人听闻与夸大其词主导,导致治理政策误入歧途。若负责任地运用,AI并非人类的威胁——而是提升人类的工具。要实现这一愿景,我们需要根植于科学、务实、多元生态的治理——涵盖学术界、产业界、政府与公民社会。

七十五年前,阿兰·图灵向人类发起挑战,构建“会思考的机器”。今天,我们将这一挑战提升到了他难以想象的高度。我们现在的使命,不仅是创造会思考的机器,更是创造会行动的机器——负责任、守伦理、为全人类福祉而行。

让我们敢于将AI塑造为向善的力量。让我们共同构建一个技术提升人类尊严、拓展人类能动性、强化人类社区的未来。谢谢大家。

(本文根据李飞飞在 2025巴黎AI峰会开幕演讲整理,未经本人审阅)

(李飞飞,全球知名的人工智能学者和斯坦福大学教授,被誉为“AI教母”。她在计算机视觉和深度学习领域贡献卓越,尤其是通过发起ImageNet项目,极大地推动了人工智能的发展。她的研究重点是“空间智能”与“具身智能”,主张人工智能应从“被动感知”向“主动行动”转变,强调“以人为本”的理念,提出尊严、能动性和社区三大核心价值,致力于通过AI技术提升人类生活质量和促进社会包容性。)

0
0
关键字:
上一篇: 2025年最重要的十项教育研究
下一篇:没有了

 最新文章

 热门文章

关于我们| 版权声明| 联系我们|免责声明| 网站地图

中国创新教育网 版权所有:站内信息除转载外均为中国创新教育网版权所有,转载或摘录须获得本网站许可。

地 址:潍坊市奎文区东风大街8081号    鲁ICP备19030718号     鲁公网安备 37070502000299号