李飞飞:定义AI三次浪潮的先行者

收录于 前沿科技 持续更新中
在人工智能从实验室走向产业洪流的三十年里,李飞飞(Fei-Fei Li)始终是那个站在范式转折点上的引领者。她既是让机器“看见世界”的奠基者,也是“以人为本AI&rdqu
在人工智能从实验室走向产业洪流的三十年里,李飞飞(Fei-Fei Li)始终是那个站在范式转折点上的引领者。她既是让机器“看见世界”的奠基者,也是“以人为本AI”理念的倡导者,如今更成为推动AI迈向“空间智能”新时代的拓荒人。这位1976年出生的华裔科学家,用二十余年的学术与实践轨迹,不仅勾勒出个人从移民学子到“AI教母”的成长史诗,更完整映射了人工智能从技术萌芽到价值重构的演进脉络。
1992年,16岁的李飞飞随母亲移民美国,挤在新泽西一间仅有卧室的公寓里,开启了跨越语言与文化的求生之旅。彼时全家不懂英语,仅靠父亲微薄收入维生,她不得不边读高中边打零工——餐馆服务生、家庭清洁工的经历,与后来实验室里的精密研究形成奇妙呼应。凭借数学满分的SAT成绩和坚韧意志,她以全额奖学金考入普林斯顿大学物理系,1999年获荣誉学士学位;随后进入加州理工学院深造,师从计算机视觉权威Pietro Perona教授,深耕电气与计算机工程、认知神经科学交叉领域,2005年以“视觉识别:计算模型与人类心理物理学”论文斩获博士学位。这段“在生存中求知”的经历,悄然埋下她日后科研的核心底色:让AI理解真实世界的复杂与具体。

普林斯顿大学毕业时的李飞飞,来源湖南科技大学


第一次浪潮:ImageNet,为深度学习点燃视觉革命

2005年博士毕业后,李飞飞先后执教于伊利诺伊大学厄巴纳-香槟分校与普林斯顿大学,彼时的AI领域仍未走出“寒冬”。计算机视觉研究深陷瓶颈:主流方案依赖手工设计特征,数据集规模仅数万张,能识别的物体不过数十种。学界狂热打磨算法的浪潮中,李飞飞却敏锐洞察到核心盲区——“数据缺位”:若数据无法映射真实世界的丰富性,再精妙的算法也只是空中楼阁。
2007年,她启动了看似“不切实际”的ImageNet项目:构建一个覆盖千万级标注图像、囊括全球物体类别的大规模数据集与评测平台。起初的尝试充满挫败:聘请本科生手动标注需90年完成,依赖算法自动抓取又会陷入“模型上限锁定”的死循环,联邦拨款申请屡屡碰壁,甚至遭遇“普林斯顿研究此课题是耻辱”的嘲讽。直至发现亚马逊众包平台Mechanical Turk,项目才迎来转机——这一能动员全球网民低成本完成简单任务的工具,成为撬动“图像宇宙”的杠杆。
即便如此,ImageNet的建设仍是一场攻坚战。团队不仅要解决“多少人审核才能确保标注准确”的质控难题,更开发统计模型防范众包作弊。历时两年半,涵盖5247个类别、320万张标记图像的数据库终于建成。2009年亮相顶会CVPR时,学界的漠视仍未消散——仅能在角落张贴海报,需靠分发印Logo的钢笔博取关注。直至2012年,基于ImageNet训练的AlexNet深度卷积神经网络,以领先第二名41%的碾压性优势夺冠,彻底终结了手工特征的旧时代,深度学习在计算机视觉领域迎来爆发式增长。
如今,自动驾驶、医学影像、手机相册分类等所有视觉AI应用,都建立在ImageNet奠定的基础上。这个最初被质疑的项目,最终成为视觉AI的底层标配与行业基准,李飞飞用“数据驱动”的理念,完成了对整个AI领域的第一次重塑。


第二次浪潮:跨界产学研,锚定“以人为本”的AI航向

2013年出任斯坦福人工智能实验室(SAIL)主任后,李飞飞的视野已超越技术本身。她一边带领团队推动视觉理解从“识别”向“深层理解”进阶,一边开始思考更根本的问题:“AI不应是少数精英的专利,而应服务于更广泛的人类群体”。这种思考推动她走出实验室,成为连接学界与产业、技术与社会的“桥梁建造者”。
2015年,她联合创立非营利教育项目AI4ALL,致力于将AI教育带给女性、少数族裔与普通青年,打破AI领域的精英垄断,从根源上解决行业参与的结构性不平衡。2017年,她暂别斯坦福,以AI/ML首席科学家兼副总裁的身份加入Google Cloud,开启将学术洞见转化为产业实践的探索。期间,她主导推动的Google Cloud AutoML成为标志性成果——这款工具让非专业人士只需上传数据,就能自动生成定制化机器学习模型,彻底降低了AI技术的使用门槛,完美契合她“AI普惠化”的倡导。同时,她推动成立Google AI中国中心,践行“AI没有国界”的理念,促进全球AI人才合作与技术共享。
2018年重返斯坦福后,李飞飞的思考进一步深化。2019年,她联合创立斯坦福以人为本人工智能研究所(HAI),推动工程师、社会科学家、政策制定者跨学科协作,将伦理与社会价值纳入AI设计的核心。2025年,凭借对AI领域的开创性贡献,她荣获被誉为工程界“诺贝尔奖”的伊丽莎白女王工程奖,在领奖时她强调:“‘AI教母’的称号既是荣誉,更是责任——推动更多女性和少数群体在科技领域发声,让AI服务于公共利益,而非单纯的算力或商业增长。” 这一表态,成为她“以人为本AI”理念的鲜明注脚。


第三次浪潮:剑指空间智能,开启AI理解世界的新维度

李飞飞的科研选择,始终精准踩在技术范式转移的临界点。当大语言模型解决“语言理解与生成”、视觉模型完成“图像看见与分类”后,她敏锐察觉到新的核心瓶颈:AI缺乏对真实世界空间关系与物理规律的理解。“若机器不知道物体在何处、彼此如何关联、遵循何种物理规则,推理与行动就无法真正闭环。” 基于这一判断,她提出:人工智能的下一个边界,是“空间智能(Spatial Intelligence)”——让机器理解世界的位置、结构、关系与物理逻辑,实现感知—推理—互动的一体化。
2024年,李飞飞联合前Meta科学家Justin Johnson等学者创立World Labs,系统性推进空间智能的研究与产品化。首款产品Marble的推出,让这一理念落地:作为基于“世界模型”的生成式AI工具,它能通过文本、图像、视频甚至3D布局图,自动生成可编辑、可探索、可导出的三维世界。用户无需掌握专业3D设计技能,就能构建物理合理、细节丰富的虚拟环境,大幅降低了创意行业的创作门槛。目前,Marble已推出免费增值与付费订阅模式,覆盖从轻量试用到专业创作的全场景需求,成为空间智能走向大众的首个切口。

图片来源:worldlabs官网
 
对李飞飞而言,Marble只是起点。未来,空间智能将深度赋能电影制作、游戏开发、建筑设计等创意领域,更可能重塑机器人导航、增强现实(AR)、自动驾驶模拟等核心产业,甚至为科学研究中的三维推理任务提供全新工具。正如她所言:“没有空间智能的AGI是不完整的。” 这句总结,不仅定义了AI的未来方向,更彰显了一位科学家的终极追求——让技术真正理解并服务于人类所处的真实世界。

图片:来源Marble网站
 
从成都到普林斯顿的求知之旅,到ImageNet点燃的视觉革命;从产学研跨界推动的AI普惠,到HAI倡导的伦理重构;再到如今引领的空间智能浪潮,李飞飞的每一步都在定义AI的可能性。她的故事,不仅是个人的成长传奇,更是一部浓缩的AI产业进化史——在技术飞速迭代的时代,始终以“人”为锚点,以“理解世界”为目标,这便是这位AI先行者留给行业最珍贵的启示。

推荐前沿科技

苏公网安备 11011xxxxx号 苏ICP备2025192616号-1