她是当今人工智能繁荣背后的重要人物,但并不是所有的计算机科学家都认为李菲菲在提出一个名为ImageNet的巨大视觉数据库的想法时走在了正确的轨道上,该数据库花了数年时间才建成
李现在是斯坦福大学以人为中心的人工智能研究所的创始主任,她出版了一本新回忆录,讲述了她在管理数据集方面的开创性工作,这些数据集加速了人工智能的计算机视觉分支。
这本书《我看到的世界》还描述了她的成长岁月,这些岁月突然从中国转移到新泽西州,随着人工智能技术日益商业化引起公众关注和强烈反对,她在学术界、硅谷和国会大厅中走了一遭。她在接受美联社采访时谈到了这本书和当前的人工智能时刻。为了篇幅和清晰度,采访经过了编辑
Q:你的书描述了你如何将ImageNet想象成不仅仅是一个巨大的数据集。你能解释一下吗
A:ImageNet确实是一个典型的故事,它识别了人工智能问题的北极星,然后找到了到达那里的方法。对我来说,北极星是真正重新思考如何解决视觉智能的问题。视觉智能中最基本的问题之一是理解或看到物体,因为世界是由物体组成的。人类的视觉建立在我们对物体的理解之上。他们有很多很多。ImageNet实际上是一种定义对象识别问题的尝试,同时也提供了一条解决问题的路径,即大数据路径
Q:如果我能回到15年前,当你在ImageNet上努力工作,并告诉你DALL-E、Stable Diffusion、Google Gemini和ChatGPT时,你最惊讶的是什么
A:我并不感到惊讶的是,你提到的一切——DALL-E、ChatGPT、Gemini——都是基于大数据的。它们是在大量数据上进行预训练的。这正是我所希望的。令我惊讶的是,我们比大多数人想象的更快地实现了生成人工智能。人类的一代实际上并没有那么容易。我们大多数人都不是天生的艺术家。对人类来说,最容易的一代是文字,因为说话是有生成性的,但绘画对正常人来说是没有生成性的。我们需要世界上的范
Q:你认为大多数人想要智能机器做什么?这与科学家和科技公司正在建设的东西一致吗
Q:对人工智能最大的误解是什么
A:新闻界对人工智能最大的误解是记者使用主题人工智能和动词,并将人类放在对象中。人的能动性是非常非常重要的。我们创造技术,部署技术,管理技术。媒体和公共话语,但深受媒体的影响,在谈论人工智能时没有适当尊重人类的能动性。我们有太多的文章,太多的讨论,从“人工智能带来了废话,废话,废话”开始;人工智能做了很多事情;人工智能提供了很多东西;人工智能摧毁了废话,废话,废话。”我认为我们需要认识到这一点
Q:在进入计算机视觉之前,你已经研究过神经科学,人工智能过程与人类智能有多大不同或相似
A: 因为我已经触及了神经科学的表面,我更加尊重它们的不同之处。我们真的不知道大脑如何思考的复杂细节。我们有一些低级视觉任务的线索,比如看颜色和形状。但我们不知道人类是如何写莎士比亚的,我们是如何爱上一个人的,我们如何设计金门大桥的。人脑科学中有太多的复杂性,这仍然是个谜。我们不知道如何在大脑使用的30瓦以下的能量下做到这一点。为什么我们在数学方面如此糟糕,而在观察、导航和操纵物理世界方面却如此快速?大脑是人工智能应该是什么和应该做什么的无限灵感来源。它的神经结构——(诺贝尔奖获得者神经生理学家)Hubel和Wiesel真的是这一点的发现者——是人工神经网络灵感的开始。我们借用了这种架构,尽管在数学上它并不能完全复制大脑的功能。有很多相互交织的灵感。但我们也必须尊重有很多未知因素,所以很难回答它们有多相似。
想要了解更多关于脑机接口技术的内容,请关注脑机网,我们将定期发布最新的研究成果和应用案例,让您第一时间了解脑机接口技术的最新进展。