OpenAI 首位投资人 Khosla 最新洞察:AI 使人机交互发生根本性转变,软件将进一步适应人类

发布日期:2024-04-01 10:14    点击次数:71

   Khosla指出,语言将主导AI交互界面,同时AI应用正逐步适应人类。AI正创造人为中心和基于代理的未来。

  这是OpenAI首位投资人Vinod Khosla关于AI交互与革命的最新洞察。Khosla对常见术语“AI硬件”和“小工具”表示怀疑,他主张从一个新的视角来看待这些设备,认为它们是即将到来的时代中不可或缺的组成部分,这个时代的特点是以低延迟语音交互作为主要的用户界面。

   Khosla强调,这不仅仅是关于设备的讨论,而是关于人机交互根本性转变的讨论。他认为AI将在我们与技术的关系中引发两个根本性的变化。首先,语音——已经是最自然的人类互动界面——将成为主导的交互界面。

  想象一下,延迟时间减少到不到半秒,这与基于触摸的设备的迟缓形成了鲜明对比。甚至“无声语音”也在讨论之中——在公共场合如咖啡厅中,无需发出声音即可发出命令。通过检测这种“无声言语”,技术将允许人们在公共场所私下口述,而不被旁人听见。

  第二个变革是应用程序将如何适应我们。不再需要像学习使用Uber或SAP、Oracle这样的复杂系统一样,去学习如何导航应用程序。

  到目前为止,我们总是在适应软件——学习它的复杂性,记住层次化的菜单等等,以此来与机器通信。

  现在,AI正在使软件适应人类。这将导致新类型的硬件的诞生,这些硬件主要设计用于语音互动,计算机学习人类的语言和人类本身。虽然对于某些视觉任务可能仍然需要屏幕,但核心交互将转向语音——无论是无声的还是有声的。

  设计师Jony Ive和OpenAI的Sam Altman讨论了一个AI硬件项目。多年前开始的Humane猜测了这种接口——但早期的热度很快消退了。这些企业家的方向是正确的,但他们的实现没有充分专注于AI使能的新用户体验。

   Rabbit凭借其最小化的设备引起了轰动,使得微软(410.34,-1.31,-0.32%)CEO Satya Nadella称其R1发布为“我看过的最令人印象深刻的展示之一,自Steve Jobs在2007年介绍iPhone以来,捕捉到了什么是可能的愿景。”

   Khosla Ventures也是Rabbit的投资者之一,有新Newin曾在第一时间分享过《【2.1万字实录】Rabbit创始人&CEO吕骋最新对谈|R1更像是AI+iPod,而不是iPhone杀手》。

   Khosla认为Rabbit是重新定义人机交互在强大AI世界中的早期尝试。这些设备将围绕着我们应该通过自然语言用声音与计算机(或可以为我们运行应用的代理)对话的理念为中心,而不是通过人造构造。

  以 Khosla个人的生活习惯为例。当他徒步时,他会使用一个叫做Picture This的应用来识别我遇到的植物,但这个过程很麻烦:停下来,暂停有声读物,打开应用,拍照,等待答案加载,关闭应用,把手机放回口袋。

  有了这项新技术,他只需将设备指向植物并问:“这是什么植物?”便会得到答案,然后我可以说“播放有声读物”并继续听我的书,无需中断或麻烦。

  从成本角度看,这种以语音驱动的方法是一个游戏规则的改变者。它比传统的智能手机要便宜得多。形态因素的创新也很可能,尽管配备更大屏幕的手机不会消失。

   Rabbit的大型动作模型(LAM),基于神经符号方法,学会使用软件应用并跨应用工作,因此人类不需要了解其他应用或网站。Rabbit的代理将与人类交谈并为他们使用这些应用。

  语音比打字或触摸屏更简单、更高效。高分辨率图形和触摸界面要求昂贵、复杂的计算。相比之下,驱动ChatGPT和其他聊天机器人的非常大的5000亿参数大型语言模型试图学习所有曾经发布的内容。

   Rabbit的LAM表现得更像是学习如何使用应用和其他LLM的人类,因此人类不需要学习它们或掌握提示工程。LAM学习使用软件的方式就像人类一样,而不是通过应用程序编程接口与应用通信,如传统软件所做的。

  想象有人在你滑动手机时偷看你的肩膀并学习那些模式。那就是LAM——或者未来可能被称为的东西。这是传统范式的完全颠覆,意味着最终我们不必与软件交互,因为AI将代表我们这样做。

  手机,就像现在这样,被设计来分散我们的注意力。如果Khosla在徒步时不得不拿出手机,会看到电子邮件、短信和其他通知;他会被拉进某个社交平台,被广告打扰,甚至可能下陷入一个漩涡,毫不夸张地说。

  手机不断争夺我们的注意力,将我们拉入通知和消息的漩涡。这些新设计,如Rabbit,旨在节省时间并最小化分心。你告诉它要做什么,它就仅仅做那个,没有更多。

  初创公司可以如此敏捷和创新!技术的未来不是关于渐进式变化或过去的外推,这不仅仅是关于制造另一个iPhone16或17——尽管那些将继续非常有价值。这是关于我们与设备互动方式的根本性转变,这是以AI为中心的,需要新的设计和新的优先级,硬件支持。初创公司最适合这样的转变。现有的大公司肯定会慢慢跟进。

  这就像Apple支配手机市场之前的手机市场。在2006年,大名鼎鼎的是Nokia、Motorola,也许还有Samsung和BlackBerry。Apple当时甚至还没有进入这个画面。

  然后它突然推出iPhone,彻底改变了游戏规则。通过一个创新的以用户为中心的触摸界面,在这个高度便携的计算机中,成为可能的数百万应用。

  正因为下一个阶段不是关于硬件或小工具,而是关于人类与计算机互动方式的彻底改造,我们将把像Rabbit的R1这样的设备添加到我们的装备中。我们将使用一个按钮设备,通过自然语言驱动大多数互动,屏幕如我们所知将成为次要。

  这些新设备能够做的很多事情可以通过在传统设备如智能手机上的“代理”应用来完成。但智能手机不提供亚秒级的、无干扰的互动和其他独特功能,这些是人类中心的AI将启用的。

  新技术将出现以支持这个生态系统,如植入隐形眼镜和眼镜的显示器和许多不同的方法来无声言语,以便在公共场所隐秘地使用设备。

  这些设备正在发明一个以人为中心和基于代理的未来,由新的AI技术启用。Rabbit正在对此进行真正的尝试,这不仅仅是一个渐进式的变化。其他人肯定会跟进,创造许多便于携带和使用的设备。

   Apple带给我们“有一个应用可以做到那个”的世界。Rabbit式的设备将带给我们“有一个AI可以做到那个”的世界,通过一个以语音驱动的个人代理访问,可以为你运行应用(END)。





Powered by 正规杠杆炒股平台 @2013-2022 RSS地图 HTML地图

Copyright 站群系统 © 2013-2021 365建站器 版权所有