AI硬件最近大半年开始进入大众视野,新产品、新概念层出不穷,惊喜和失望、赞扬和争议,多到铺满信息流。

怎么理解这些行业现状?AI硬件是真的风口么?底层发展逻辑是什么?AI手机/ AI PC是伪命题么?AI Pin 为啥败得一塌糊涂……

行业背景知识

  1. 两个互相矛盾的硬件设计哲学:① 优秀的产品应该基于以往的设计,进行渐进式的创新;② 当软件发生根本性变化时,硬件应该从零开始设计,以适应新的软件能力。这两种哲学都正确,但提出的设计要求完全相反
  2. AI算力的两种形态:① 经典算力基于冯·诺依曼结构的计算机,执行确定性的代码,是可预测的 (类似农耕-种地);② 加速算力基于 Transformer 等大型神经网络,训练和推理过程不完全可控,结果更具动态性和不可预测性 (类似游牧-放羊)。我们正在从「计算机农业社会」进化到「AI游牧社会」
  3. 软件和硬件都会受到算力变革的影响。AI硬件需要适应新的生产力和交互逻辑
  4. 3C科技行业关于个人计算设备尺度的预言。Mark Weiser 提出了三类基本的普适系统设备:大型的共享英码平板 (像一面墙一样) 、可手持的英尺平板 (iPad) 、可穿戴的私人英寸平板 (iPhone / AirPods / Apple Watch / ……) ;可穿戴设备将崛起以及传感器无处不在,最终实现个人计算的隐形化,仅凭面部识别即可完成所有操作。
  5. 可穿戴设备将采用Language Action Model (大行动模型) :这个模型能理解用户的自然语言指令,并自动执行软件中相应的操作,减少用户与设备的交互步骤。
  6. 效率工程 (Flow Engineering / Pipeline Engineering) 指通过优化算法和模型,显著提升大模型的算力需求、上下文需求以及准确性。与摩尔定律相比,效率工程能实现更显著的性能提升
  7. 生产力的提升将导致商业组织结构的简化。未来更重视能够迅速发现并满足新需求的个人/小团队,而不是大规模的组织。第一个追逐到水草的人,就是最牛逼的人。
  8. 苹果在AI硬件领域正在布局新的商业模式和市场机会。鉴于 Transformer 架构的大模型对内存要求高,苹果正寻求通过提升存储速度来运行这些模型,并将相关技术和设备销售给大型AI数据中心,这是一个非常庞大且有前途的市场。

前沿AI硬件的成/败

  1. AI Pin 是一款胸针形式的AI交互设备,可以通过激光投射至用户手部实现交互,可以通过语音与用户进行沟通和交互,还配备了摄像头来识别用户面前的物体。产品上市后,因为与宣传视频差距较大而遭受了诸多批评,包括发热、续航时间短、声控反馈慢、麦克风收音效果不佳、投影交体验不佳。
  2. Rabbit R1 是一款集成了显示和摄像头的产品,强调语音交互。目前来看是一款失败的AI硬件产品。
  3. ✅ LimitLess 是一款可穿戴的语音记录项链,能够转录和总结对话;产品完成度高,一周预售量已经超过一万。Plaud是一个贴在手机背壳的AI录音机,提供实时录音转录服务;已经销售近十万台,取得了显著成功。
  4. Meta Ray-Ban Glass 是一款集成了高科技的太阳眼镜,配备了用于拍照/录制视频的摄像头,以及用于接收声音指令的麦克风,还支持声音播放控制和简单的语音指令操作。发布后收获了诸多好评,最突出的优点是轻便、交互自然、1200万像素高清摄像头、五个麦克风阵列提供的优秀降噪能力。
  5. Octopus (章鱼) 是斯坦福学生开发的AI项目,基于自然语言预测用户意图并自动执行任务。最大的特点是,不依赖图形用户界面 (GUI),而是通过AI识别并模拟用户的点击操作。模型更小 (越来越小),执行效率高,速度快,能耗低
  6. Dodoboo 是美团光年之外可穿戴设备团队开发的一款创新产品,用户在平板上简单绘画,系统能在毫秒级时间内无需任何提示,自动生成一张精美的简笔画插图。这款产品不仅是技术上的突破,也代表了AI算力和工程链路迭代的成果。
  7. 怒喵是李楠正在开发的AI可穿戴设备,专注于音频体验,确定性地解决音频交互问题,支持至少8小时的连续使用,重量控制在40克以内。怒喵设备将提供两个版本,分别有无摄像头,以适应不同用户需求。

试着做出一些「暴论」

  1. 接下来三年内,所有搭载显示屏幕的AI设备都将面临失败。随着折叠屏技术的兴起,人们将更倾向于使用没有传统显示屏的可穿戴设备,享受更加便捷和创新的交互方式。
  2. 原生视觉大模型到来之前,AI硬件即使配备了摄像头,也不能真正理解和有效利用摄像头捕捉的数据,因此不能显著提升用户体验或带来突破性的功能。
  3. 可穿戴设备距离头部越近,越有可能成功。因为更靠近人类的感官器官,能够提供更直接的感官体验,还能够集成更多传感器来收集用户数据,从而提供更加个性化和沉浸式的体验。
  4. 可穿戴设备朝着更轻、更小、更靠近头部的趋势演进,但具体的产品形态 (耳机/眼镜/项链/……)  尚不明确。当前技术能力所允许的产品重量,与理想中的产品形态之间存在差异。
  5. 未来戴在头上的设备,将集成更多类型的传感器,来满足全新的需求或解决全新的问题。
  6. 三年内,可穿戴设备将逐渐成为用户日常生活中的中央设备。可穿戴设备有可能取代智能手机,或与当前的智能等设备协同工作,成为用户与数字世界交互的主要方式。
  7. AI的发展将导致新公司和岗位的出现。目前一致看到的方向是AI维护/优化/效率提升,这些专业人员负责保持AI系统的高性能和持续进步
  8. 五年内,传统意义上的程序员不会完全消失,但重要性将显著下降。门槛降低使得人人都可编程,非专业开发者也能够轻松实现编程任务,彻底改变软件开发行业的现状。
  9. 传统的互联网软件产品经理没有生存空间。产品经理过去依赖于对用户界面 (UI) 和用户体验 (UX) 的深刻理解来设计产品,但如果AI能够自动生成更优秀的设计,或者用户交互方式发生根本性变化 (如通过自然语言直接与AI交互), 那么产品经理的传统技能可能不再被需要。
  10. 未来,黑灯工厂 (dark factories) 将变得极为重要。这些工厂能够实现从设计到生产的全自动化流程,极大提高效率并减少人力成本。
  11. 未来可能会出现专注于提供边缘计算 (edge computing) 能力的新型公司。边缘算力指的是在网络边缘,即靠近数据源的地方进行数据处理和分析的能力。
  12. AI硬件未来的发展过程可能会「百发齐放」,并根据技术阶段和技术能力产生阶段性赢家,但最终会有一个最后解
  13. 手机还有 20 年的生命力。即便在AI设备和可穿戴设备日益普及的未来,手机仍将继续存在,并可能与这些新技术融合,形成更加丰富的生态系统。
  14. 将AI技术集成到手机里,是行业发展的必然趋势。这也意味着手机厂商需要在激烈的市场竞争中寻找差异化,同时保持盈利,不卷不行,太卷也不行。
  15. 手机厂商自研大模型基座的路走不通。
  16. 手机厂商在开发AI手机时面临一个核心问题:如何在新的AI手机生态中,为应用开发者提供有效的传播和盈利渠道,并且保证自身的收益
  17. 手机厂商不会坐以待毙。他们将进行一些必要的变革并寻找新的收入来源,可能包括在保持核心收入 (如游戏分发等) 的同时,探索与新兴的可穿戴设备和AI技术相结合的新商业模式。
  18. 苹果没有追随开发大型云端AI模型,而是专注在其设备上实现AI功能,也就是把AI能力建立在端侧设备上。

金句金句金句

  1. 硬件产品同样遵循软件产品的设计原则:给的足够少但足够好。三个功能,每个都做到九十五分,一定会超越十个功能,但每个都只有六七十分的产品
  2. 产品的概念如果不能用一句话清晰的说明白, 就很危险
  3. 一个很经典的设计理论:做一个新东西时,要调用用户脑子里面已有的那个概念和熟悉的东西,然后做一点点创新
  4. 一个好的产品,很重要的一个环节就是控制用户的期待,否则所有产品都是不完美的,没有任何产品会超预期。
  5. 生产力的进一步的跃升,会导致商业组织的人数越来越少,未来可能都是项目以及项目分层的模式自由组合。
  6. 一些所谓的空想家之所以被鄙视,一个很重要的原因是他失败的概率非常高, 所以被不停地被嘲笑。但是,当我们的组织更小、 生产力更高、失败成本更低的时候, 这些不停地洞悉全新的需求并且能承受99次失败的人,会越来越成功。