Bitpie|大模型时代,智能音箱的风会往哪儿刮? -
Bitpie|大模型时代,智能音箱的风会往哪儿刮? -
原文来源:硅基研究室
作者:白嘉嘉
图片来源:由无界 AI生成
久未有战火的智能音箱,因为百度最新的产品升级,迎来了新故事。
10月17日,百度世界大会2023,小度科技新任CEO李莹压轴出场,带来了百度智能家居生态的全新物种「添添家庭机」。从产品形态来看,添添家庭机可以被视作「智能音箱+平板电脑+大模型」的综合。
这意味着百度对智能音箱的理解,再上了一层台阶。
过去,智能音箱被视为物联网时代的用户入口,小米、百度、阿里围绕着它掀起了一场旷日持久的价格战,从最初的500至600元每台,一直卷到百元以下。最终,百度剑走偏锋,通过「音箱+屏幕」的产品形态在这场「三国杀」中拔得头筹。
然而,胜利者没有如愿迎来采摘时刻,人们对于智能音箱的前景一直褒贬不一。
根据洛图科技的数据,2022年国内智能音箱的全渠道销量只有2631万台,同比下降了28%。今年上半年,行业并未迎来好转,同口径的统计数据是全渠道销量1148万台,同比下降了19%;对应的销售额为33.7亿元,同比下降了20%。
究其原因,智能家居生态尚未形成,语音交互受限于场景,手机端APP更符合消费者习惯等因素不一而足。其中最关键的是,智能音箱产品力不足,非但不能承担起家庭助手的重任,甚至还会闹出「夜半歌声」的恐怖故事。
如今,号称要「赋能千行百业」大模型来势汹汹,似乎是解决产品力不足的良方。小度「前船长」景鲲曾策划过「大模型时代,小度重塑智能生活」的演讲,虽然后来因为个人原因辞职,但从接任者李莹的本次演讲来看,大模型与小度旗下硬件产品结合的大度趋势仍未改变。
这一次,智能音箱能满足人们的期待吗?
为什么智能音箱没有如愿成为新的用户入口?
在智能家居里,智能音箱是一个关键节点,甚至有人将其称为产品链条中「兵家必争之地」。之所以它这么重要,主要有交互方式和技术两方面原因。
首先是交互方式上。
人类所习惯的向外界传递、接受信号的方式其实并不多,主要是通过视觉、动作和声音。
传统电器的交互模式以「用户在固定的操作面板(比如遥控器)上下达指令,电器在显示面板上给出反馈」为主。它的运作非常稳定,但指令不具有灵活性,低效且受限于载体。
相比之下,语音交互可以很好地解决这些问题。比如通过 Siri 定闹钟要比手机定闹钟快得多。
智能音箱正是实现这套语音交互流程的最简载体。
另一方面,从技术上,智能音箱也起着承上启下的作用。
如果语音交互为基础的智能音箱可以满足用户的需求,那故事机、镜子等产品的智能化也就成了。如果没法满足用户的需求,具身机器人、导购机器人等更高端的产品就只是空中楼阁。
智能音箱这个名称本身是具有迷惑性的,在大厂所设想的智能家居时代,智能音箱实际上是一个类似于路由器的终端,只不过路由器是为各个电器供网,而智能音箱是将用户指令分发给各个电器。这也是它被视作新的用户入口的原因。
那为什么智能音箱没有如愿成为新的用户入口呢?
如前文所说,产品力不足,同质化现象严重是核心原因。
将智能音箱一词拆分,分为“智能”和“音箱”两块,侧重点决定了它的定位。
如果将智能音箱视作智能家居的核心,它的本职工作实际上是理解用户下达的指令并提供反馈,音箱的主要功能是语音反馈。但由于智能程度较低,语音交互实际上并没有设想中的那么自由,还是需要通过关键词来实现。
因此,用户在尝试进行交互后便会快速失去兴趣,继而形成以「音箱」为重点的产品理解。智能溢价褪色,音效低于同价位专业音箱的智能音箱,自然很难被消费者接纳。
除了产品力不足,手机对智能音箱的降维打击是另一个重要原因。
与各大厂圈地跑马的家居生态不同,手机端App可以兼容各个品牌的智能家居产品,给了用户更多的选择。
同时,智能音箱虽然交互范围上超过遥控器或墙面控制面板,但仍有一定的地理空间限制。
一般来说,客厅是电器相对密集的区域,智能音箱一般位于这里。而当用户躺在卧室因光线过亮无法入眠,想要调低亮度或关闭窗帘,就无法通过与智能音箱的交互实现需求。在这一点上,手机的便携性优势会显得尤为突出。
最后,智能家居生态尚未成型使得智能终端往往并不是用户的刚需。
从2017年智能音箱掀起热潮起算,迄今也仅过去6年时间,远比许多家电的更新周期要短。因此,即便购置了智能音箱,它所能发挥的空间也相对有限。性价比不高导致消费者对其敬而远之。
整体来说,过去智能音箱虽然被寄予厚望,但在技术和用户习惯的双重壁垒下,仍不足以替代手机成为新的用户入口,因此在短暂地辉煌过后便迅速陷入了缓冲期。
数据显示,2022年,国内合计售出智能音箱约2600万台,头部智能音箱销量均不过千万。
智能音箱如何破局?
如前文所言,由于产品力不足,智能音箱的核心前缀「智能」往往被消费者忽视,继而陷入音箱品类的音效之争。
因此,让它重新回到「智能核心」的正轨上来,成为了大厂们需要设法迈过的一道坎。
在商业世界里,「换汤不换药」有时候是一种非常有效的经营策略,尤其有利于打破消费者的习惯性思维。
与其再花心思去更改消费者对智能音箱的固有印象,不如推出一个更加言简意赅的新物种,比如「添添家庭机」。
与智能音箱相比,家庭机给人的直观感受要更明确,很容易就能联想到家庭助手、智能管家。
但事物都是有两面性的,虽然厂商可以通过更名来塑造更直观的印象,但消费者在面对全新物种的购物决策也会更加复杂,比如留意它到底能为生活带来哪些改变,是否有必要等等。
为了支撑这些新故事,未来产业方向可能会产生分化。
一类是像小度一样,通过叠加硬件价值支撑售价。
从产品形态上,添添家庭机给人的第一印象是「智能音箱+平板」。这种形态乍一看并不令人意外,因为小度的智能音箱一贯走的是「智能音箱+屏幕」的路线,这次无非是将屏幕升级成了平板。
但细细琢磨后可以发现,将镶嵌在音箱上的屏幕拆分成可以独立运作的平板,这看似简单的一步,实际上解决了智能终端过去的许多顽疾。比如各大厂智能家居生态不兼容,智能音箱受限于所处空间,用户不能随时随地下达指令。
同时,虽然「添添家庭机」是新物种,但平板和音箱却是日常生活中常见的家庭电器,消费者在进行决策的时候有了横向对比的参照物。
另一类是「打不过就加入」,将智能终端转移到手机这样已经具备用户基础的移动硬件终端上。
如今手机厂商中,华为已经将大模型经云端接入了手机操作系统,率先实现大模型上机。小米则在尝试用手机硬件支撑大模型的运转,目前已经有13B的模型在手机端跑通。
OPPO、VIVO、苹果等手机厂商的大模型也均在研发当中。
客观来说,从现有的各种大模型产品来看,功能性均超越过去的智能音箱,上文提到的两条路都可以给用户带来更好的使用体验。
按照李莹的介绍,家庭机在更自由对话聊天的基础上,拥有了长记忆和角色代入的能力。她举的例子是,如果孩子和家庭机说“我是一只小狗。”家庭机会根据孩子常用它来点播动画片《汪汪立大功》的历史回答「你是汪汪队的吗?」”
除此之外,生成备忘录,规划行程和安排,调控屋内环境等功能也可以在家庭机中实现。
智能音箱致胜的关键,在于创造「第三种交互」
从产品属性来看,手机和智能音箱都有成为智能家居核心的潜力。
手机兼容各种生态,同时具备远程操控能力,可以在回家之前就将各个屋子调节到适宜的氛围里。
智能音箱则具备更强的安全性和隐私性,各电器之间通过局域网或蓝牙技术互通,防止信息泄漏。
那么在大模型时代,手机和智能音箱究竟会是你死我活的互斥关系,还是共同构建生态呢?
财经无忌认为,共同构建生态会是最终答案。理由藏在百度世界大会2023中的一个细节里。
李莹介绍,家庭机具备超级陪伴能力,具体来说就是“你看他的时候,他也会把头转过来看你”。
这意味着,智能音箱除了在语音交互和传统基于操作面板的「动作+视觉」交互之外,有了第三种交互方式。
这种交互方式得以实现,本质上是传感器功能的提升和多模态大模型的能力。
传感器很好理解,智能终端有了感知世界的新方式。
多模态能力指的是,在智能终端里,它可以综合多个传感器提取的数据,将处理后的结果组合起来,得到最终答案。
这些技术更新给智能制造终端带来了质变的契机。
过去,智能终端往往作为服务的被动提供者参与用户的生活,只有用户下达指令了,它才能做出反馈。而第三种交互方式的出现,则让智能终端有了主动参与到用户生活的可能。
比如,可以在老人摔倒或昏迷时自动拨打医院电话、通知子女,根据户主的作息或健康状态给出生活、饮食建议等等
之所以说这是共同构建生态的证据,主要有两个原因。
一是传感器的感知范围的局限性。用简单的话来说,智能核心必须要在能「看见」老人昏迷的空间内,才能发挥出作用。
二是手机体积的限制注定了它不可能像智能终端那样以搭载各种传感器。
当然,通过额外布置传感器,然后将数据集成到手机大模型上也能实现同样的功能。
但家居助手的定位决定了,以全屋智能核心需要具备稳定性,不能像手机一样受信号强弱影响。
在「第三种交互」的加持下,智能音箱的生态位得以更加稳固。但客观来说,目前「第三种交互」放在整个智能音箱品类里都还只是初级阶段,多模态大模型也才刚刚开始打通感知、决策、反馈链条。上述这些场景,还停留在设想当中。
而智能音箱想要真正破局,乃至最后成为消费者所习惯的家庭成员,技术要素固然关键,但更核心的是基于现实的想象力,抓住基于某个场景的用户痛点,点对点突破。
小度「前船长」景鲲的这段话或许是眼下智能音箱的最佳注解,也是从业者最应该秉持的信念:
“虽然从历史的洪流中来看,我们这一代人不一定真正能实现通用人工智能(AGI)。但是如果有那1%改变世界的可能性,我们想去试试。”