“我在,你说。”天猫精灵的声音对许多人来说,早已熟悉,如今这四个字有了更深远的意义。
5月23日,阿里巴巴旗下人工智能品牌天猫精灵宣布了多项动作。除了推出启用以上四字为全新的品牌slogan之外,还推出了新品X6音箱并官宣了歌手周深为全球代言人。
天猫精灵还将进行品牌焕新,以简洁、现代的“AI”字母组合呈现新形象,以契合其在领域的探索。
5月23日,旗下品牌天猫精灵展示新品天猫精灵X6智能音箱。图片来源:每经记者陈婷摄
资料显示,天猫精灵成立于2017年,其前身是人工智能实验室,截至目前,天猫精灵已经服务超过6300万用户、3500万家庭。
发布会上,天猫精灵市场总监严斌表示,天猫精灵将在产品创新、大模型和智能生态系统打造等方面,不断提升自身技术与研发能力。
天猫精灵业务中心负责人宋刚也对《每日经济新闻》记者表示,智能音箱在早年间就将智能化应用带入了家庭,AIGC来了之后,产品走向更加智能的方向。
过去几年,智能音箱的发展并不顺利。根据洛图科技的数据,2023年中国智能音箱市场销量为2111万台,同比下降19.8%;市场销售额为59.4亿元,同比下降21.0%。
作为最早一批进入千家万户的人工智能硬件产品,智能音箱曾在早期让消费者体会到人工智能带来的乐趣,随着AIGC热潮的到来,这一个行业能否找到新的机会?7岁的天猫精灵,能否踏上新的起点?
可以发现,天猫精灵本次发布的X6音箱以好音质为主打,自称给出了一个“入门级”的定价(369~399元)。
在接受记者采访时,宋刚表示,单价在200元以内的智能音箱销量有所萎缩,“一个积极的信号是500元以上的产品份额在增加,所以智能音箱未来会往更加智能化的入口方向(发展)”。
宋刚同时表示,未来,天猫精灵会在AI技术上深耕下去,“我们也在积极布局更加丰富的生活助手能力,在互动娱乐、智能玩伴、信息助手等方向上我们都会做非常多的尝试,这个赛道实现真正主动智能化还处于早期阶段”。
值得注意的是,在大模型的加持之下,较之以前,这次天猫精灵发布的新品更为“智能”。除了天气服务、时间服务、根据自然人来推荐歌曲等各种常规操作外,新加入了场景音乐的设计。此外,结合夸克搜索的天猫精灵还能提供更加聪慧的百科问答大模型,使其成为了AI小助手,回答更为精准可靠和连贯自然。
在宋刚看来,长期来看,智能音箱朝更智能化发展是大势所趋。这也是高价位的智能销量往上走的主要原因。“智能化需要有大量背后算力和服务的投入,而对于更低端的智能音箱而言,商业闭环是一个问题。”
不过,有数据显示,过去,智能音箱市场已经出现了连续多年的下跌,智能音箱的智能化趋势是否有助于挽救这一局势?
互联网分析师张书乐在接受《每日经济新闻》记者采访时表示,此前制约智能音箱发展的关键,不是智能,而是内容,“家居场景之下,音箱所能提供的内容服务不足,无论是音乐还是学习,整体都只是一个播放器”。
张书乐认为,在大模型助力之下,智能音箱或许会有机会回归到其最早的风口位置,即作为智能家居的枢纽,承担控制从电视机、电灯开关、厨卫设备的人机互动枢纽。不过,他表示,目前,大模型整体能力还都是测试水准,尽管可以让智能音箱不再表现得过分“智障”,但作为强力“遥控器”的底层应用,还需要继续深度学习。
在入口这一定位上,智能音箱的生态还在建设当中。宋刚告诉记者,天猫精灵目前已经接入了1000多家的物联平台以及1600多个品牌,他表示,天猫精灵本身就是一个开放的平台,连接交互、本地化语音等技术都会在开放平台中落地。
他还告诉记者,下一步,天猫精灵会在硬件能力上,尤其是500元以上的中高端档位上逐步突破,智能音箱也面临一些行业技术瓶颈,比如大功率下语音的识别率降低的问题,“这个问题不仅存在于智能音箱,未来作为家庭任何一个语音入口都会面临类似问题。这些关键的底层技术上,我们会去做技术突破”。
与此同时,在智能化方向上,依托于通义大模型以及夸克AI搜索,天猫精灵会持续强化在百科、闲聊、生活助手以及更多元的互动娱乐上的投入。
事实上,随着大模型带来的机会,智能音箱不仅能变得更“聪明”,交互也会变得更为流畅。
宋刚对记者表示,随着生成式AI技术的不断进步与普及,智能音箱领域必将迎来一场革新,在他看来,生成式AI的崛起不仅仅是技术层面的飞跃,更是用户体验与应用场景的一次深刻变革。
宋刚表示,在未来,更为自然的交互会成为可能,所谓的主动的智能,就是会以更带有情感色彩的陪伴方式与用户互动。“语音不会像以前机器人那样冰冷的,它有人设,有情感,有记忆,这种交互方式会是革命性的。”宋刚说。
宋刚透露,交互的对话已经在内测了,在不久的将来,相关产品会迭代升级并落地。
随着更为顺畅智能的交互成为可能,智能音箱也将可能担当更多的角色。有观点认为,智能音箱甚至有机会成为大模型的语音交互入口。以天猫精灵X6为例,其已经搭载了更加聪慧的百科问答大模型,可以担当解答生活里十万个为什么的AI小助手。
据报道,前百度架构师李天华认为,对话是人的本能,新的对线年内会部分或完全替代传统搜索引擎。
艾媒咨询CEO张毅对《每日经济新闻》记者表示,生成式AI的业态形式和20年前的搜索引擎几乎同出一辙,使用场景和适用人群更多还是文字文作者。
张毅表示,智能音箱还是有机会成为大模型的交互入口,“它有便捷性的优势,通过语音进行交互,减少了触摸、文字。与此同时,智能音箱能提供丰富的交互体验。”张毅提到,未来,新的对话搜索助手会成为大模型信息输入的一种重要方式,但更多只是锦上添花,文字交流方式还是主流,所以他认为智能音箱硬件未必会获得市场空间的爆炸式生长。
张书乐也认为,搜索还是要所见即所得,听播的效率太慢,反而是语音或文字输入,搜索给出可见内容,效率更高。
按宋刚的说法,他们希望天猫精灵能从指令执行者,到个性化助理,最终向全感知主动服务的智能管家的角色进行转变。
宋刚透露:“智能音箱只是一个家庭的智能化入口设备,天猫精灵肯定会作为智能化的品牌去赋能更多的硬件设备,对于智能互联的业务而言,7月也会发不同的产品。”
在大模型的加持下,智能音箱大概率能得到更大的机会,当前业内外争论的无非是“这个机会究竟有多大”。
宋刚认为,智能音箱设备比较特殊,除了音箱属性之外还是一个语音交互入口,也是一个人工智能走入家庭的入口,所以天猫精灵在音箱本身的多模态交互上也会做尝试,“音箱的形态会发生变化,往带屏、再往家用助手这些方向发展,会是一个脉络”。