跟着夺权风云尘埃落定,OpenAI逐步重回正轨。近来,其面向一切用户免费敞开ChatGPT Voice(可供语音谈天),OpenAI前总裁Greg Brockman随后标明:“测验一下,彻底改变ChatGPT体会”。此前OpenAI于9月推出了依据ChatGPT的文本转语音功用,运用神经网络模型从文本生成相似人类的语音。该功用此前仅面向ChatGPT Plus订阅用户供给,现在向一切免费用户推出。
与此同时,虽然Siri作为苹果产品的智能语音帮手从前引领了潮流,让人们看到了经过语音操控设备的或许性,但跟着时刻的推移,它的影响力逐步削弱,乃至陷入了落后的现状。可是,跟着竞赛对手的兴起和技能的不断进步,Siri的缺少逐步显现出来。
跟着大模型赋能下更智能、更天然的人机交互体会呈现,国产手机品牌也开端重视并运用大模型技能,以进步其产品的用户体会,进一步竞赛市场份额。
全国苦 Siri 久矣
Siri作为苹果产品的智能语音帮手,在某些方面的确体现得不行抱负。首要,Siri的语音辨认才能还有待进步。在某些情况下,Siri或许会无法精确地辨认用户的语音,导致用户无法得到他们想要的信息或服务。其次,Siri的了解才能也有限。虽然Siri能够答复一些常见的问题,但关于一些杂乱的问题或许一些不常用的词汇,Siri或许无法了解。这或许会让用户感到无助和困惑。
别的,Siri的用户体会也有待改进。有时分,Siri的反应速度或许会很慢,或许在用户需求的时分无法供给协助。这或许会让用户感到不方便和不耐烦。虽然Siri能够依据用户的喜爱和习气进行学习,但其在一些方面依然无法供给高度特性化的服务,无法满意用户关于更高等级的智能帮手的需求。
跟着OpenAI的ChatGPT语音功用现在可供一切免费用户运用的音讯,用户能够抛弃Siri作为iPhone上的首要语音助理——特别是在iPhone 15 Pro系列上。 该系列手机装备了新的操作按钮,该按钮替代了iPhone初次露脸以来一向坐落iPhone上的静音按钮。
经过新的设置菜单,用户能够将按钮转向除静音以外的其他用处——翻开相机、手电筒,录制语音备忘录……或许,变成ChatGPT的触发器。鉴于人工智能谈天机器人在许多日常查询中的实用性以及Siri缺少的才能,增加ChatGPT的语音支撑现已是许多海外用户心照不宣的行为。

国产手机品牌齐发力
以GPT为代表的大模型的开展,不只席卷了AI工业,还为硬件的智能化供给了新思路。一方面,大模型能够进步手机的语音辨认才能。传统的语音辨认技能现已无法满意用户的需求,而大模型技能的运用则能够大大进步语音辨认的精确性和稳定性。这关于用户来说是非常重要的,尤其是关于那些需求频频运用语音输入的用户来说。
另一方面,大模型还能够进步手机的了解才能。经过运用大模型技能,手机能够更好地了解用户的目的和需求,然后供给愈加特性化和高效的服务。这关于用户体会的进步也是非常重要的。
华为终端BG AI与智能全场景业务部总裁贾永利指出,大言语模型具有泛化才能,能够帮帮手机智能帮手进步了解才能。别的,大模型Plug-in的插件才能,能够在手机内部打通各运用之间的壁垒,凭借东西拓宽才能。
在华为盘古L0基座大模型的基础上,华为针对终端顾客场景构建了很多的场景数据与精调模型后的L1层对话模型,并将该模型用在了语音帮手“小艺”中。全新的小艺在今年夏天的华为开发者大会上正式露脸。
依据大模型,小艺的才智体会迎来晋级,完结了依据天然言语了解的设备操控、本机数字内容查找、对话辨认屏幕内容;协助用户快速摘要、案牍内容辅佐、图片二次创造;完结了随口说随时记、交心的组合服务主张提示等。跟着更长时刻的运用,小艺也会经过不断学习,成为了解用户特性、偏好、习气的日常帮手。而这些新体会,往后也将进一步扩展至华为的产品生态中。

11月16日,在2023 OPPO开发者大会上,OPPO正式推出安第斯大模型(AndesGPT),并接入最新发布的操作体系ColorOS 14上。OPPO方面介绍称,在AndesGPT加持下,OPPO手机帮手“小布”能完结愈加天然流通的对话,以及供给对话式内容创造、日程办理与通话摘要等服务。
OPPO还标明,2022 年发布的潘塔纳尔体系全面商用,此次将在ColorOS 14上与AndesGPT深度协作。这一体系有望供给更多元化的泛在服务,即依据地址、时刻、事情、习气,在通勤、打车、外卖、差旅等高频场景中供给服务。以国内游为例,当辨认到用户购买旅游地机票、火车票后,ColorOS会在用户授权情况下,经过自动感知方位,自动智能推送城市玩耍榜单卡片,以及引荐相关酒店住宿。
11月1日,2023 vivo开发者大会期间,vivo正式发布自研蓝心大模型Blue LM。该大模型经过大参数AI算力的端侧布置与云端服务,将全面掩盖中心运用场景。其蓝心小V才智助理功用,将供给超能语义查找、超能问答、超能写作、超能创图和超感才智交互五大体会。vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围标明,希望端侧大模型能成为用户的贴身助理。
荣耀 CEO 赵明则很早就强调了大模型端侧布置的趋势和重要性,在6月上海举办的MWC 2023上他指出,手机端侧的个人大模型是未来探究方向。
天风证券也指出,C端AI运用落地阶段场景重要性凸显,谈天机器人、AI伴侣和内容生产东西场景最早落地,这些场景中的AI运用开发速度和商业化开展或超预期。
机会与应战并存
DeepMind联合创始人Mustafa Suleyman此前受访时标明,现阶段的生成式AI仅仅一个过渡性的技能阶段,接下来将进入交互式AI年代,AI将依据用户的不同使命需求,组织其他软件和或联络真人来完结作业。
他以为,第一波AI浪潮首要聚集于分类。深度学习标明,人类可练习AI,对图画、视频、音频、言语等输入数据分类。现在人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将归于“交互式AI”,“对话才是未来的交互界面”,用户不只仅是点击按钮和键入文字,而是与AI直接对话,到时交互式AI将能自主采纳举动。

毋庸置疑,未来的手机语音帮手将愈加智能化和特性化,经过与用户的对话和交互,供给愈加更精准的主张和服务。可是,因为生成式 AI 和交互式AI需求处理很多的对话数据和实时数据,因而需求更高效的数据处理和存储才能来支撑这种交互。这关于手机语音帮手的功能和技能要求将是一个巨大的应战。
别的,生成式 AI 和交互式AI“呼喊”更强壮的安全性和隐私维护才能。因为二者需求很多搜集和处理用户的对话数据,因而需求手机厂商和技能供给商加强数据安全和隐私维护的办法,以保证用户的数据安全和隐私不受侵略。
总归,跟着AI技能的进一步开展,手机语音帮手将面对新的革新。为了迎候这些利好,手机厂商需求不断进步技能水平和立异才能,以应对技能剧变带来的相关问题,并满意用户的需求和希望。