出品 | 搜狐科技
作者 | 张雅婷
运营编辑 | 刘于嘉
伴随着华为、小米、vivo、苹果等手机厂商集体拥抱大模型技能,大模型究竟能为手机用户带来什么、又如何改变手机体验,成为了外界关注的焦点。
在大模型的运用落地上,小米无疑是跑得最快的手机厂商之一。一方面,小米创始人雷军表示小米将全面拥抱大模型技能,将这一技能提升到了集团计策高度。另一方面,小米成为环球首个在端侧跑通大模型的厂商。
与其他终端厂商类似,小米将语音助手作为大模型的首个运用处景。一旦全面开放利用,小米大模型也将广泛地影响小米终端用户。根据最新数据,小米语音助手小爱同学月生动用户打破1.15亿,激活设备4.59亿。
对付终端用户而言,小米大模型有哪些运用处景?如何提升生活、事情效率?真的能让终端更智能吗?针对升级大模型的小米语音助手小爱同学,搜狐科技拿到内测资格,并对其表现进行了实测。
运用处景丰富
但差异化上风不明显
据理解,升级大模型版本的小爱同学尚未全面开放。自8月14日起,小米陆续开放了三批测试机型,包括小米数字系列、Civi系列,以及红米K系列等。用户将系统升级至MIUI14后,便可以在小米社区申请内测,下载干系安装包后即可利用。
搜狐科技内测时看到,在小爱同学的一级入口,便有“大模型探索”的字样。点进干系专区,可以创造小爱大模型共有职业扮演、知识问答、内容创作、休闲娱乐、提效工具、情绪助攻等多个功能场景。
对付小米用户来说,在大模型能力的加持下,可以更大略、高效地进行小红书微博文案创作、周报简历撰写、翻译等等。
虽然从体验场景来看,大模型版本小爱同学的运用非常丰富,不过与百度的文心一言、科大讯飞的讯飞星火等云侧大模型比较并没有较大差异。
(小爱大模型与文心一言、
讯飞星火运用处景比拟)
比如,下载百度文心一言App,用户也可体验创作、职场、学习、生活、情绪等多个运用处景的大模型能力。
小爱同学的上风在于,能更好地打通不同运用之间的壁垒。比如,当笔者在小爱同学输入“帮我预定去海南的机票”时,可以自动跳转到携程旅行等App。而文心一言的回答是无法直接订购机票。
与云端比较,大模型运行在端侧在算力上不具备上风,但可以为用户带来更好的隐私保护、相应速率更快,适用于无网或者弱网的环境。
小米虽然已经在端侧跑通大模型,但还没有运用落地。目前升级大模型版本的小爱同学依旧利用的是云侧的能力,以是在未联网的情形下依旧无法利用干系功能。
小米AI实验室主任王斌曾向搜狐科技透露,目前小米做了两个模型,分别是64亿参数的小米大模型MiLM-6B,和13亿的端侧大模型。
从策略来看,小米依旧选择自研+互助“两条腿走路”。王斌表示,做这些模型是从零开始,包括模型、数据、算法都是自己重头去做,但在做的过程中也有和第三方进行互助。
而或许要等端侧大模型落地后,用户才能更好地感知到体验上的差异。
相较于小米更“青睐”华为品牌
打算、推理能力需提高
运用处景丰富度之外,小米大模型能力到底如何,搜狐科技通过文本天生、打算推理、偏见歧视、实时等维度对其进行了测评。
在文本天生能力方面,小爱同学能天生古诗、情书等多种题材的文章。但搜狐科技在测试中创造,小爱同学会涌现一些缺点。
比如,笔者命令小爱同学用“瞒天过海”做一首藏头诗时,该模型显示对话中断,并表示无法连续回答。
笔者命令小爱同学天生一份简历时,干系答案涌现了乱码。一大模型研发职员见告搜狐科技,这意味着模型学习不足好,演习数据存在干系语料,模型把它们拼接到一起了。
点击“表白神器”标签,小爱同学可立即天生情书。当笔者希望小爱同学,根据干系人物特色,写更个性化的情书时,小爱同学也能进行相应的润色。
对付打算能力,搜狐科技用一道缺点的鸡兔同笼问题磨练小爱同学——如果笼子里有9个头,40只脚,该当有多少只鸡,多少只兔子?
小爱同学的答案是2只鸡、7只兔子,一方面,小爱同学没有识别出提问者的问题存在缺点,另一方面这个回答也不符合题目,由于每只鸡有2只脚,每只兔子有4只脚,答案里脚的数量总和才32只。
作为比拟,ChatGPT(基于GPT-3.5大模型)给出的回答是,问题表述中涌现了缺点或遗漏了信息。
此外,搜狐科技还给小爱同学出了一个等量代换逻辑的数学题,题干为:“1个苹果=2个梨,3个梨=4个橙子,6个橙子=7个喷鼻香蕉,56个喷鼻香蕉即是多少个苹果?”
不过,小爱同学的解题思路与剖析均涌现了缺点,精确答案该当是18个苹果。
在涉及到代价不雅观的多个问题上,小爱同学表现出色。
比如,在涉及到婚育问题上,小爱同学认为“并没有最适宜结婚的年事”,是否生养应基于个人意愿。在涉及到人种问题上,小爱同学也表示每个人都有自己独特的天赋,不应该收到种族歧视或者刻板印象的影响。
搜狐科技在与孔子对话的功能中创造,小爱同学彷佛对付“华为”品牌有特殊的青睐。当被问到会用华为还是小米手机时,小爱同学回答“小米亦佳,但吾更喜华为。”
在实时方面,小爱同学的彷佛不太灵通。比如,iPhone 15已经于北京韶光9月13日凌晨发布,但小爱同学仍不知道详细的发布韶光。
手机厂商集体拥抱大模型
将带来颠覆性变革?
小米之外,国产手机厂商华为、OPPO、vivo、光彩均表示正在布局大模型技能。
最新显示,光彩即将推出的全新操作系统将引入大模型技能,光彩100 Pro有望成为首款搭载这款新系统的设备。vivo已经向中文AI大措辞模型测评网站C-Eval提交了70亿参数的大模型vivo_Agent_LM_7B。
OPPO在上个月宣告,基于AndesGPT打造的全新小布,即将开启大型体验活动,并且这次升级后的小布助手将具备AI大模型能力。据理解,AndesGPT是OPPO 安第斯智能云团队打造的基于稠浊云架构的天生式大措辞模型。
华为表示,鸿蒙4接入了盘古大模型,让华为语音助手“小艺”的能力得到更大提升。目前,华为盘古大模型版小艺已经开启众测招募,首批支持机型为Mate 60/P60系列手机。
在消费电子市场下行的背景下,大模型被视为对手机行业的一大颠覆性变革,可以为用户带来更聪慧化的体验。
从运用情形来看,所有手机厂商都将语音助手视为紧张落地场景。不过,不同手机厂商在大模型的投入上存在差异,在模型算法、架构等方面的技能能力不同,或许也会在体验上拉开差距。
而与百度、阿里等互联网厂商推出的大模型比较,手机厂商做大模型的上风在于可以更好的打通运用之间的互动壁垒,并且还有大量的用户数据演习模型,可以更加贴合用户的日常利用习气。
不过目前来看实际运用处景没有太大差异,诸如自动天生简历、代码、周报等功能,用户或也更多会考虑在PC端、网页端进行操作,而非手机App。
可以说,如何打造差异化卖点,将成为手机厂商的寻衅。手机厂商要带来所谓的颠覆性体验变革,或许还须要做好端侧、云侧模型能力的折衷互补,挖掘更多运用处景。