近一年来,我们见证了生成式AI的创新活力和应用潜力,也看到日益突出的用户问题:云端大模型输入服务成本高,用户对生成内容的多样化需求难以被紧凑的键盘界面满足,通用模型难以解决用户垂域沟通场景的体验问题。面对一系列的新问题,讯飞输入法在2024科大讯飞全球1024开发者节上重磅发布14.0,用AI重塑表达,给出自己的答案。
随着AI飞速发展,特别是大模型的最新进展,让产品创新有了更丰富的现实意义。2024年以来,全球厂商积极探索端侧大模型应用,并以此作为增长新引擎。纵观“端侧生成式AI新时代”,大模型小型化和端侧化逐渐成为行业趋势,端侧设备的AI算力拥有跨越式提升,各行业App围绕垂域需求打造微调模型和体验。在此背景下,讯飞输入法发布14.0,用生成式AI打造“每个人的AI输入”,再次改变我们的输入,赋能我们的表达!
“讯飞星火端侧输入大模型”发布
10月24日,讯飞输入法发布“讯飞星火端侧输入大模型”,通过端侧大模型赋能拼音语音,让AI输入触达更多用户。讯飞输入法业务部总经理程坤介绍,讯飞星火端侧输入大模型AI输入增强,能根据上下文离线预测用户输入结果。
讯飞输入法14.0内置AI增强整句联想、AI增强整句预测、AI增强联想,实现从词级输入到句级输入的效果突破;通过大模型的泛化能力,使离线语音识别率基本持平云端效果,让用户随时随地享受高准确率的语音输入体验。
值得一提的是,讯飞输入法14.0采用全新的AI插件化引擎构架,具有“灵活拓展”、“广泛覆盖”、“智能融合”的特性。这意味着,讯飞输入法能够支持多种结构、多种尺寸的AI模型,体现“即插即用”的理念;同时,做到与不同性能设备的高度匹配,让更多用户用上端侧AI能力;此外,支持多模型融合来优化输入结果,让更多用户享受AI带来的输入效果提升。从目前技术发展看,讯飞星火端侧输入大模型的能力仍在持续进化,讯飞输入法正全力以赴推进新AI能力的落地。
“讯飞星火语音大模型”赋能
面向未来的AI是什么模样?首先要识别人类的语言,机器才能理解和执行复杂任务。早在2010年,讯飞输入法开创中文语音输入。十四年来,讯飞输入法持续深耕语音交互领域,不断满足用户新生需求。无独有偶,2024年OpenAI、Google发布了GPT-4o、Gemini Live,两款大模型均集成了强大的语音识别,再次印证语音在人机交互中的关键地位。
讯飞输入法14.0接入了讯飞星火语音大模型,即将把方言语音识别种类扩充到202种,覆盖288座城市,同时将方言识别准确率提升30%,使方言语音输入覆盖更广,识别更准。有理由相信,AI增强的方言语音输入不仅是交互体验的必然趋势,更是人类与机器建立更深层连接的桥梁。
“活力视界2.0”焕新
此次,讯飞输入法14.0的活力视界2.0全面焕新,视觉升级唤醒“活力”。卡片化设计,触发信息活力,让信息呈现更加灵动便捷;动效加持,进一步激发屏幕的生命力,“活化”整个界面;个性化皮肤,提升体验活力,彰显用户独特的品味与风格。
在当下个性化表达的时代,输入法皮肤扩充了键盘表达的“新玩法”,为广大用户带来视觉与交互的双重享受。日前,讯飞输入法携手机械键盘奠基者CHERRY为广大1024er定制“PIXIU 75貔貅键盘”联名款皮肤,“刷新”用户指尖体验,激发表达灵感,提升输入愉悦度。接下来,讯飞输入法还将与各行各业合作伙伴一起,不断构筑键盘内容生态。
“AI助手”全新升级
程坤表示,讯飞输入法很早就设计了“助手”功能,并通过洞察用户需求不断打磨优化,甚至还在玩法层面做了深入的思考。2023年,基于通用的大模型赋能AI助手,显著提升助手用户渗透率和助手生成内容点赞率。我们在想,如何更好地释放大模型的潜能,把AI助手的使用场景做得更全、服务人群更广、体验更有趣。
讯飞输入法14.0全新升级“AI助手小蓝”,从底层到顶层进行了重构,希望打造成为“每个人的AI助手”。这一次,“蜕变”的AI助手与输入服务的融合进一步加深。
以高情商沟通为例,基于通用大模型底座训练出“高情商大模型”,又拆解不同人群,赋予不同风格,使得覆盖更全面的场景,让生成内容更有效,让沟通表达更高效;我们还发现很多用户拥有高频的需求,如恋爱表达。我们沿着这条路径在模型上进行细化调参,面对他们推出了“恋爱军师”,能够分阶段、分性别、分需求定制话术。这样一来,搭载个性化引擎,为不同用户提供更多元、更深入、更个性的服务,让沟通表达更个性;同时,我们开放生态助力玩法创新,通过UGC+PGC共创个性化的助手生态,让沟通表达更有趣味。日前,我们发起了“AI人设创作大赛”,0代码即可打造专属人设。
当下,AI不断突破,让每个人的表达、整个社会的信息获取更高效。此次讯飞输入法14.0全新发布,坚持用户需求导向,推动多维度AI重构,一步一步脚踏实地打造普惠“每个人的AI输入”。