AI手机的iPhone时刻
前不久,联发科正式推出新一代旗舰5G智慧体AI芯片天玑9400。发布没多久,它就成为了2024年旗舰手机芯片的标杆,并且会应用在即将上市的vivo手机上。
在这块芯片强大性能的支持下,手机的AI算力显著提升,AI功能丰富多样,带来用户体验的更多可能性。
将大模型装进手机并且流畅运行,AI离我们越来越近了。但无法忽视的一件事是,受限于大模型对算力资源的需求,目前各家手机厂商的手机AI进化之路,几乎都是建立在芯片的能力突破这一前提下。也就是说,脱离高算力的芯片,手机无法达到同等程度的AI升级。
我们不禁要问,米OV们在手机的AI突破上展现出真本事,是否只能依赖高算力芯片?在手机上运行更复杂的大模型,搭载天玑9400这样的芯片是唯一路径吗?
另一条路:算力竞赛算法优化
从设备的算力竞赛转到大模型的算法优化,RockAI一直坚持一条不一样的道路,以通用的端侧大模型去适配不同算力的终端设备,无需裁剪,无损部署,最大程度保证AI功能的完整呈现。
1.全新架构
非Transformer架构 类脑激活机制
当前市场上主流大模型普遍采用Transformer架构、Attention机制,对算力的要求非常高,这也是厂商升级芯片、设备的主要原因之一。许多业界人士提出AI的发展路线不应局限于Transformer架构,开发成本、计算资源、终端响应速度等因素倒逼大模型的革新。
在“高算力才能负载大模型”中寻找突破点,RockAI从底层神经网络着手,自研Yan架构大模型,以MCSD(Multi-channel slope and decay)架构替代Transformer的Attention机制,并实现类脑分区激活,大大减少了计算复杂度和算力消耗。
2.全线适配
真端侧 真无损 0压0裁
本地部署 隐私安全
今年7月的WAIC大会上,未经压缩裁剪的Yan1.2,能跑通算力不到普通家用笔记本的1/8、且低于绝大多数智能手机的树莓派5,说明Yan架构大模型已经具备部署在大多数设备上的能力。
RockAI最新发布的Yan1.3群体智能单元大模型,作为一个3B 参数的多模态大模型,能够处理文本、语音、视觉等多模态信息,可在主流消费级CPU等端侧设备上无损运行,且综合性能已经超越了Llama3。
与昂贵旗舰芯才有良好体验的大模型,或经过压缩量化性能有损的大模型相比,Yan1.3是更具普适性、高中低端设备轻松驾驭的“满血”端侧大模型。
目前,Yan1.3已经实现了手机、PC、无人机、机器人等设备的本地部署,从低算力到高算力,从消费级到工业级,让智能不受限。
人工智能为人类带来前所未有的便利,也引发了不容忽视的安全风险。无论个人还是企业,对数据安全和隐私保护的诉求日益提升。在本地部署的Yan1.3,天然具有保护隐私的优势。以手机、PC为例,一方面可以在本地处理用户数据,将数据保留在终端上,避免重要资料、个人信息的外泄,另一方面也减少了对网络传输的依赖,可以满足高铁办公、离线会议总结等网络状况不佳或断网场景下的需求,让用户感受到AI的便利。
在本地运算的端侧大模型不依赖网络传输,意味着响应速度更快,可以直接在终端设备上进行智能化决策,是交互效率提升的理想选择。凭借出色的架构设计和多模态处理能力,Yan1.3能够实现设备上的高效运行,在CPU上秒级响应,GPU上更是百毫秒级实时处理,超强模力让不同终端的交互体验十分丝滑。
3.群体智能
自主学习 持续进化
强交互 高协同
RockAI认为群体智能才是通往人工智能的最终路径,而实现群体智能包括四个发展阶段:创新性基础架构、多元化硬件生态、自适应智能进化、协同化群体智能。随着Yan 1.3成功在多元设备端部署,RockAI已经完成了第二阶段,为打通智能生态创造条件。
从生物的群体智能源起,机器的群体智能以一个个智能单元的协同、交互激发群体的智慧。Yan架构大模型作为RockAI面向机器的群体智能单元大模型,不只是为了提升单个设备的能力,更是为机器注入新的智能基因,让世界上每一台设备拥有自己的智能。
它们或许外观不同、功能不同、适用场景不同,当智能体间的交互壁垒被打破,可以像人类一样交流协作,释放出超越个体的能力,形成群体智能系统,掀开群体智能的新篇章。
创新>follow
在AI渗透到各行各业的今天,或许我们更需要思考,为什么出发以及怎样前进?
为了AI而AI,还是从人本主义出发普惠大众?
独立思考持续创新,还是follow?
RockAI不断探索人工智能的出发点是,AI普惠。当下,还有更大多数值得我们关注,我们期待,通过另辟蹊径,在实现商业价值的同时,最大程度实现社会价值,为AI普惠贡献力量。