不久前,青云科技发布了云易捷 v5.0 版本。作为专为中小算力规模打造的轻量化超融合产品,云易捷 v5.0 在原有“可靠、简单、智能”的基础上,强化VMware迁移能力与分布式存储运维的易用性,为企业数字化转型提供了更全面、更便捷的支持。
青云科技云易捷产品经理曹振表示,云易捷 v5.0 版本具备多集群管理、存储简单运维、VMware迁移多方案提供,以及AI开发推理平台四大关键特性,能够在VMware国产化替换、人工智能以及边缘计算等应用场景中发挥重要作用。
“自2019年至今,云易捷一共发布了16个版本。可以看出,整个发布周期和频次相对较快。青云科技希望通过这种快速迭代的方式,不断吸收来自业务部门以及终端客户对于产品以及行业场景应用需求的反馈,以此推动产品及解决方案的持续快速交付,让产品更加贴近客户真实的使用情况。”曹振解释道。
助推VMware国产化替换
众所周知,由于博通的收购,VMware的许可成本出现了大幅增长。这一变化使得VMware成为了许多企业和组织的负担,尤其是对于那些依赖VMware进行业务运营的企业来说,这种成本的增长是不可接受的。因此,寻找成本更为合理的国产化替代方案成为了许多企业的首选。
在曹振看来,对于有VMware替换需求的客户来说,主要基于成本效益、技术创新和自主安全可控三方面的考量。在这三个因素的影响下,VMware国产化替换成为了目前行业内广泛探讨和实践的领域。而VMware国产化替换解决方案,不是单纯的虚拟化品牌的替换,它必然是多方案、多场景的选择。
为此,在VMware替换的场景下,云易捷共提供了五个具体方案:一是纯虚拟化替换。提供纯IaaS虚拟化和自研SDN网络;二是超融合产品架构的替换。云易捷在虚拟化的基础上增加了高性能分布式块存储。同时,还在打造可以达到百万级IOPS的全新SDS v5.0架构;三是云易捷容器引擎。在云易捷超融合的基础上,提供“VM+容器”两种资源,满足客户对于微服务架构改造的需求;四是全栈私有云的稳定升级;五是混合云。
“无论是哪一种替换方案都离不开VMware虚拟机迁移这一核心诉求。基于此,云易捷 v5.0 版本通过全新的升级和迭代,能够提供三种迁移能力:一是VMware纳管迁移。能够将VMware集群的资源纳管到云易捷的集群当中,并且在纳管完成后提供相应的迁移能力;二是NFS离线迁移。能够直接将vNAS虚拟机中的文件数据迁移到云易捷集群中,简化操作流程,提高迁移效率;三是在线热迁移。在不关机或者在业务不停机的情况下,将VMware虚拟机迁移到云易捷平台。除此之外,云易捷 v5.0 还提供了一些其他补充功能,如角色权限管理、资源配额管理、安装部署优化、HTTPS一键改造、虚拟机快照和大页内存等。”曹振进一步说道。
构建AI开发推理平台
随着大模型的爆发式增长,人工智能(AI)应用已经逐渐渗透到各行各业。从金融、医疗到零售、制造、娱乐,AI已经成为这些行业的重要助手,让这些行业变得更加高效和智能。
曹振表示,目前来看,大模型的应用方向主要呈现出三种形式:一是Meta、谷歌、阿里、百度等企业推出基础通用大模型;二是基于通用大模型,打造行业大模型和垂类大模型;三是通过调用大模型服务,加速AI应用开发。“青云科技的企业愿景是‘云之基石,自由计算’,此次发布的云易捷 v5.0 版本将致力于构建AI开发推理平台,服务好各类AI应用。”曹振如是说。
据了解,在AI开发推理平台上,除了模型部署、任务调度、训练任务等常规功能之外,还具备几大核心能力:
一是多元基础设施的整合。通过提供异构算力的统一管理服务,可以实现对英伟达、国产GPU/NPU等算力设备的兼容。同时,还能提供包括对象存储、第三方并行文件存储等在内的多样化存储服务。此外,通过评估分析各类硬件资源在节点负载、GPU利用率、功耗等方面的使用情况,可以实现设备资源的可视化管理。
二是AI数据资产管理。AI开发推理平台不仅能够统一管理数据集、模型、算法、镜像等企业AI数据资产,还能通过访问权限控制保证企业AI数据访问的安全性。
三是AI服务中台。AI开发推理平台通过内置Notebook、VsCode、pySpark等开发环境,可以提供交互式建模和数据分析能力。同时,通过内置DeepSpeed、Ray、colossal-ai等成熟的AI训练和推理框架,以及LLaMa-Fatory、Megatron等框架,能够支持LLaMa 3、Qwen以及ChatGLM等行业主流大模型。此外,在创建调优任务时,也能够通过页面操作方式设置像Pre-traning、SFT、RM以及PPO、DPO和ORPO等多种方法,从而有效提升AI模型训练以及AI应用开发的效率。
实现边缘场景下的多集群统一管理
在智慧城市建设中,需要对散布在各个城市角落的交通信号灯、监控摄像头、充电桩等进行智能化管理,从而优化交通流量,提高利用效率。尽管这能够提高交通系统的效率、安全性和便捷性,但从IT运维的视角来看,在这样一个边缘场景下,可能存在以下难题:一是由于异构设备众多,设备之间的兼容性以及数据交互格式将面临极大挑战,异构设备的统一管理难以实现;二是网络稳定性无法保障。大规模边端设备之间的数据传输容易造成网络传输不稳定,从而导致设备之间的双向通信困难,对城市的交通管理产生较大干扰。
曹振表示,针对以上难题,云易捷 v5.0 提供了多集群管理组件,可以将分布在不同地点、区域的数据中心进行统一管理,并通过中央控制集群实现对多个集群的监控和管理,降低运维的复杂性和成本。
进一步来看,云易捷 v5.0在多集群管理中主要有以下几大亮点:一是跨区域管理。只要网络触达,可以不限区域、不限地点,完成多个数据中心集群的统一管理。二是降低资源开销。多集群组件是运行在管理节点上的进程服务,对CPU、内存、存储等资源的消耗可忽略不计。三是不限版本、不限架构。不受限云易捷集群版本以及底层物理节点的芯片架构,只要网络互通,均可实现集群的统一管理。
“在实现整体管控的情况下,云易捷 v5.0还能形成总部到分部的自动化管理。总部作为管控端,可以将更新完成后的一些镜像,自动下发到每一个边缘集群,有效避免网络延迟问题。同时,整个多集群管理组件的部署是分钟级的,从点击安装开始到最终用户看到管理组件页面,一分钟内就可完成。此外,云易捷 v5.0还对边缘集群的存储功能进行了较大优化。升级之后,无论是单节点还是整个集群,抑或是机房宕机、断网,边缘集群都能够自动恢复,减少人员干预。”曹振强调。