云原生平台Rainbond发布v6.9.0,助力企业AI大模型部署
地址、本地路径或直接上传文件来部署自有模型。和密钥,即可在不改变原有开发链路的情况下,无缝对接私有化部署的模型。领域的突破,v6.9.0对虚拟机(VM)的管理能力也进行了深度“加码”。驱动盘挂载功能,确保了在不同虚拟化环境中部署的兼容性。
从模型选型到一键部署 企业AI能力快速落地
不少企业期望进行AI私有化部署,然而却被技术门槛所阻碍。v6.9.0版本将此难题予以直接解决。它内部设置了AI大模型插件, 开启该插件后, 便能够在同一工作空间里达成模型仓库管理, 完成实例创建, 配置API密钥以及进行运行监控。
开发者无需再费尽心思东拼西凑各个不同样式的工具, 平台之中预先设置有常见被使用的模型, 还能够从社区那里调取获取新模型, 甚至于支持凭借HTTP地址或者本地端文件上传自身拥有的模型。此事所表示的是企业已经存在的模型资产可直接迁移至平台内加以使用的情况状态。
vLLM引擎加持 GPU和CPU都能灵活配置
使得众多企业颇为头疼的乃是部署的具体环节之处, v6.9.0在默认状态下选用的是vLLM高性能推理引擎, 针对GPU环境以及CPU环境均给出了详尽的配置选项, 不管是配备高端显卡的服务器, 亦或是普通的CPU服务器设施, 均可寻觅到适宜的部署方案。
这一套方案极大程度地削减了企业搭建私有大模型的难度。从事运维工作的人员无需再对底层推理架构进行深度钻研, 依据平台的引导依照步骤逐一操作便能够达成部署。从进行选型直至上线整个进程来看, 相较于以往而言速度提升了数倍之多。

模型实例管理面板 运维秒变简单
运维人员迎来新福音, 那便是新推出的模型实例管理面板。于此处, 能够实时查看各个实例的运行状态, 详细日志清晰呈现。一旦出现异常状况, 系统会迅速定位引发问题的根源所在。
比如说, 模型响应出现超时的情况, 或者出现GPU内存溢出的状况, 在面板之上都会进行清晰的标注。运维人员无需再手动去翻查数量众多的日志, 几分钟之内便能够完成诊断以及修复。这样一种可视化的管理使得日常维护变得格外轻松。
业务系统无缝对接 不改代码就能用
对于业务方而言, 接入私有化模型这件事也是极为便利的, 平台给出了与OpenAI相兼容的相关API接口, 业务系统仅仅是替换一下base URL以及密钥就能够直接进行调用, 原有的开发链路是完全不需要做出改动的。
这表明, 企业当下所拥有的聊天机器人, 以及智能客服, 还有数据分析等应用, 能够迅速切换到内部进行部署的大模型之上, 数据不会流出企业的内部网络, 其安全性以及响应速度均得到大幅度的提升。
全维度监控 算力流向有迹可循
有一个模块名为监控模块, 它属于v6.9.0, 是其中的又一个亮点之处。它所覆盖的指标范围很广, 包括服务响应质量、GPU设备利用率、内存占用等等, 这些指标在全维度方面都有涉及。它会通过可视化图表的方式, 来展示每一分钱的算力到底花在了哪些地方。
管理者能够清晰地察觉到哪一个模型占据了多少的资源, 哪些特定的时间段负载是最为高的。这些相关的数据对于预算方面的规划以及资源的优化而言是极具帮助作用的。企业则能够依据实际的使用状况, 合理地去分配GPU这一资源。
虚拟机管理加码 支持热扩容和qcow2部署
除了人工智能能力之外, v 6 9 0针对虚拟机管理实施了深度层面的升级, 新版具备支持qcow2镜像直接进行部署的特性, 并且还引入了规格热扩容这一功能, 在虚拟机处于运行状态之时, CPU与内存能够实行无损升级。
功能是多虚拟机应用级编排, 它能让企业把复杂的虚拟机应用进行打包, 使其成为标准安装包, 跨环境恢复以及迁移变得极为简单, 针对特殊用户需求, 还增添了驱动盘挂载功能, 以此确保不同虚拟化环境里的兼容性。
你认为自身的企业最为亟需的究竟是AI私有化部署, 还是虚拟机管理升级? 欢迎于评论区之中分享你所拥有的使用场景, 通过点赞收藏从而让更多的同行能够看见这个优质的工具。