AI应用
数字生命改变未来生活
恒联人工智能训练平台
Artificial intelligence training platform
恒联人工智能训练平台
发挥GPU优秀的并行计算能力,使用容器可以快速获得需要的应用环境,是目前推荐的深度学习与数据科学开展研究的方式。它便于资源的分配与调度,优化异构资源调度:提供弹性、高效、细粒度(支持GPU共享)、简化异构资源管理复杂性;提升可观测性和使用效率, 可移植、可组装、可重现的AI流程;可加载多种深度学习预训练模型模块,预安装pytorch、tensoflow等深度学习框架与相关计算库。

随着人工智能与边缘计算的发展,各种数据科学的应用落地,在在线教育行业中部署相关的服务去支持业务开展已成为大势所趋——深度学习下的图像识别、NLP等技术给行业带来新发展空间。

数据规模在不断增长,使用公有云部署业务是一种便捷的模式。但越来越多企业用户发现,大规模使用公有云基础及其深度学习API服务,已成为每年开支中的大头。混合云部署的模式业务的模式可能成为更合理的选择,把部分重要业务部署在企业私有云中,不仅可获得对业务与数据安全的全面控制,据第三方测评,对中小型规模集群、私有部署甚至可能降低高达70%的运维服务费用。把部分业务私有部署,已成为在线教育行业中稳健的选择。

在混合云部署中,云原生计算成为先行崛起的理念。云原生计算依靠资源云化(虚拟化),应用云化(标准化、自动化、可拓展、高可用),云原生(互联网规模、敏捷,弹性)的优势,逐渐成为人工智能深度学习、数据科学等应用及服务的载体。
01 One
全面的集群监控管理,实时掌握CPU/GPU
资源使用情况及运行状态
可实时监控平台内服务器、虚拟机、容器的使用情况,合理安排训练任务与应用业务,提高集群可靠性与资源利用率。
02 Two
持深度学习任务调度功能,便于管理
内置多种计算框架:的pytorch、tensorflow、cntk等深度学习框架与相关计算库;支持多种深度学习模型:YOLO/BERT/GPT-2/Googlenet/Resnet等
03 Three
支持计算性能测试
提供对不同深度学习模型的gpu计算性能基准测试
04 Four
支持加载深度学习预训练模型
全部经过真实应用场景的有效验证,提供用户快速开展应用工程的可能
05 Five
提供容器服务,快速构建深度学习计算环境与业务流程
人工智能训练平台使用主流容器编排工具kubernetes搭建容器集群,并提供RBAC控制,容器及服务的生命周期管理和资源分配
06 Six
定制化的应用商店
可为多用户提供公开或用户定制的深度学习应用快速部署
07 Seven
定制化的私有容器镜像仓库
可为多用户提供研究用户的容器镜像
08 Eight
方便结合CI/CD工具
如Jenkins,Rancher pipline
QQ
返回顶部