火山引擎弹性计算高级产品经理苏楠发表了题为《火山引擎弹性计算云上实践》的演讲。他介绍了字节跳动弹性计算的实践经验,并发布了多款计算产品。
火山引擎弹性计算孵化于字节内部实践,具备以下几个优势:
- 大规模:规模化采购降低了生产成本,与供应商深度定制合作,最终可以回馈给用户更高性价比和更优质的产品;
- 弹性:包括快速启动、灵活调度等方面,2021年抖音央视春晚活动中,以分钟级别调度数千台服务器的能力,保证观众顺利抢到红包;
- 全栈自研:IaaS相关软硬件全栈自研,经过长期内部生产验证,坚持自主可控,包括自研服务器、自研DPU卡、自研虚拟化、定制RDMA、自研vSwitch等。
产品方面发布了8款实例,其中3款具有代表性的是:
- GPU异构计算代表了弹性计算的广度。字节跳动内部有数万卡的规模和多种应用,首发GPU实例主推NVDIA A100/V100/A30/T4卡,覆盖推理、训练、超算、可视化渲染等场景;
- HPC高性能计算代表了弹性计算的深度。火山引擎拥有800G RoCE网络超大规模A100超算集群,在分布式训练场景下打破网络瓶颈,通过RDMA网络做到微秒级别超低时延,大幅提升线性加速比。
- 裸金属兼具了物理机的安全与性能,又满足近似ECS的灵活性。其灵魂所在是自研DPU卡,主要有三个特点:专属硬件加速打造极致性能、硬件卸载释放服务器全部算力、自研Hypervisor深度适配云原生。
同时还发布了火山引擎专属云:专属云是公有云的另一种形态,可以在软硬件和运维等方面保持和公有云一致性的体验。
轻舟智航联合创始人、CEO于骞则分享了弹性计算产品在无人驾驶场景中的应用实践。轻舟智航(QCraft)是一家无人驾驶通用方案公司,在中国多个城市落地了龙舟系列无人驾驶车。
演讲中,于骞分享了轻舟智航使用火山引擎底层云平台,构建自动驾驶研发和测试闭环,极大提升研发效率的实践经验,并表示未来将与火山引擎一起将这些能力产品化,开放给更多的行业伙伴,更快地推动智能汽车规模化应用。更多阅读:超大规模云原生对象存储 TOS 架构与实践
更多阅读: