2025年7月云计算产品迭代说明:AIHC、BCC、CCE多模块功能更新
引言
2025年7月,百度智能云多条产品线迎来功能更新,覆盖AIHC异构计算平台、BCC云服务器、BCM云监控、BLS日志服务和CCE容器引擎。本次迭代聚焦模型训练、资源运维、服务监控和容器管理,帮助用户获得更灵活的模型选择、更高效的资源管理和更完善的可观测能力。
AIHC异构计算平台:新增模型与训练管理优化
本期新增ERNIE-4.5、π0和Llama-3.1-Nemotron等多款主流模型,支持快速部署,满足多样化推理和训练需求。分布式训练任务功能增强,新增NVIDIA GROOT N1.5训练模板,扩展算力配置;支持最长运行时长设置、多任务TensorBoard对比、对象存储BOS挂载及BLS日志接入(赠送60天),便于训练过程记录与对比分析。
资源管理方面,新增节点批量封锁、解锁、迁移集群和备注编辑,优化物理队列筛选和节点列表字段展示,降低运维时间。权限体系接入Cprom与AIHCAssetFullControl策略,便于企业精细化管控资源访问权限。
在线服务新增服务维度资源与性能监控,支持查看实例事件、按状态筛选服务,提升部署可观测性。托管资源池支持全局配置、节点时间线展示、ssh与IP信息可见,并提供CCR镜像免密拉取,让调试和交付更加便捷。
BCC云服务器:试用体验优化
新增七天无理由退款支持,适用于新购包年包月实例的当月订单,帮助用户低成本验证业务适配性,降低试用风险。
BCM云监控:引入LLM应用性能观测
新增LLM应用性能监控功能,支持调用链路分析、服务拓扑展示和调用统计,覆盖大模型应用的关键环节,方便用户对推理性能进行全链路观测和优化。
BLS日志服务:日志概览与告警一站式查看
本期新增日志概览入口,用户可快速查看日志用量和未恢复报警,并通过快捷接入入口集中管理日志资源,提升运维效率。
CCE容器引擎:负载可用性与管理能力提升
支持数据卷持久化和健康检查配置,包含存活、就绪、启动探测,帮助用户实时掌握负载状态。新增表单化管理Service资源、节点缩容保护和自定义驱动版本安装,防止因误操作导致业务中断。Prometheus监控新增Slack告警通知,支持Webhook接入并关联高性能应用服务HPAS指标查看,实现更全面的云服务监控。
收束
通过本次迭代,用户可以在模型训练、资源运维、日志监控和容器管理上获得更高的可见性和操作便利,帮助业务在云端更高效地运行和迭代。