发布日期:2024-09-30 14:08 点击次数:115
今天共享的是:2024年EMS弹性内存存储技能白皮书3d成人游戏
陈连续计:24页
《2024年EMS弹性内存存储技能白皮书》由华为云酌量技能有限公司发布,先容了弹性内存存储奇迹EMS(Elastic Memory Service)的联系本色,包括布景动机、产物架构和枢纽技能等,旨在处分AI场景中的存力痛点,推进云酌量基础步调的发展,具体本色如下:
1. 详细:基于大模子的生成式AI技能推进了东谈主工智能的应用范围彭胀,激发了AI应用的增长,云酌量基础步调也在向以智能算力为中枢滚动。在新式云酌量基础步调中,数据的“算力”和“存力”相得益彰,但存力问题成为制约效果的枢纽瓶颈,华为云推出的EMS以内存为主要存储介质,将传统的两层云架构升级为三层云架构,能灵验处分存力痛点,具有高资源弹性、高资源附近率和高性能等上风。
2. 布景和动机:
- AI技能的发展:生成式AI技能的逾越推进了AI应用的彭胀,云酌量基础步调正从以通用算力为中枢转向以智能算力为中枢,智能算力限度将远超通用算力限度。
- AI场景中的存力痛点:握久化存储性能不及,大模子的参数和Checkpoint存储在握久化存储奇迹中,读写蔓延大,导致AI集群酌量资源恭候和使用本钱增多;DRAM附近率低,AI集群中DRAM资源往往按最大需求建树,但附近率无数偏低;HBM内存墙问题,包括内存容量墙和内存带宽墙,罢休了AI算力的充分表示。
- EMS的构建动机:华为云推出EMS,将传统的“酌量 - 存储”辞别的两层架构升级为“酌量 - 内存 - 存储”辞别的三层架构,处分握久化存储性能不及、DRAM附近率低和HBM内存墙问题。
3. 产物架构和枢纽技能:
- 软件架构:EMS的软件架构由规模专用奇迹SDK、分散式内存池和治理戒指面构成,面向高易用性、高弹性彭胀性和高可用性野心。
- 内存解耦池化:通过内存池和会部署架构附近AI奇迹器内的腹地DRAM进行池化治理,补助内存附近率;内存池辞别部署架构使用颓败内存奇迹器提供内存池空间;分级存储通过将数据卸载到高速握久化存储介质处分DRAM容量不及和本钱过高的问题;数据冗余提供基于副本和纠删码的内存数据冗余智商,补助数据的可用性。
- 面向AI推理的加快技能:以存代算技能附近EMS中的大容量多级内存池存储和复用多轮对话中产生的KV缓存,幸免类似酌量;显存彭胀技能增多AI加快器的可用显存,守旧启动超出HBM容量的模子或增多推理的批处理大小;酌量卸载技能将自庄重力模块联系的数据和算子卸载到内存池中,缓解HBM内存墙问题,补助AI推理的端到端性能和性价比。
- 面向AI磨练的加快技能:EMS使用分散式内存池来保存检讨点,提高保存和加载速率,包括并行磨练拓扑感知的检讨点保存、基于NPU通讯的检讨点规复和选定性检讨点握久化三项枢纽技能。
- 面向推选模子的加快技能:EMS提供Embedding池化存储、Embedding平衡打散和增量检讨点等功能,末端高资源附近率和高造访性能。
4. 回想:EMS是一种以内存为主要存储介质的云基础步调奇迹,推进华为云基础步调演进,处分了握久化存储性能低、酌量侧DRAM附近率不及以及HBM内存墙三大存力痛点,具有高资源弹性、高资源附近率、高性能等上风,泛泛应用于不同模子的推理和磨练场景,当年将彭胀至通用酌量场景。
5. 缩略语:文档中对EMS、OBS、SDK、GPU、NPU、TPU、HBM、DRAM、SSD、LLM、CV、SOTA、K/V、SLA、MLP、OLTP、HTAP等缩略语进行了解说。
以下为陈述节选本色
国产自拍陈连续计: 24页
中小当年圈3d成人游戏,你需要的贵府,我这里齐有!
内存池架构存力内存算力发布于:广东省声明:该文不雅点仅代表作家本东谈主,搜狐号系信息发布平台,搜狐仅提供信息存储空间奇迹。