Evolving Agents – 开源的AI Agent管理与进化框架
Evolving Agents 是用在创建、管理和进化 AI...
FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA(Multi-Head Linear Attention)解码内核,专为处理可变长度序列设计。通过优化 KV 缓存机制和采用 BF16 数据格式,提升了内存和计算效率。在 H800 SXM5 GPU 上,FlashMLA 的内存带宽可达 3000 GB/s,计算性能可达 580 TFLOPS。