新手上路 5小时前
主楼
[资源名称]
DeepEP
[资源来源]
github.com
[资源介绍]
* DeepEP 。它提供高通量、低延迟的全对全 GPU 内核,也称为 MoE 调度和合并。该库还支持低精度运算,包括 FP8。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️