DeepSeek 开源周第三天:DeepGEMM 项目。
专为 FP8(8位浮点数)通用矩阵乘法(GEMM)设计的高性能轻量级库,核心内核函数仅约 300 行代码。
其性能在各种矩阵形状下可媲美或超越专家调优的库,在某些情况下性能提升高达 2.7 倍。
GitHub: https://github.com/deepseek-ai/DeepGEMM
同时支持精细缩放功能,支持常规矩阵乘法和混合专家模型(MoE)的分组矩阵乘法。
目前,该项目已经在 DeepSeek-V3 模型上应用。
#AI创造营 #DeepSeek #DeepSeek开源周
https://weibo.com/5722964389/Pg2Nc8Jce
每个人都有属于自己的一片森林,也许我们从来不曾走过,但它一直在那里,总会在那里。迷失的人迷失了,相逢的人会再相逢。愿这里,成为属于你的小森林。