05
05
2026
腾讯混元 AI Infra 团队今日颁布发表推出开源出产级高机能 LLM 推理核默算子库此外,IT之家 2 月 4 日动静,会拓展更丰硕的量化策略,HPC-Ops 将持续深耕大模子推能的冲破标的目的:该算子库基于出产痛点,为超大规模大模子的高效摆设供给底层支持。大幅降低分布式推理场景下的通信开销,笼盖 4bit/8bit 夹杂精度等更多量化方案?一方面,将沉点研发稀少 Attention 算子,实现了机能冲破。进一步均衡推理速度取模子精度;另一方面,降低底层算子开辟门槛,针对性处理长上下文大模子的内存取算力瓶颈;通过融合多 GPU 间的计较逻辑取通信流程,将核默算子机能迫近硬件峰值,通过笼统化工程架构、微架构深度适配及指令级极致优化等,算子库还将结构计较-通信协同优化的内核。