2026年1月1日,AI领域知名企业DeepSeek正式发布一篇重磅研究论文,提出名为mHC(流形约束超连接)的全新架构。该架构成功破解传统超连接在大规模模型训练中的稳定性与可扩展性难题,同时创始人梁文锋参与论文署名,彰显了DeepSeek在核心技术 ...
智东西1月1日报道,昨日晚间,DeepSeek团队送出一份新年“贺礼”,正式发布新论文《Manifold-Constrained Hyper-Connections》,提出一种能稳定训练并提升大模型可扩展性的残差连接新方案。