onnxruntime支持deepseek大模型并进行算子优化
龙芯中科技术股份有限公司、中国科学院计算技术研究所
优化onnxruntime CPU实现实现大模型运行加速。
2025全国大学生操作系统比赛的“OS功能挑战”赛道
- 以小组为单位参赛,最多三人一个小组,且小组成员是来自同一所高校的本科生或研究生
- 如学生参加了多个项目,参赛学生选择一个自己参加的项目参与评奖
- 请遵循“2025全国大学生操作系统比赛”的章程和技术方案要求
- 李星 Email [email protected]
中
MIT License
实现onnxruntime CPU后端算子 sqn相关优化并加速大模型运行,并尽可能提交相关优化代码到开源社区。
龙芯能够提供3C5000云平台账号。