实现 赤兔 推理成本降低一半 清华团队开源大模型推理引擎 DeepSeek 性能翻番 Chitu (实现赤兔推理的小说)


3月14日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎,赤兔Chitu,现已开源,据介绍,该引擎首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型,实现DeepSeek推理成本降低一半、性能翻番,其定位为,生产级大模型推理引擎,,提供如下特性,官方...。

赤兔

3 月 14 日消息,清华大学高性能计算研究所翟季冬教授团队、清华系科创企业清程极智今日联合宣布,大模型推理引擎“赤兔 Chitu”现已开源。

据介绍,该引擎首次实现在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行 FP8 精度模型,实现 DeepSeek 推理成本降低一半、性能翻番。其定位为“生产级大模型推理引擎”,提供如下特性:

官方表示,当前开源的赤兔引擎在部署 DeepSeek-R1-671B 满血版时,在 A800 集群的测试中,相比部分国外开源框架,实现了 GPU 使用量减少 50% 的同时,推理速度提升 3.15 倍。

附开源地址:


小米透明电视怎么样 小米透明电视好不好 (小米透明电视多少钱)

Siri 但仍有待优化 部分功能可用 消息称苹果内部已演示个性化 (siri总是没反应)

评 论
请登录后再评论