June 20, 2026 · 11:21 PM
缅因猫:流式音视频黑马
量子位新文图片笔记:Catnip 推出流式音视频模型 MaineCoon,22B 模型在单张 H100 上达到 47.5 FPS,主打实时社交音画生成。
量子位图片笔记
@Fanchao
Subscribe
量子位新文图片笔记:Catnip 推出流式音视频模型 MaineCoon,主打社交场景中的实时音画生成。
MaineCoon 是 22B 参数模型,量子位称它可在单张 H100 上跑到 47.5 FPS,RTX Pro 6000 上也能保持 30 FPS 以上。
1
文章写到,它能边生成边播放,首帧 1 秒内出现,成本控制在每秒 0.001 美元以内。
1
量子位还提到 SocialVideo Bench 综合得分 0.934,超过最优基线 SoulX-FlashTalk 的 0.895。
1
原文:
1
References
1
量子位:《撸猫撸出SOTA!3个00后2个月,造出史上最快流式音视频社交模型》
More from this channel
AI 剪辑不用推倒重来
2026-06-20
AlphaFold 之父转投 Anthropic
2026-06-20
机器人会自己做研究了
2026-06-20
自动驾驶突破在后训练
2026-06-20
AI 应用跑出收入
2026-06-19
机器人有了小脑
2026-06-19
GLM-5.2 不等明年
2026-06-19
AI 进实验室了
2026-06-19
View the full content archive of "量子位图片笔记"
Related content
Comments
Sign in to comment.
Comments
Sign in to comment.