
Multi-SWE-bench – 字节豆包开源的多语言代码修复基准
Multi-SWE-bench是字节跳动大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeScript、JavaScript、Go、Rust、C和C
Multi-SWE-bench是字节跳动大模型团队开源的首个多语言代码修复基准。在SWE-bench基础上,首次覆盖Python之外的7种主流编程语言,包括Java、TypeScript、JavaScript、Go、Rust、C和C
Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人精准分离到不同轨道,解决传统音频工具在处理重叠语音时的难题。Multi-Speaker适用于多种场景,先进神经架构支持高采样率,适合广播级音
Multi-AgentOrchestrator是用于管理和协调多个智能代理(Agent)的框架。通过分类器识别用户输入的意图,将请求分配给最适合的代理进行处理,通过对话存储保持上下文连贯性。支持多种类型的代理,如基于大语言模型(LLM)的代理和基于规则的代理,具有高度的灵活性和可扩展性。用户输入后,分类器分析并选择合适
MT-TransformerEngine是摩尔线程开源的高效训练与推理优化框架,专为Transformer模型设计。框架通过算子融合、并行加速等技术,充分基于摩尔线程全功能GPU的计算潜力,显著提升训练效率。支持FP8混合精度训练,借助GPU的原生FP8计算能力,进一步优化性能和稳定性。MT-Tran
MT-MegatronLM是摩尔线程推出的面向全功能GPU的开源混合并行训练框架,主要用于高效训练大规模语言模型。支持dense模型、多模态模型及MoE(混合专家)模型的训练。框架基于全功能GPU支持FP8混合精度策略、高性能算子库和集合通信库,显著提升了GPU集群的算力利用率。通过模型并行、数据并行和流水线并行等技术,
MoveAI是AI动作捕捉工具,专注于无标记动作捕捉技术,基于AI技术和计算机视觉技术,将普通摄像头(如手机)拍摄的2D视频转换为高质量的3D运动数据。MoveAI无需穿戴任何特殊设备或标记,简化动作捕捉流程,具备高效、快速处理和高精度的特点。MoveAI广泛应用于娱乐(如电影、游戏、现场表演)、体育分析、虚拟现实(VR)和增强现实(AR)等领
MotionAnything是澳大利亚国立大学、悉尼大学、腾讯、麦吉尔大学、京东等机构推出的多模态运动生成框架,根据文本、音乐或两者的组合生成高质量、可控的人类运动。MotionAnything引入基于注意力的掩码建模方法,实现对运动序列中关键帧和动作的细
Motia是专为软件工程师设计的AIAgent框架,简化AI智能体的开发、测试和部署过程。支持多种编程语言,如Python、TypeScript和Ruby,开发者可以使用熟悉的语言编写智能体逻辑,无需学
MoshiVis是Kyutai推出的开源多模态语音模型,基于Moshi实时对话语音模型开发,增加了视觉输入功能。能实现图像的自然、实时语音交互,将语音和视觉信息相结合,让用户可以通过语音与模型交流图像内容。模型在Moshi的7B基础架构上,增加了约206M的适配器参数,集成了400M的P
MoLing是无依赖的本地办公自动化助手,是基于计算机和浏览器使用的MCP服务器。MoLing基于操作系统API实现系统交互,支持文件系统操作(如读写、合并、统计和聚合),执行系统命令。MoLing兼容Windows、Linux和macOS,无需安装额