
ModelEngine – 华为开源的全流程 AI 开发工具链
ModelEngine是华为开源的全流程AI开发工具链,围绕数据使能、模型使能和应用使能三大核心功能展开,解决AI行业化落地过程中数据工程耗时长、模型训练和应用落地难的关键问题。ModelEngine的开源代码已托管在GitCode、Gitee和GitHub等多个平台,为开发者提供了丰富的资源和便捷的协作环境。数据使能:提供文本、图像、文档等多种数据类型的归集和处理工具,具备数据清洗、数据评估、Q
ModelEngine是华为开源的全流程AI开发工具链,围绕数据使能、模型使能和应用使能三大核心功能展开,解决AI行业化落地过程中数据工程耗时长、模型训练和应用落地难的关键问题。ModelEngine的开源代码已托管在GitCode、Gitee和GitHub等多个平台,为开发者提供了丰富的资源和便捷的协作环境。数据使能:提供文本、图像、文档等多种数据类型的归集和处理工具,具备数据清洗、数据评估、Q
MoChaAI是Meta和滑铁卢大学联合开发的端到端对话角色模型。能根据文本或语音输入生成带有同步语音和自然动作的完整角色动画。MoCha采用语音-视频窗口注意力机制,解决了视频压缩时音频分辨率不匹配
AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智能,用好人工智能,高效工作,快乐生活。
MM-StoryAgent是上海交通大学X-LANCE实验室和阿里巴巴集团联合推出的开源多模态、多智能体框架,用在生成沉浸式的有声故事绘本视频。基于结合大型语言模型(LLMs)和多种模态的生成工具(如文本、图
MM-Eureka是上海人工智能实验室、上海创智学院、上海交通大学和香港大学的研究人员共同开发的多模态推理模型。模型通过基于规则的大规模强化学习(RL),将单模态推理中的关键特性(如稳定的回答长度增长、准确率奖励以及视觉
MistralSmall3.1是MistralAI开源的多模态人工智能模型,有240亿参数,基于Apache2.0许可证发布。在文本和多模态任务上表现出色,支持长达128ktokens的上下文窗口,推理速度可达每秒150个token,低延迟且高效。模型在多项基准测试中表现优异,例如在MMLU、MMLUPro等测试中准确率较高。具备强大的多模态理解能力,能处理图像与文本结合的任务
MistralOCR是MistralAI推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支持数千种语言和字体,多语言处理准确率高达99.02%,在基准测试中超越GoogleDocumentAI和AzureOCR。MistralOCR提供结构化输出,可
MiracleF1是美图WHEE推出的全新模型。具备强大的图像生成能力,能像摄影师、建筑师和画家一样精准地处理光影、空间和材质效果,生成的图像真实感强,质感细腻,告别了传统AI图像的“塑料感”。语义理解精准,能准确呈现用户描述的复杂概念,如“纯色背景”“夜景灯光”等。MiracleF1风格多样,涵盖从3D立体特效到二次元插画等多种风
Miraa是Myoland推出的AI驱动的语言学习应用,通过自动转录音频和视频字幕,为用户提供实时翻译、AI辅助解释等功能,帮助用户更好地理解语言中的词汇、语法和文化背景。Miraa的“回声法练习”功能,让用户通过听、理解、模仿和比较四个步骤,提升口语能力。应
AILSJ获悉,近日,上海稀宇科技MiniMax最近推出了其海螺AI系列的最新产品-海螺视频生成模型和海螺音乐生成模型。海螺视频这款产品在国际上获得了极高的评价。许多用户表示,海螺AI的视频生成质量与Sora、Runway、Luma等国际顶尖产品相比毫不逊色。海螺AI在视频生成的质量