
NEXUS-O – 多模态AI模型,实现对语言、音频和视觉全方位感知与交互
NEXUS-O是HiThink研究院、英国帝国理工学院、浙江大学、复旦大学、微软、MetaAI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与交互。NEXUS-O能处理音频、图像、视频和文本的任意组合输入,用音频或文本形式输出结果。NEXUS-O基于视觉语言模型预训练,用高质量合成音频数据提升三模态对齐能力。NEXUS
NEXUS-O是HiThink研究院、英国帝国理工学院、浙江大学、复旦大学、微软、MetaAI等机构推出的多模态AI模型,能实现对语言、音频和视觉信息的全方位感知与交互。NEXUS-O能处理音频、图像、视频和文本的任意组合输入,用音频或文本形式输出结果。NEXUS-O基于视觉语言模型预训练,用高质量合成音频数据提升三模态对齐能力。NEXUS
Neural4D2o是DreamTech推出的全球首个支持多模态交互的3D大模型。模型基于文本、图像、3D和运动数据的联合训练,实现3D生成的上下文一致性、高精准局部编辑、角色ID保持、换装和风格迁移等功能。模型支持用户基于自然语言指令实现高质量的3D内容创作。Neura
Neo-1是VantAI推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构,生成全新的分子,在设计分子胶等新型治疗药物方面表现出色。Neo-1的多模态输入功能能接受部分序列、部分结构和实验数据等多种信息,显著提高药物设计的效率和准确性。Neo-1与VantAI的NeoLink平台相结合,通过交联质
Narakeet是功能强大的在线平台,基于自然技术快速创建配音和旁白视频。Narakeet支持100种语言和800种声音,将文本、Word文档、PPT演示文稿或字幕文件转换为高质量的音频文件,与视频内容自动同步。用户能轻松制作多语言的培训视频、产品营销视频、Yo
Nanobrowser是开源的Chrome扩展工具,专注于AI驱动的网页自动化。Nanobrowser基于多智能体系统实现复杂的网页任务,如信息提取、自动化操作等。用户用自己的LLMAPI密钥,灵活选择不同的模型为不同智能体提供支持。Nanobrowser完全免费,作为的开源替代方案,支持在本地浏览器运行,注重隐私保护,不涉及云服
MyLens是AI时间轴生成工具。MyLens支持将用户的想法、文字内容或数据快速转化为直观的视觉图表,如时间线、思维导图、象限图和表格。基于智能算法,MyLens根据输入信息生成高质量的图表、信息图、设计模板等,帮助用户提升内容的吸引力和易理解性。MyLens帮助企业进行品牌推广、教育工作者制作教学材料,个人整理笔记,提
MV-MATH是中科院自动化所提出的新基准数据集,评估多模态大语言模型(MLLMs)在多视觉场景中的数学推理能力。数据集包含2009个高质量的数学问题,每个问题都结合了多个图像和文本,形成了图文交错的多视觉场景。问题分为选择题、填空题和多步问答题三种类型,覆盖了11个数学领域,包括解析几何、代数、度量几何、组合学、
AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智能,用好人工智能,高效工作,快乐生活。
MurekaV6是昆仑万维推出的AI音乐创作平台的基座模型,支持纯音乐生成以及10种语言的。引入自研的ICL(in-contextlearning)技术,使声场更加开阔,人声质感和混音设计进一步强化。用户可以通过简单的步骤使用MurekaV6创作音乐。生成的音乐可以自由使用,适用于YouTube、广告、游
MurekaO1是昆仑万维发布的全球首款音乐推理大模型,全球首个引入“思维链”(ChainofThought,CoT)技术的音乐模型,MurekaO1在推理过程中加入思考与自我批判机制,大幅提升了音乐品质、创作效率和灵活性。支持纯音乐生成以及10种语言的,涵盖多种音乐风格和情感表达,具备歌曲参考和音色克隆等特色功能。MurekaO1开放了API服务与模型微调功能,助力开发者和音乐平台无缝