
Kiss3DGen – 基于图像扩散模型的3D资产生成框架
Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3DBundleImage”,将多视图图像及对应的法线图组合成一种拼贴表示,法线图用于重建3D网
Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3DBundleImage”,将多视图图像及对应的法线图组合成一种拼贴表示,法线图用于重建3D网
Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean4语言中严谨地证明数学定理。通过独特的“形式化推理模式”,在推理过程中穿插非形式化推理和Lean4代码片段,模拟人类解决问题的策略。Kimina-Prover在miniF2F基准测试中取得了80.7%的成绩,超
Kimi-VL是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)。Kimi-VL支持单图、多图、视频和长文档等多模态输入,在图像感知、数学、多学科题目、OCR等任务中表现出色,尤其
AILSJ最新消息,KimiAPI推出了联网搜索功能,该功能让KimiAPI能够像Kimi智能助手一样,通过互联网搜索解决各种问题。用户只需发出请求,KimiAPI就可以自动处理搜索和内容获取。此功能不仅快速、省心,还能与现有代码兼容,无需对原有的API接口做出大改动。KimiA
Jobright是基于AI技术的求职平台,帮助用户高效找到理想工作。Jobright基于AI技术实现精准职位匹配,根据用户技能和经验推荐合适岗位,自动过滤虚假职位。Jobright提供智能简历优化工具,支持快速生成高质量、ATS兼容的简历
AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智能,用好人工智能,高效工作,快乐生活。
?IT之家6月28日消息,今年5月,OpenAI发布了iOS版的ChatGPT应用,该应用已更新了许多新功能,包括对Siri快捷方式的支持。今日该应用又推出了一个新功能,即集成了微软的Bing搜索引擎,但这个功能只对付费用户开放。据应用的更新说明介绍,ChatGPTPlus订阅用户可以开启一个名为“浏览”的新功能,该功能结合了GPT-4和Bing搜索。当
InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时处理文字、图片、视频等多种信息。InternVL3采用了创新的原生多模态预训练方法,将语言和多模态学习整合到同一个预训练阶段,提升了多模态能力的
InternVL是上海人工智能实验室OpenGVLab推出的多模态大模型,专注于视觉与语言任务。采用ViT-MLP-LLM架构,通过视觉模块(如InternViT)和语言模块(如InternLM)的融合,实现视觉与语言的深度结合。InternVL基于海量网络级图像-文本数据训练,支持多种模态输入,如图像、视频、文本,能生成多语言输
Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMDInstinct?MI300XGPU上训练而成,基于自回归Transformer架构,包含36个解码器层和32个注意力头,支持最长4096个标记的序列。Instella经过多阶段训练,包括大规模预训练、监督微调和偏好优化,提升自然语言理解、指令跟随和对话能力。Instella在多个基