欢迎光临
我们一直在努力

热门新闻 第72页

Kiss3DGen – 基于图像扩散模型的3D资产生成框架

Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于生成“3DBundleImage”,将多视图图像及对应的法线图组合成一种拼贴表示,法线图用于重建3D网

赞(0)划界划界阅读()

Kimina-Prover – 月之暗面联合 Numina 推出的数学定理证明模型

Kimina-Prover是月之暗面与Numina团队合作推出的大型数学定理证明模型,模型采用大规模强化学习训练,能以类似人类的方式进行推理,在Lean4语言中严谨地证明数学定理。通过独特的“形式化推理模式”,在推理过程中穿插非形式化推理和Lean4代码片段,模拟人类解决问题的策略。Kimina-Prover在miniF2F基准测试中取得了80.7%的成绩,超

赞(0)划界划界阅读()

Kimi-VL – 月之暗面开源的轻量级多模态视觉语言模型

Kimi-VL是月之暗面开源的轻量级多模态视觉语言模型,基于轻量级MoE模型Moonlight(16B总参数,2.8B激活参数)和原生分辨率的MoonViT视觉编码器(400M参数)。Kimi-VL支持单图、多图、视频和长文档等多模态输入,在图像感知、数学、多学科题目、OCR等任务中表现出色,尤其

赞(0)划界划界阅读()

Kimi API 正式推出联网搜索功能

AILSJ最新消息,KimiAPI推出了联网搜索功能,该功能让KimiAPI能够像Kimi智能助手一样,通过互联网搜索解决各种问题。用户只需发出请求,KimiAPI就可以自动处理搜索和内容获取。此功能不仅快速、省心,还能与现有代码兼容,无需对原有的API接口做出大改动。KimiA

赞(0)划界划界阅读()

iOS 版 ChatGPT 集成必应搜索功能,仅限付费订阅者使用

?IT之家6月28日消息,今年5月,OpenAI发布了iOS版的ChatGPT应用,该应用已更新了许多新功能,包括对Siri快捷方式的支持。今日该应用又推出了一个新功能,即集成了微软的Bing搜索引擎,但这个功能只对付费用户开放。据应用的更新说明介绍,ChatGPTPlus订阅用户可以开启一个名为“浏览”的新功能,该功能结合了GPT-4和Bing搜索。当

赞(0)划界划界阅读()

InternVL3 – 上海 AI Lab 开源的多模态大语言模型

InternVL3是上海人工智能实验室开源的多模态大型语言模型(MLLM),具有卓越的多模态感知和推理能力。模型系列包括1B到78B共7个不同尺寸的版本,能同时处理文字、图片、视频等多种信息。InternVL3采用了创新的原生多模态预训练方法,将语言和多模态学习整合到同一个预训练阶段,提升了多模态能力的

赞(0)划界划界阅读()

InternVL – OpenGVLab 推出的多模态大模型

InternVL是上海人工智能实验室OpenGVLab推出的多模态大模型,专注于视觉与语言任务。采用ViT-MLP-LLM架构,通过视觉模块(如InternViT)和语言模块(如InternLM)的融合,实现视觉与语言的深度结合。InternVL基于海量网络级图像-文本数据训练,支持多种模态输入,如图像、视频、文本,能生成多语言输

赞(0)划界划界阅读()

Instella – AMD开源的30亿参数系列语言模型

Instella是AMD推出的系列30亿参数的开源语言模型。模型完全从零开始在AMDInstinct?MI300XGPU上训练而成,基于自回归Transformer架构,包含36个解码器层和32个注意力头,支持最长4096个标记的序列。Instella经过多阶段训练,包括大规模预训练、监督微调和偏好优化,提升自然语言理解、指令跟随和对话能力。Instella在多个基

赞(0)划界划界阅读()

登录

找回密码

注册