欢迎光临
我们一直在努力

热门新闻 第79页

Gemma 3 – 谷歌最新推出的开源多模态 AI 模型

Gemma3是谷歌最新推出的开源人工智能模型,专为开发者设计,支持多种设备上的人工智能应用开发。支持超过35种语言,具备分析文本、图像及短视频的能力,提供四种不同尺寸的模型(1B、4B、12B和27B),满足不同硬件和性能需求。Gem

赞(0)划界划界阅读()

Gemini:我们规模最大、能力最强的 AI 模型

每一次技术的变革都是推进科学发现、加快人类进步和改善人们生活的机会。我相信我们此时正在见证的AI转变将是我们一生中影响最为深远的转变,其影响力远超过移动技术或互联网的转变。AI有着为世界各地的人们创造机会的潜力,无论是在日常生活中还是在铸就非凡成就方面。它将带来新一轮的创新和经济进步,并以前所未

赞(0)划界划界阅读()

Gemini Robotics – 谷歌 DeepMind 推出的具身智能大模型

GeminiRobotics是谷歌DeepMind推出的基于的机器人项目,将大型多模态模型的能力引入物理世界。项目包含两个主要模型:GeminiRobotics-ER和GeminiRobotics。GeminiRobotics-ER是增强版的视觉-语言模型(VLM),具备强大的具身推理能力,支持理解三维空间、物体检测、指向、轨迹和抓取预测等任务。

赞(0)划界划界阅读()

Gemini Embedding – 谷歌推出的文本嵌入模型

GeminiEmbedding是Google推出的先进的文本嵌入模型,基于将文本转化为高维数值向量,捕捉其语义和上下文信息。GeminiEmbedding基于Gemini模型训练,具备强大的语言理解能力,支持超过100种语言,在多语言文本嵌入基准测试(MTEB)中排名第一。模型适用于多种场景,如高效检索、文本分类、相似性检测等,能显著

赞(0)划界划界阅读()

Gemini 2.5 Pro – 谷歌推出的最新 AI 思考模型

Gemini2.5Pro是谷歌推出的最新AI模型,是一个“思考模型”,能在回应前进行推理,提升性能和准确性。模型在多个基准测试中表现卓越,在推理和代码生成方面,例如在LMArena排行榜上位居第一。支持文本、图像、音频、视频及代码的多模态输入,上下文窗口达100万token,未来将扩展至200万。深度思考:Gemini2.5Pro是“思考模型

赞(0)划界划界阅读()

Gemini 2.5 Flash – 谷歌推出的最新 AI 推理模型

Gemini2.5Flash是Google推出的高效、低延迟的最新AI模型,基于Gemini2.5模型构建。Gemini2.5Flash在保持低延迟和成本效益的同时,引入思考能力。Gemini2.5Flash的推出是让所有Gemini模型都能适应性思考的重要一步,为开发者解锁新的应用场景,比如构建更强大的智能代理、加速代码辅助及生成更复杂的推理内容。Gemini2.5Flash即将

赞(0)划界划界阅读()

Gemini 2.0 Flash – Google推出的多模态 AI 模型

Gemini2.0Flash是Google推出的多模态AI模型,结合文本理解和能力。根据自然语言输入生成高质量的图像,支持多轮对话式的图像编辑,保持上下文连贯性。模型擅长将文本与图像结合,例如为故事生成连贯的插图、根据对话修改图像风格,用世界知识生成更准确的图像(如食谱插图)。Gemini2.0Flash在长文本渲染方面表

赞(0)划界划界阅读()

GaussianAnything – 南洋理工 S-Lab 和上海 AI Lab 等推出的 3D 生成框架

GaussianAnything是南洋理工大学S-Lab联合上海AILab等机构推出的框架。GaussianAnything基于交互式的点云结构化潜空间和级联的流匹配模型,实现高质量、可扩展的3D内容生成。GaussianAnything支持多模态条件输入,包括点云、文本和单/多视图图像,能生成具有几何-纹理解耦的3D资产,便于

赞(0)划界划界阅读()

Gartner:2022年全球人工智能软件市场规模将达620亿美元

11月30日消息,Gartner预测,2022年全球人工智能(AI)软件收入总额预计将达到625亿美元,相比2021年增长21.3%。人工智能软件市场包括计算机视觉软件等嵌入人工智能的应用以及用于构建人工智能系统的软件。Gartner对人工智能软件市场所作的预测以用例为基准,通过衡量潜在业务的价值量、实现业务价

赞(0)划界划界阅读()

登录

找回密码

注册