
gpt-4o-mini-transcribe – OpenAI 推出的语音转文本模型
gpt-4o-mini-transcribe是OpenAI推出的模型,gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe基于GPT-4o-mini架构,用知识蒸馏技术从大模型中转移能力,实现更小的模型体积和更高的运行效率,适合在资源受限的设备(如移动设备或嵌入式系统)上运行,满足实时性要求较高的应用场景。gpt-4o-mini-trans
gpt-4o-mini-transcribe是OpenAI推出的模型,gpt-4o-transcribe的精简版。gpt-4o-mini-transcribe基于GPT-4o-mini架构,用知识蒸馏技术从大模型中转移能力,实现更小的模型体积和更高的运行效率,适合在资源受限的设备(如移动设备或嵌入式系统)上运行,满足实时性要求较高的应用场景。gpt-4o-mini-trans
GPT-4ominiTTS是OpenAI推出的轻量级模型,支持将文本内容转换为自然流畅语音的同时,开发者能用指令控制语音的语调、情感和风格,例如“平静”“鼓励”“严肃”等,适应不同场景需求。模型基于先进语音合成技术,生成高质量语音输出,支持多种语言及不同性别、年龄和口
GPT-4.1是OpenAI最新推出的新一代语言模型,包含GPT-4.1、GPT-4.1mini和GPT-4.1nano三个版本。系列模型在编码能力、指令遵循和长文本处理等方面有显著提升,支持高达100万个token的上下文窗口。在多项基准测试中,GPT-4.1的表现优异,如在SWE-benchVerified测试中
AILSJ2024年04月10日消息,Gemini1.5Pro现已在超过180个国家通过GeminiAPI公开预览提供,引入了首次的原生音频(语音)理解能力和新的FileAPI,以便于处理文件。此外,
苹果手机上的GoogleApp不再自带Gemini功能了,想用Gemini的朋友们,得单独下载一个App才行。最近,Google公司宣布,他们把iOS版本GoogleApp里的Gemini功能给取消了。也就是说,如果你是iPhone用户,想用Gemini,就不能像以前那样在GoogleApp里直接用了,必须去下载一个单独的Gem
AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通
GO-1(GenieOperator-1,智元启元大模型)是智元机器人推出的首个通用具身基座模型。模型采用Vision-Language-Latent-Action(ViLLA)架构,由VLM(多模态大模型)和MoE(混合专家)组成。VLM借助海量互联网图文数据,赋予模型通用场景感知和语言理
GLM-Z1-Rumination是智谱公司推出的沉思模型,基于进一步优化而成。GLM-Z1-Rumination基于扩展强化学习训练,提升模型结合工具使用完成长程推理的能力。模型能主动理解用户需求,结合实时联网搜索、动态工具调用、深度分析和自我验证,形成完整的自主研究流程。GLM-Z1-Rumination具备
GLM-Z1-Air是智谱公司推出的基于的深度思考模型。GLM-Z1-Air在预训练阶段引入更多推理类数据,在对齐阶段深度优化通用能力,展现出强大的数理推理性能,与等模型媲美。GLM-Z1-Air在推理速度上相比R1提升8倍,成本降低至1/30,支持在消费级显卡上运行,具有高性能与高性价比。GLM-Z1-Air适用于复杂任务的推理和逻辑分析,为智能体应用提供强大的推理支持。强大的数理推理能
GLM-Z1-32B是智谱公司开源的新一代推理模型,具体参数版本为GLM-Z1-32B-0414。GLM-Z1-32B基于GLM-4-32B-0414基座模型开发,基于深度优化训练,在数学、代码和逻辑等任务上表现出色,部分性能可媲美参数量高达6710亿的。模型基于冷启动和扩展强化学习策略,推理速度最高可达200tokens/s,支持轻量化部