欢迎光临
我们一直在努力

热门新闻 第71页

LDGen – 理想汽车推出的多语言文本到图像生成技术

LDGen是创新的合成技术,通过结合大型语言模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通过分层标题优化和人类指令技术,提取文本中的精确语义信息,基于轻量级适配器实现LLMs与图像特征的高效对齐和交互。LDGen支持零样本多语言生成,能根据多种语言的文本描述生成高质量图像,显著优于传统方法。

赞(0)划界划界阅读()

LCVD – 川大推出的可调节光照效果的肖像动画生成框架

LCVD(LightingControllableVideoDiffusionModel)是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征(如身份和外观)与外在特征(如姿态和光照),参考适配器和阴影适配器将特征分别映射到不同的子空间中。

赞(0)划界划界阅读()

LaWGPT – 南京大学推出的中文法律大语言模型

LaWGPT是南京大学推出的中文大语言模型,基于LLaMA模型进行二次预训练,融入大量中文法律知识。专注于法律领域,能理解和生成与法律相关的文本,适用于法律咨询、案例分析、法律文件生成等多种场景。LaWGPT有LaWGPT-7

赞(0)划界划界阅读()

LanPaint – 零训练 AI 图像修复工具

LanPaint是用在StableDiffusion模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。LanPaint基于多轮迭代推理优化修复效果,支持无缝且准确的修复结果。LanPaint提供简单易用的

赞(0)划界划界阅读()

LangManus – AI自动化框架,多智能体协同完成复杂任务

LangManus是AI自动化框架,基于分层多智能体系统设计。包含多种智能体,如协调员、规划员、研究员、程序员等,各司其职,协同完成复杂任务。框架支持多种开源语言模型,如通义千问,兼容OpenAIAPI接口,能根据任务复杂度灵活调用不同层级的模型。LangManus具备强大的搜索和检索能力,通过TavilyAPI实现网络搜索,结合Jina进行神经搜索,高效提取和分析信息。

赞(0)划界划界阅读()

LanDiff – 高质量文本到视频生成的混合框架

LanDiff是用于高质量的(T2V)生成的创新混合框架,结合了自回归语言模型(LLM)和扩散模型(DiffusionModel)的优势,通过粗到细的生成方式,有效克服了单一方法在语义理解和视觉质量上的局限性。在VBenchT2V基准测试中取得了85.43的高分,超越了包括13B的HunyuanVideo在内的多个开源和商业模型。高

赞(0)划界划界阅读()

Kuli Kuli – AI翻译应用,能即时翻译多种语言的菜单

AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智能,用好人工智能,高效工作,快乐生活。

赞(0)划界划界阅读()

Krillin AI – AI音视频翻译配音工具,支持一键部署全流程

AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智能,用好人工智能,高效工作,快乐生活。

赞(0)划界划界阅读()

Krea Stage – Krea 推出 2D 图像转 3D 场景的 AI 工具

AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智能,

赞(0)划界划界阅读()

KLING AI – 快手推出的AI图像和视频创作平台

KLINGAI(国际版)是快手推出的AI创意工具。基于强大的AI技术帮助用户快速生成高质量的视频和图像内容,广泛应用于广告、音乐视频、电影制作等领域。用户输入文本或上传图片,借助强大的AI算法快速生成创意作品。KLINGAI适用于专业创作者和新手快速入门,是创意工作者的得力助手。文字转视频:输入文本生成对应视频。图片转视频:上传图片生成视频内容。镜头运动与帧设置:设置镜头运动,定

赞(0)划界划界阅读()

登录

找回密码

注册