
Droidrun – 开源AI手机操作工具,支持 Agent 操作 Android 手机
Droidrun是AI手机操作工具,支持AIAgent像人类一样操作Android手机。Droidrun基于视觉理解与UI结构提取技术,实现精准交互,支持智能错误处理和自动恢复,确保自动化流程的稳健性。Droidrun提供AndroidPortalAPK,作为AIAgent操控系统的入口。Droidrun支持自带语言模型(BYOLLM),即插即
Droidrun是AI手机操作工具,支持AIAgent像人类一样操作Android手机。Droidrun基于视觉理解与UI结构提取技术,实现精准交互,支持智能错误处理和自动恢复,确保自动化流程的稳健性。Droidrun提供AndroidPortalAPK,作为AIAgent操控系统的入口。Droidrun支持自带语言模型(BYOLLM),即插即
Dreamona是,用户基于简单的文字描述或上传图片,快速生成高质量的动态视频。Dreamona支持多种视频风格,从现实主义到创意动画,满足不同需求。Dreamona的核心优势在于高效的生成速度和高清输出,用
DreamActor-M1是字节跳动推出的先进AI图像动画框架,能将静态人物照片转化为生动的动画视频。采用混合引导机制,结合隐式面部表示、3D头部球体和3D身体骨架等控制信号,实现对人物面部表情和身体动作的精准控制。支持多语言语音驱动面部动画,可生成口型同步结果。DreamActor-M1具有高保真度和身份保持能力,生成的视频在时间上连贯性强。静态照片转动态影像:通过结合一张静态照片和一段
Dream-7B是香港大学和华为诺亚方舟实验室联合推出的扩散式推理模型,是目前最强大的开源扩散大语言模型。Dream-7B训练数据涵盖文本、数学和代码,预训练使用5800亿个标记,耗时256小时。Dream-7B在通用、数学、编程等任务上表现优异,与同尺寸的自回归模型(Qwen2.57B、LLaM
draw.io是免费的在线绘图工具,用户基于浏览器快速创建各种图表,如流程图、、网络拓扑图、甘特图等。draw.io提供丰富的模板和图形库,操作简单易上手,支持多人实时协作,方便团队共同编辑。draw.io与GoogleDrive、Confluence等工具集成,方便在不同平台中使用。draw.io图表支持保存在云端,便于随时访问和分享。draw.io广
DoraCycle是新加坡国立大学ShowLab推出多模态领域适应的统一生成模型,通过两个多模态循环(text-to-image-to-text和image-to-text-to-image)实现不同模态间的信息转换与对齐,基于统一生成模
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的,中文语种涵盖22种方言(含普通话),能精准识别不同地区的语言特点。模型训练数据总时长21.2万小时,
AI老司机(ailsj.cn)精选国内外999+优质AI工具、资源和资讯,包括AI绘画工具、AI写作工具、AI聊天工具、AI音视频工具、AI办公工具、AI游戏制作工具、AI营销工具等AI工具大全。我们希望通过努力,让更多个人和企业,了解人工智
DocTranslator是在线AI文档翻译工具。支持多种文件格式,如PDF、Word、Excel、PPT等,能保留原文档的排版。翻译覆盖100多种语言,能满足不同用户的需求。对于PDF文件,用户可获得1页免费预览,能处理最大1Gb、5000页的大型PDF文件,无需安装任何软件,通过浏览器即可使用。OC
DistilQwen2.5-R1是阿里巴巴推出的基于知识蒸馏技术的小型化系列深度推理模型,包含3B、7B、14B和32B四个参数量级的模型。DistilQwen2.5-R1将超大规模模型(如)的推理能力迁移到较小的模型中,实现更高的计算效率和更低的资源消耗。D