GLM-4.5V:智谱开源的多模态视觉推理大模型 GLM-4.5V 是智谱基于 GLM-4.5-Air 文本基座构建的开源视觉-语言模型(总参数约 106B,激活参数约 12B),面向图像、视频、文档与 GUI 屏幕等全场景的多模态推理与理解。 AI工具 2个月前
GPT-OSS:OpenAI开源的大语言模型,支持本地部署与高效推理 GPT-OSS 是 OpenAI 发布的开源权重大语言模型系列,包含 20B 与 120B 两个版本,支持原生 128K tokens 长上下文、MoE 架构高效推理、微调与智能体功能,适合本地部署与... AI工具 3个月前
Step 3:阶跃星辰最新开源的多模态推理模型 Step 3 是阶跃星辰最新开源的多模态推理模型,采用 MoE 架构,总参数量 321B,激活参数量 38B,上下文长度64k,拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与... AI工具 3个月前
iFlow CLI – 心流团队推出的运行在终端中的 AI 智能体 心流(iFlow)CLI 是由心流团队推出的一款运行于终端中的 AI 智能体,支持通过自然语言指令直接在命令行中执行各类任务。它不仅擅长编程相关工作,还可广泛应用于聊天、内容创作、深度研究(Deep ... AI工具 3个月前
Qwen3-Coder:阿里通义千问推出的代码模型,具备卓越的代码生成和 Agent 能力 Qwen3-Coder 是阿里巴巴通义千问团队发布的最新代码模型,具备卓越的代码生成和 Agent 能力。 AI工具 3个月前
AniSora:Bilibili 推出的开源动漫视频生成模型 AniSora 是由 Bilibili 推出的开源动漫视频生成模型,旨在通过 AI 技术生成多种风格的动漫视频。它支持从番剧片段、国创动画到漫画改编、VTuber 内容等各种类型的视频生成,并提供关键... AI工具 4个月前
ThinkSound:阿里通义开源的旗下首个音频生成模型 ThinkSound 是阿里通义开源的旗下首个音频生成模型,其核心创新在于首次将 CoT(思维链)技术应用于音频生成领域,通过多模态大语言模型(MLLM)与音频生成模型的协同,实现 “像专业音效师一样... AI工具 4个月前
Qwen VLo:阿里推出的多模态统一理解与生成模型 Qwen VLo 是由阿里通义千问团队推出的多模态统一理解与生成模型,具备强大的图文双向交互能力。它不仅能精准理解图像内容,还能根据自然语言指令进行高质量的图像生成与编辑,支持风格迁移、背景更换、物体... AI工具 4个月前