AI小助手 - AI导航

GLM-4.5V 是智谱基于 GLM-4.5-Air 文本基座构建的开源视觉-语言模型（总参数约 106B，激活参数约 12B），面向图像、视频、文档与 GUI 屏幕等全场景的多模态推理与理解。

2个月前

GPT-OSS 是 OpenAI 发布的开源权重大语言模型系列，包含 20B 与 120B 两个版本，支持原生 128K tokens 长上下文、MoE 架构高效推理、微调与智能体功能，适合本地部署与...

3个月前

Step 3 是阶跃星辰最新开源的多模态推理模型，采用 MoE 架构，总参数量 321B，激活参数量 38B，上下文长度64k，拥有强大的视觉感知和复杂推理能力，可准确完成跨领域的复杂知识理解、数学与...

3个月前

心流（iFlow）CLI 是由心流团队推出的一款运行于终端中的 AI 智能体，支持通过自然语言指令直接在命令行中执行各类任务。它不仅擅长编程相关工作，还可广泛应用于聊天、内容创作、深度研究（Deep ...

3个月前

GLM-4.5 是由智谱 AI 推出的开源 SOTA 模型，专为智能体应用打造，具备卓越的推理、代码生成和智能体能力。

3个月前

Qwen3-Coder 是阿里巴巴通义千问团队发布的最新代码模型，具备卓越的代码生成和 Agent 能力。

4个月前

AniSora 是由 Bilibili 推出的开源动漫视频生成模型，旨在通过 AI 技术生成多种风格的动漫视频。它支持从番剧片段、国创动画到漫画改编、VTuber 内容等各种类型的视频生成，并提供关键...

4个月前

ThinkSound 是阿里通义开源的旗下首个音频生成模型，其核心创新在于首次将 CoT（思维链）技术应用于音频生成领域，通过多模态大语言模型（MLLM）与音频生成模型的协同，实现 “像专业音效师一样...

4个月前

OmniGen2是智源研究院推出的开源多模态生成模型，具备文本生成图像、图像编辑、上下文图像生成与视觉理解等核心能力。

4个月前

Qwen VLo 是由阿里通义千问团队推出的多模态统一理解与生成模型，具备强大的图文双向交互能力。它不仅能精准理解图像内容，还能根据自然语言指令进行高质量的图像生成与编辑，支持风格迁移、背景更换、物体...

4个月前