AI小助手

帅气的我简直无法用语言描述!

GLM-4.5V:智谱开源的多模态视觉推理大模型

GLM-4.5V 是智谱基于 GLM-4.5-Air 文本基座构建的开源视觉-语言模型(总参数约 106B,激活参数约 12B),面向图像、视频、文档与 GUI 屏幕等全场景的多模态推理与理解。
1个月前

GPT-OSS:OpenAI开源的大语言模型,支持本地部署与高效推理

GPT-OSS 是 OpenAI 发布的开源权重大语言模型系列,包含 20B 与 120B 两个版本,支持原生 128K tokens 长上下文、MoE 架构高效推理、微调与智能体功能,适合本地部署与...
2个月前

Step 3:阶跃星辰最新开源的多模态推理模型

Step 3 是阶跃星辰最新开源的多模态推理模型,采用 MoE 架构,总参数量 321B,激活参数量 38B,上下文长度64k,拥有强大的视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与...
3个月前

iFlow CLI – 心流团队推出的运行在终端中的 AI 智能体

心流(iFlow)CLI 是由心流团队推出的一款运行于终端中的 AI 智能体,支持通过自然语言指令直接在命令行中执行各类任务。它不仅擅长编程相关工作,还可广泛应用于聊天、内容创作、深度研究(Deep ...
3个月前

GLM-4.5:智谱AI推出的新一代开源旗舰模型

GLM-4.5 是由智谱 AI 推出的开源 SOTA 模型,专为智能体应用打造,具备卓越的推理、代码生成和智能体能力。
3个月前

Qwen3-Coder:阿里通义千问推出的代码模型,具备卓越的代码生成和 Agent 能力

Qwen3-Coder 是阿里巴巴通义千问团队发布的最新代码模型,具备卓越的代码生成和 Agent 能力。
3个月前

AniSora:Bilibili 推出的开源动漫视频生成模型

AniSora 是由 Bilibili 推出的开源动漫视频生成模型,旨在通过 AI 技术生成多种风格的动漫视频。它支持从番剧片段、国创动画到漫画改编、VTuber 内容等各种类型的视频生成,并提供关键...
3个月前

ThinkSound:阿里通义开源的旗下首个音频生成模型

ThinkSound 是阿里通义开源的旗下首个音频生成模型,其核心创新在于首次将 CoT(思维链)技术应用于音频生成领域,通过多模态大语言模型(MLLM)与音频生成模型的协同,实现 “像专业音效师一样...
3个月前

OmniGen2 – 智源推出的开源多模态生成模型

OmniGen2是智源研究院推出的开源多模态生成模型,具备文本生成图像、图像编辑、上下文图像生成与视觉理解等核心能力。
4个月前

Qwen VLo:阿里推出的多模态统一理解与生成模型

Qwen VLo 是由阿里通义千问团队推出的多模态统一理解与生成模型,具备强大的图文双向交互能力。它不仅能精准理解图像内容,还能根据自然语言指令进行高质量的图像生成与编辑,支持风格迁移、背景更换、物体...
4个月前