文心大模型4.5-百度推出的新一代原生多模态基础大模型

文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻...

Gemma 3 – Google 推出的轻量级、高性能开源模型

Gemma 3 是 Google 推出的轻量级、高性能开源模型,支持多种尺寸(1B、4B、12B 和 27B),专为单 GPU 或 TPU 设计。它支持 140 多种语言,具备高级文本和视觉...

OpenAI 发布 Agent 工具包:加速 AI Agents 的构建和部署

2025年03月12日,OpenAI 推出了一系列新工具和 API,旨在帮助开发者更轻松地创建能够自动完成任务的 AI Agents(智能体)。尽管此前推出的高级推理和多模态交...

SeedFoley – 字节跳动推出的端到端视频音效生成模型

SeedFoley 是字节跳动推出的端到端视频音效生成模型,通过融合时空视频特征和扩散生成模型,实现音效与视频的高度同步。它支持可变长度视频输入,可在音效准...

飞书知识问答 – 飞书推出的AI知识管理与问答工具

飞书知识问答是飞书推出的一款AI知识管理与问答工具,旨在通过智能技术帮助用户高效整合和检索知识资源。它支持将本地文档、飞书云文档以及企业内部知识库等...

Mistral OCR – Mistral AI 推出的文档识别和理解服务

Mistral OCR 是 Mistral AI 推出的一款先进的光学字符识别(OCR)API,它能够以极高的精度和认知能力解析文档中的各种元素,包括文本、图像、表格、数学公式...

GO-1:智元机器人发布的通用具身基座大模型

GO-1是智元机器人发布的通用具身基座大模型,采用ViLLA架构,结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务,支持多机器人形...

QQ浏览器推出AI问答功能“元宝快答”

QQ浏览器宣布推出AI问答功能——“元宝快答”,旨在为用户提供更快速、更精炼的搜索答案体验。该功能基于腾讯混元的“快思考”模型Turbo S,结合了搜索增强技术,能...

OpenManus:MetaGPT团队推出的Manus开源复制版

OpenManus 是由 MetaGPT 团队推出的一个开源项目,旨在复刻 Manus 的核心功能。它无需邀请码即可使用,支持网页浏览、文件操作、代码编写等多种任务。项目基...

OWL:CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus

OWL是由CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus。它完全开源,具备高性能(GAIA Benchmark达57.7%),支持云端和本地执行,配备Ubuntu和Memory...
1 3 4 5 6 7 8