AI小助手

帅气的我简直无法用语言描述!

OpenAI 发布 Agent 工具包:加速 AI Agents 的构建和部署

2025年03月12日,OpenAI 推出了一系列新工具和 API,旨在帮助开发者更轻松地创建能够自动完成任务的 AI Agents(智能体)。尽管此前推出的高级推理和多模态交互模型为 Agent 的...
7个月前

SeedFoley – 字节跳动推出的端到端视频音效生成模型

SeedFoley 是字节跳动推出的端到端视频音效生成模型,通过融合时空视频特征和扩散生成模型,实现音效与视频的高度同步。它支持可变长度视频输入,可在音效准确性、同步性和匹配度上达到领先水平。Seed...
7个月前

飞书知识问答 – 飞书推出的AI知识管理与问答工具

飞书知识问答是飞书推出的一款AI知识管理与问答工具,旨在通过智能技术帮助用户高效整合和检索知识资源。它支持将本地文档、飞书云文档以及企业内部知识库等多源数据接入AI系统,实现快速搜索和精准回答,提升知...
7个月前

Mistral OCR – Mistral AI 推出的文档识别和理解服务

Mistral OCR 是 Mistral AI 推出的一款先进的光学字符识别(OCR)API,它能够以极高的精度和认知能力解析文档中的各种元素,包括文本、图像、表格、数学公式等,并将图像和 PDF ...
7个月前

GO-1:智元机器人发布的通用具身基座大模型

GO-1是智元机器人发布的通用具身基座大模型,采用ViLLA架构,结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务,支持多机器人形态并持续进化。GO-1代表了具身智能向通用化...
7个月前

QQ浏览器推出AI问答功能“元宝快答”

QQ浏览器宣布推出AI问答功能——“元宝快答”,旨在为用户提供更快速、更精炼的搜索答案体验。该功能基于腾讯混元的“快思考”模型Turbo S,结合了搜索增强技术,能够快速检索全网实时信息,包括公众号等...
7个月前

OpenManus:MetaGPT团队推出的Manus开源复制版

OpenManus 是由 MetaGPT 团队推出的一个开源项目,旨在复刻 Manus 的核心功能。它无需邀请码即可使用,支持网页浏览、文件操作、代码编写等多种任务。项目基于 ReAct 模式运行,依...
8个月前

OWL:CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus

OWL是由CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus。它完全开源,具备高性能(GAIA Benchmark达57.7%),支持云端和本地执行,配备Ubuntu和Memory To...
8个月前

QwQ-32B:阿里通义千问开源的最新AI推理模型,支持在消费级显卡上运行

QwQ-32B 是阿里云开源的320亿参数推理模型,具备强大的数学、代码和通用推理能力,性能比肩全球顶尖开源模型。它支持消费级显卡部署,降低硬件门槛,同时集成智能体能力,可灵活调整推理过程。采用Apa...
8个月前

Manus – Monica推出的全球首款通用型Agent产品

Manus是Monica推出的一款全球首款通用型AI代理产品,定位为突破传统AI局限,实现自主执行能力。它基于多智能体系统,能够模拟人类操作,完成从数据分析到生活规划等复杂任务。其核心理念是将AI的思...
5个月前