SeedFoley – 字节跳动推出的端到端视频音效生成模型 SeedFoley 是字节跳动推出的端到端视频音效生成模型,通过融合时空视频特征和扩散生成模型,实现音效与视频的高度同步。它支持可变长度视频输入,可在音效准确性、同步性和匹配度上达到领先水平。Seed... AI工具 8个月前
飞书知识问答 – 飞书推出的AI知识管理与问答工具 飞书知识问答是飞书推出的一款AI知识管理与问答工具,旨在通过智能技术帮助用户高效整合和检索知识资源。它支持将本地文档、飞书云文档以及企业内部知识库等多源数据接入AI系统,实现快速搜索和精准回答,提升知... AI工具 8个月前
Mistral OCR – Mistral AI 推出的文档识别和理解服务 Mistral OCR 是 Mistral AI 推出的一款先进的光学字符识别(OCR)API,它能够以极高的精度和认知能力解析文档中的各种元素,包括文本、图像、表格、数学公式等,并将图像和 PDF ... AI工具 8个月前
GO-1:智元机器人发布的通用具身基座大模型 GO-1是智元机器人发布的通用具身基座大模型,采用ViLLA架构,结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务,支持多机器人形态并持续进化。GO-1代表了具身智能向通用化... AI工具 8个月前
OpenManus:MetaGPT团队推出的Manus开源复制版 OpenManus 是由 MetaGPT 团队推出的一个开源项目,旨在复刻 Manus 的核心功能。它无需邀请码即可使用,支持网页浏览、文件操作、代码编写等多种任务。项目基于 ReAct 模式运行,依... AI工具 8个月前
OWL:CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus OWL是由CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus。它完全开源,具备高性能(GAIA Benchmark达57.7%),支持云端和本地执行,配备Ubuntu和Memory To... AI工具 8个月前
QwQ-32B:阿里通义千问开源的最新AI推理模型,支持在消费级显卡上运行 QwQ-32B 是阿里云开源的320亿参数推理模型,具备强大的数学、代码和通用推理能力,性能比肩全球顶尖开源模型。它支持消费级显卡部署,降低硬件门槛,同时集成智能体能力,可灵活调整推理过程。采用Apa... AI工具 8个月前
Manus – Monica推出的全球首款通用型Agent产品 Manus是Monica推出的一款全球首款通用型AI代理产品,定位为突破传统AI局限,实现自主执行能力。它基于多智能体系统,能够模拟人类操作,完成从数据分析到生活规划等复杂任务。其核心理念是将AI的思... AI工具 6个月前
SpeciesNet – 谷歌开源的AI模型,专为识别野生动物而设计 SpeciesNet是谷歌开源的AI模型,专为识别野生动物而设计。它通过分析相机陷阱拍摄的照片,能够将图像分类为超过2000个标签,涵盖动物物种、分类群和非动物对象。 AI工具 8个月前
CogView4 – 智谱推出的开源文生图模型,支持中英双语输入,擅长生成含汉字图像 CogView4是北京智谱推出的开源文生图模型,支持中英双语输入,擅长生成含汉字图像。它在DPG-Bench测试中排名第一,性能卓越。具备任意分辨率生成和长提示词输入能力,技术领先,遵循Apache ... AI工具 8个月前