AI工具
Gemma 3 – Google 推出的轻量级、高性能开源模型
Gemma 3 是 Google 推出的轻量级、高性能开源模型,支持多种尺寸(1B、4B、12B 和 27B),专为单 GPU 或 TPU 设计。它支持 140 多种语言,具备高级文本和视觉...
SeedFoley – 字节跳动推出的端到端视频音效生成模型
SeedFoley 是字节跳动推出的端到端视频音效生成模型,通过融合时空视频特征和扩散生成模型,实现音效与视频的高度同步。它支持可变长度视频输入,可在音效准...
飞书知识问答 – 飞书推出的AI知识管理与问答工具
飞书知识问答是飞书推出的一款AI知识管理与问答工具,旨在通过智能技术帮助用户高效整合和检索知识资源。它支持将本地文档、飞书云文档以及企业内部知识库等...
Mistral OCR – Mistral AI 推出的文档识别和理解服务
Mistral OCR 是 Mistral AI 推出的一款先进的光学字符识别(OCR)API,它能够以极高的精度和认知能力解析文档中的各种元素,包括文本、图像、表格、数学公式...
GO-1:智元机器人发布的通用具身基座大模型
GO-1是智元机器人发布的通用具身基座大模型,采用ViLLA架构,结合视觉、语言、隐式动作和执行能力。它通过学习人类视频和少量样本泛化新任务,支持多机器人形...
OpenManus:MetaGPT团队推出的Manus开源复制版
OpenManus 是由 MetaGPT 团队推出的一个开源项目,旨在复刻 Manus 的核心功能。它无需邀请码即可使用,支持网页浏览、文件操作、代码编写等多种任务。项目基...
OWL:CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus
OWL是由CAMEL-AI开源的通用多智能体项目,旨在复刻并超越Manus。它完全开源,具备高性能(GAIA Benchmark达57.7%),支持云端和本地执行,配备Ubuntu和Memory...
QwQ-32B:阿里通义千问开源的最新AI推理模型,支持在消费级显卡上运行
QwQ-32B 是阿里云开源的320亿参数推理模型,具备强大的数学、代码和通用推理能力,性能比肩全球顶尖开源模型。它支持消费级显卡部署,降低硬件门槛,同时集成...
Manus – Monica推出的全球首款通用型Agent产品
Manus是Monica推出的一款全球首款通用型AI代理产品,定位为突破传统AI局限,实现自主执行能力。它基于多智能体系统,能够模拟人类操作,完成从数据分析到生活...
SpeciesNet – 谷歌开源的AI模型,专为识别野生动物而设计
SpeciesNet是谷歌开源的AI模型,专为识别野生动物而设计。它通过分析相机陷阱拍摄的照片,能够将图像分类为超过2000个标签,涵盖动物物种、分类群和非动物对象。