---
title: Anthropic Claude 系列 Tools Calling 评测
description: >-
使用 LobeChat 测试 Anthropic Claude 系列模型(Claude 3.5 sonnet / Claude 3 Opus /
Claude 3 haiku) 的工具调用(Function Calling)能力,并展现评测结果
tags:
- Tools Calling
- Benchmark
- Function Calling 评测
- 工具调用
- 插件
---
# Anthropic Claude 系列 Tools Calling
Anthropic Claude 系列模型 Tools Calling 能力一览:
| 模型 | 支持 Tools Calling | 流式 (Stream) | 并发(Parallel) | 简单指令得分 | 复杂指令 |
| --- | --- | --- | --- | --- | --- |
| Claude 3.5 Sonnet | ✅ | ✅ | ✅ | 🌟🌟🌟 | 🌟🌟 |
| Claude 3 Opus | ✅ | ✅ | ❌ | 🌟 | ⛔️ |
| Claude 3 Sonnet | ✅ | ✅ | ❌ | 🌟🌟 | ⛔️ |
| Claude 3 Haiku | ✅ | ✅ | ❌ | 🌟🌟 | ⛔️ |
## Claude 3.5 Sonnet
### 简单调用指令:天气查询
测试指令:指令 ①
Tools Calling 原始输出:
```yml
```
### 复杂调用指令:文生图
测试指令:指令 ②
从上述视频中可以看到:
1. Sonnet 3.5 支持流式 Tools Calling 和 Parallel Tools Calling;
2. 在流式 Tools Calling 时,表现出来的特征是在创建长句会等待住(详见 Tools Calling 原始输出 `[chunk 40]` 和 `[chunk 41]` 中间的耗时达到 6s)。所以相对来说会在 Tools Calling 的起始阶段有一个较长的等待时间。
Tools Calling 原始输出:
```yml
```
## Claude 3 Opus
### 简单调用指令:天气查询
测试指令:指令 ①
从上述视频中看到:
1. Claude 3 Opus 在调用 Tools 的起点会输出一段 `` 标签的内容,这段内容对于用户来说几乎没有什么帮助,反而带来了较多的 Token 消耗;
2. Opus 会触发两次 Tools Calling,说明它并不支持 Parallel Tools Calling;
3. 从 Tools Calling 的原始输出来看, Opus 也是支持流式 Tools Calling 的
Tools Calling 原始输出:
### 复杂调用指令:文生图
测试指令:指令 ②
从上述视频中看到:
1. 结合简单任务, Opus 的工具调用一定会输出 `` 标签,这其实对体验影响非常大
2. Opus 输出的 prompts 字段是字符串,而不是数组,导致报错,无法正常调用插件。
Tools Calling 原始输出:
## Claude 3 Sonnet
### 简单调用指令:天气查询
测试指令:指令 ①
从上述视频中可以看出,Claude 3 Sonnet 会调用两次 Tools Calling,说明它并不支持 Parallel Tools Calling。
Tools Calling 原始输出:
### 复杂调用指令:文生图
测试指令:指令 ②
从上述视频中可以看到, Sonnet 3 在复杂指令调用下就失败了。报错原因是 prompts 原本预期为一个数组,但是生成的却是一个字符串。
Tools Calling 原始输出:
## Claude 3 Haiku
从上述视频中可以看出:
1. Claude 3 Haiku 会调用两次 Tools Calling,说明它也不支持 Parallel Tools Calling;
2. Haiku 并没有回答好的,也是直接调用的工具;
### 复杂调用指令:文生图
测试指令:指令 ②
从上述视频中可以看到, Haiku 3 在复杂指令调用下也是失败的。报错原因同样是 prompts 生成了字符串而不是数组。
Tools Calling 原始输出: