Claude 3 Haiku 已经可用

15次阅读

共计 735 个字符,预计需要花费 2 分钟才能阅读完成。

前些天,Anthropic 宣布发布 Claude 3 系列模型,包含 Opus(大号),Sonnet(中号)以及 Haiku(小号)三大模型。发布时,只有 Opus 和 Sonnet 立即可用。

根据 Chatbot Arena[1] 的统计,Opus 当前已经在 95% 置信区间内与 OpenAI 当前最强模型 GPT4-Turbo 打成平手;Sonnet 也超越了老款 GPT4-0314 与 GPT4-0613。

根据个人体验,以及在 X,Telegram 群组与其他一些来源收集到的体验信息,Opus 在代码能力普遍被认为相对 GPT4-Turbo 具有一定优势。

昨天,Haiku 正式可用,具有如下主要特点:

  1. 便宜。输出输出分别:0.25$/1.25$ 每百万 Tokens。相比之下,gpt-3.5-turbo 0.5$/1.5$ 每百万 Tokens。
  2. 200K Tokens 上下文窗口,远超 gpt-3.5-turbo(16K)。(单次输出仍然限制为 4K Tokens)
  3. 支持图片输入。
  4. 在各项基准测试中均(显著)领先 gpt-3.5-turbo
  5. 非常快!

同样地,基于个人体验以及身边的统计学,Haiku 确实表现出了很好的综合能力,在大部分需求中可以替代 GPT 3.5。

令我印象最深刻的是,它的识图能力很好。要求其充当 OCR 工具,对中文文本与数学公式的识别准确率远超 gpt-4-vision-preview。除了一些不常见的汉字容易识别出错之外,其余部分都不错。(用过 GPT4V 的应该知道那玩意识别中文烂成啥样)

[1] Chatbot Arena 基于互联网用户盲测,对模型打分排名,相对贴近实际应用,因而有一定实际参考价值。

另外,个人角度上,也希望大家能多关注非 OpenAI 的大语言模型,以及各种开源模型,这对这一领域的健康持续发展也是很重要的。

正文完
 0