<aside> <img src="notion://custom_emoji/e1a710c4-4af5-4531-80d8-3a8e15ec82ab/12f5c3ba-fe9e-80d2-8c1f-007aaa07dfba" alt="notion://custom_emoji/e1a710c4-4af5-4531-80d8-3a8e15ec82ab/12f5c3ba-fe9e-80d2-8c1f-007aaa07dfba" width="40px" />

欢迎使用「万能识别」~

前言

「万能识别」是一个强大的Quicker动作,它利用AI多模态大模型的能力,可以识别图片中的各种信息,包括文字、表格、结构化文字等。本教程将指导初学者如何安装和使用这个动作。

https://getquicker.net/Sharedaction?code=9062589a-dba2-425f-860c-08dcf8c7ad5e

1. 安装准备

1.1 安装Quicker

首先,你需要安装Quicker软件。访问以下链接下载并安装Quicker:

https://getquicker.net/

1.2 安装「万能识别」动作

安装完Quicker后,点击以下链接安装「万能识别」动作:

万能识别 - Quicker动作

2. 获取API Key

「万能识别」动作支持三种AI模型:智谱、通义千问和混元。你需要选择一个模型并获取相应的API Key。以下是模型对比和获取步骤:

模型 优点 缺点 免费额度
智谱 速度较快、准确度高 单次输出长度较短(最多约1600字) 多模态模型可领取的免费tokens大于2000万,但有效期1个月
通义千问 单次输出长度较长(最多约3000字),某些场景很准确,连续对话性能较好 容易识别错误、识别不稳定、准确性差 多模态模型免费赠送100万tokens,有效期6个月
混元 速度快、准确性高、单次输出长度较长(最多约4000字) 模型输入较少、连续对话性能差、模型有时候不听话 多模态模型免费赠送100万tokens,有效期1年

2.1 智谱API Key

2.2 通义千问API Key