谷歌提供文字识别、翻译等API服务。ImageTrans可以调用这些服务来翻译图片。本文将介绍如何进行相关的设置。

前提条件

需要先创建一个Google Cloud Platform的账号。第一年可以获得300美元的赠金,足够完成212,000次请求。

使用谷歌的服务需要科学上网。

新项目

首先创建一个项目。

新项目

启用Cloud Vision OCR

前往API&Services,搜索”OCR”并启用Cloud Vision。

api services sidemenu

cloud vision search

新API Key

创建一个新的API key。

new api key

在ImageTrans的偏好设置里填入这个key。

api preferences

之后,我们可以选择Google作为OCR的引擎完成处理。

ocr combobox

启用机器翻译

类似的,我们可以启用谷歌的机器翻译服务。

cloud translate search

OCR和机器翻译可以公用一个API key。启用后,我们就可以用谷歌进行机器翻译了。

cloud translate

Google Drive OCR

我们可以把图片传到Google Drive上来完成OCR。和上面的Vision OCR不同的是,这种方式完全免费。

启用Drive API

前往API&Services,搜索”Drive”并启用它。

Google Drive Search

启用OAuth

启用OAuth,这样我们可以登录自己的谷歌账号。

  1. 新建一个OAuth screen,类型选择External。

    oauth

  2. 填入必需的信息并添加测试账号。

    add test user

  3. 新建一个OAuth client id。选择桌面程序。

    new credentials

    new oauth client

  4. 下载JSON文件,命名为credentials.json后放到ImageTrans的目录里。

安装ImageTrans的插件

  1. 下载下面的jar文件,放到ImageTrans的目录: google_drive_ocr_commandline.jar。更名为google_drive_ocr.jar
  2. 下载插件的压缩包,解压到ImageTrans的plugins目录:google_drive.zip
  3. 选择google drive作为OCR引擎以进行OCR操作。

    ocr combobox google drive

更多说明可以见这个页面

Gemini

谷歌最新的人工智能大语言模型Gemini,也可以用于机器翻译。

可以参考这个issue进行使用。