如何在ImageTrans中使用谷歌云服务

谷歌提供文字识别、翻译等API服务。ImageTrans可以调用这些服务来翻译图片。本文将介绍如何进行相关的设置。

前提条件

需要先创建一个Google Cloud Platform的账号。第一年可以获得300美元的赠金，足够完成212,000次请求。

使用谷歌的服务需要科学上网。

首先创建一个项目。

新项目

前往API&Services，搜索”OCR”并启用Cloud Vision。

api services sidemenu

cloud vision search

创建一个新的API key。

new api key

在ImageTrans的偏好设置里填入这个key。

api preferences

之后，我们可以选择Google作为OCR的引擎完成处理。

ocr combobox

类似的，我们可以启用谷歌的机器翻译服务。

cloud translate search

OCR和机器翻译可以公用一个API key。启用后，我们就可以用谷歌进行机器翻译了。

cloud translate

我们可以把图片传到Google Drive上来完成OCR。和上面的Vision OCR不同的是，这种方式完全免费。

前往API&Services，搜索”Drive”并启用它。

Google Drive Search

启用OAuth，这样我们可以登录自己的谷歌账号。

下载下面的jar文件，放到ImageTrans的目录： google_drive_ocr_commandline.jar。更名为google_drive_ocr.jar。
下载插件的压缩包，解压到ImageTrans的plugins目录：commandline_plugin.zip（替换后记得重启ImageTrans）
选择google drive作为OCR引擎以进行OCR操作。

更多说明可以见这个页面。

谷歌最新的人工智能大语言模型Gemini，也可以用于机器翻译和文字识别。

可以参考以下链接：