最近,我想玩下原版日文的GBA游戏《逆转裁判》。我喜欢玩原版日文的感觉,也希望借此提升自己的日语水平。但由于我的日语能力有限,仍然需要借助屏幕翻译工具来辅助。

ImageTrans就是这样一款程序。它集成了多种OCR和翻译引擎,可以作为实时屏幕翻译工具,用于玩视觉小说等游戏以及阅读漫画。

它的工作流程如下:

  1. 程序检测用户指定区域的屏幕截图是否发生变化,并判断当前画面是否已经稳定。
  2. 使用OCR识别该区域中的文字。
  3. 使用像ChatGPT、DeepSeek这样的 AI 翻译引擎对文字进行翻译。
  4. (可选)添加读音标注(日语的振假名或中文的拼音),使用语音合成引擎朗读文本。
  5. (可选)保存识别结果,供后续学习使用。

整个过程是自动完成的。当然,也可以手动截取屏幕并让程序进行翻译,因为有时可能需要读取指定区域之外的文本。

下面是一个演示视频。虽然OCR和翻译需要一些时间完成,还有错误,但还是可以玩的。

ImageTrans还可以翻译其他媒介,例如书籍和漫画。它是一个集成化的翻译工具,就像翻译领域的Photoshop一样。

ImageTrans可以在Windows、macOS和Linux这样的桌面平台使用,目前暂不支持安卓和iOS等手机操作系统。

优化翻译速度和质量

实时翻译,每次只翻译框中的文字,缺少上下文,翻译质量不高,而且每次都要执行翻译操作,速度较慢。

有很多游戏的文本可以提取出来,或者有现成的转录好的。那我们可以预先用大模型进行翻译,之后屏幕翻译时,可以匹配原文和OCR的结果,直接获取已经翻译好的文本,速度快,质量又好。这一功能在ImageTrans中叫做翻译记忆。

下面是用DeepSeek翻译的一个简单的对比结果,可以看到,上下文更多时,翻译的质量更高。

原文 全文翻译 逐句翻译
(うう‥‥。 キンチョーするなあ‥‥) (呜……好紧张啊……) (呜……好紧张啊……)
‥‥なるほどくん! ……成步堂君! 原来如此君!
ふう。 なんとか、間にあったわね。 呼。总算是赶上了呢。 呼。总算是赶上了呢。
どうかしら? 初めての法廷は。 感觉如何?第一次上法庭。 怎么样?第一次上法庭的感觉如何?
こ、こんなにドキドキするの、 小学校の学級裁判のとき以来です。 这、这么心跳加速的,还是小学班级审判以来头一回。 这样心跳加速的感觉,自小学班级审判以来还是头一回。
‥‥それはそれは。 ずいぶん、ごぶさたしてるのね。 ……那可真是。还真是久违了呢。 哎呀呀,真是好久不见了呢。

另外,ImageTrans支持模糊匹配原文和OCR的文本,即使OCR识别有误,也能匹配。并且能避免因为OCR有误而导致翻译错误的问题。

例如借りがあるんですよ。 ヤツには。可能会被误识别为借りがあるんですよ。 ャツには。。其中ヤ变成了拗音形式的ャ,可能导致翻译错误。例如DeepSeek就会翻译为我欠你一份人情,而不是欠了他一份人情。匹配预先根据提取的原文翻译好的文本则没有这样的问题。

使用翻译记忆的演示视频: