首页 / 博客 / 图片翻译 / 音视频翻译 / 支持 / 捐助 / 订阅
如何检测图像中文字的颜色
检测图像中文字的颜色,包括文字背景的颜色和描边的颜色,可以用于版面还原、翻译等操作。
原图:

翻译的图片:

实现原理
对于背景颜色,可以使用KMeans对颜色聚类,找到图像的主导色。
对于文字颜色,可以做轮廓检测,计算文字轮廓像素的平均值,并排除与背景颜色相近的像素。

但如果背景比较复杂,并且还需要提取描边颜色、提取每个字符的颜色,传统图像处理方法效果一般。可以使用卷积神经网络进行提取。
计算机辅助图片翻译软件ImageTrans便集成了上述算法。
示例
下面是一些操作示例。
示例一
许多CG图,经常用不同的颜色来区分不同人物的对话。

ImageTrans可以检测描边颜色和文字颜色,以下是原始识别结果。

可以看到,文字颜色和描边颜色被识别出来了,但不够准确。
我们可以在项目设置中预先定义几个样式,确定每个样式使用的颜色。

之后,执行颜色匹配操作,根据文字颜色匹配样式。

这样就解决了识别的颜色不够准确的问题

示例二
有的文字使用了富文本格式,一行文字可能存在多种颜色。ImageTrans支持识别每个字符的样式,并输出带有富文本标签的结果。

© 2026 BasicCAT ― Powered by Jekyll and Textlog theme