<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>BasicCAT — Computer-Aided Translation (CAT) Tools</title>
    <description>BasicCAT Website</description>
    <link>https://www.basiccat.org/</link>
    <atom:link href="https://www.basiccat.org/feed.xml" rel="self" type="application/rss+xml"/>
    <pubDate>Fri, 06 Mar 2026 13:07:21 +0000</pubDate>
    <lastBuildDate>Fri, 06 Mar 2026 13:07:21 +0000</lastBuildDate>
    <generator>Jekyll v3.10.0</generator>
    
    
      <item>
        <title>如何扫描照相底片</title>
        <description>&lt;p&gt;以前的胶卷相机拍的照片，到照相馆冲印后一般都会留下底片（胶片）。我最近就翻出了不少这种底片。底片里面是一种银盐，具有高度感光性。一般的底片的规格是宽35毫米，高24毫米，冲印出来的内容是反色的负片。&lt;/p&gt;

&lt;p&gt;因为底片很小，而且外面还有一层色罩，想要扫描成数字版就不是一件容易的事情。常见的方式是使用专业的胶片扫描仪进行扫描。如果没有扫描仪，也可以用手机或者相机进行翻拍。&lt;/p&gt;

&lt;h2 id=&quot;相机翻拍&quot;&gt;相机翻拍&lt;/h2&gt;

&lt;ol&gt;
  &lt;li&gt;
    &lt;p&gt;底片是透明的，需要透射光才能看出内容。我们可以准备一个白色的面光源，比如手机屏幕、吸顶灯。&lt;/p&gt;

    &lt;p&gt;&lt;img src=&quot;/album/negative/negative_on_screen.jpg&quot; alt=&quot;屏幕上的底片&quot; /&gt;&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;使用微距镜头进行拍摄。如果用手机，可以通过外接的方式接入一个。&lt;/p&gt;

    &lt;p&gt;&lt;img src=&quot;/album/negative/macro_lens.jpg&quot; alt=&quot;微距镜头&quot; /&gt;&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;拍摄后，可以用Adobe Photoshop做进一步处理：反色、通过“自动颜色”去除色罩。&lt;/p&gt;

    &lt;p&gt;&lt;img src=&quot;/album/negative/invert.jpg&quot; alt=&quot;反色的&quot; /&gt;&lt;/p&gt;

    &lt;p&gt;&lt;img src=&quot;/album/negative/auto_color_result.jpg&quot; alt=&quot;自动颜色结果&quot; /&gt;&lt;/p&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;这里因为是用的手机，所以存在清晰度不够、色彩不准、屏幕波纹等问题。如果用专业的相机，效果应该是不错的，可以比扫描仪有更好的锐度。另外专业相机可以保存文件为raw格式，更方便校色。&lt;/p&gt;

&lt;h2 id=&quot;扫描仪扫描&quot;&gt;扫描仪扫描&lt;/h2&gt;

&lt;p&gt;选择一款支持扫描底片的平板扫描仪，比如爱普生v850。我这里用的是爱普生v300，它具备透扫器和底片夹，支持扫描底片。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/negative/epson-v300.jpg&quot; alt=&quot;爱普生v300&quot; /&gt;&lt;/p&gt;

&lt;p&gt;可以使用厂家提供的Epson Scan进行扫描，它能自动裁剪底片，反色和去色罩。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/negative/epson-scan.jpg&quot; alt=&quot;Epson Scan&quot; /&gt;&lt;/p&gt;

&lt;p&gt;如果只想得到原始图像，可以使用&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;，通过TWAIN、ICA和SANE等接口进行扫描。&lt;/p&gt;

&lt;p&gt;之后，可以用ImageTrans或者其他软件进行裁剪、反色和去色罩的操作。&lt;/p&gt;

&lt;p&gt;使用ImageTrans扫描：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/negative/imagetrans_transparency_unit.jpg&quot; alt=&quot;ImageTrans扫描界面&quot; /&gt;&lt;/p&gt;

&lt;p&gt;使用ImageTrans裁剪、反色和去色罩后的结果：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/negative/imagetrans_processed_photo.jpg&quot; alt=&quot;ImageTrans处理结果&quot; /&gt;&lt;/p&gt;
</description>
        <pubDate>Fri, 27 Feb 2026 12:28:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/how-to-scan-negatives/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/how-to-scan-negatives/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>文档扫描仪协议逆向工程</title>
        <description>&lt;p&gt;扫描仪一般支持通过SCSI、USB和网络等接口去访问。如何控制扫描仪执行扫描任务，返回扫描数据，需要遵循一套规范。现代的扫描仪一般都支持eSCL这一标准，通过网络去连接。但不是所有扫描仪都支持这种标准，通常都是厂家自己定义了一套协议，并提供驱动供应用软件进行调用。&lt;/p&gt;

&lt;p&gt;但也不是所有操作系统和CPU架构都有驱动可以用，于是有人通过逆向工程，破解了这些协议，使得不用官方驱动，也能使用这些扫描仪。这类软件有开源的SANE和商业的ExactScan、VueScan等等。另外，自己编写驱动，可以对扫描仪做到精准的控制，比如色调、是否启用卡纸检测传感器、实时预览扫描结果等等。并且，随着浏览器支持控制USB设备，我们甚至能直接在浏览器操作扫描仪。&lt;/p&gt;

&lt;p&gt;下面是对扫描仪进行逆向的一些方式。&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;直接借鉴SANE的源代码。SANE逆向了大多数扫描仪，我们可以直接阅读它的代码了解各种扫描仪的通讯方法。&lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;在有驱动的环境对USB传输进行抓包。比如以下是Linux上的操作方式：&lt;/p&gt;

    &lt;p&gt;开启抓包：&lt;/p&gt;

    &lt;div class=&quot;language-bash highlighter-rouge&quot;&gt;&lt;div class=&quot;highlight&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;&lt;span class=&quot;nb&quot;&gt;sudo &lt;/span&gt;modprobe usbmon
&lt;span class=&quot;nb&quot;&gt;sudo &lt;/span&gt;tcpdump &lt;span class=&quot;nt&quot;&gt;-i&lt;/span&gt; usbmon2 &lt;span class=&quot;nt&quot;&gt;-w&lt;/span&gt; scan.pcap
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;    &lt;/div&gt;

    &lt;p&gt;使用SANE扫描一份文档：&lt;/p&gt;

    &lt;div class=&quot;language-bash highlighter-rouge&quot;&gt;&lt;div class=&quot;highlight&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;scanimage &lt;span class=&quot;nt&quot;&gt;-o&lt;/span&gt; t.jpg &lt;span class=&quot;nt&quot;&gt;-l&lt;/span&gt; 0 &lt;span class=&quot;nt&quot;&gt;-t&lt;/span&gt; 0 &lt;span class=&quot;nt&quot;&gt;-x&lt;/span&gt; 5 &lt;span class=&quot;nt&quot;&gt;-y&lt;/span&gt; 5
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;    &lt;/div&gt;

    &lt;p&gt;然后用Ctrl+C终止上面的命令保存结果。之后用WireShark查看结果。&lt;/p&gt;

    &lt;p&gt;这种方式需要对USB协议有比较强的分析能力，难度比较大。&lt;/p&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;我用Qoder让AI基于SANE的Pixma驱动写了一个Python+libusb控制佳能Lide 300的Python程序，测试可以实现扫描：&lt;a href=&quot;https://github.com/xulihang/Canon-Lide-300-Python-USB-Driver&quot;&gt;https://github.com/xulihang/Canon-Lide-300-Python-USB-Driver&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;对于普通用户，直接使用现成的扫描软件就行了，比如&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;，支持TWAIN、WIA、ICA、SANE和eSCL等各种扫描API，可以支持在各种操作系统上对大多数扫描仪的调用。扫描的文档能进一步处理，进行翻译、OCR和生成可搜索的PDF等操作。&lt;/p&gt;

</description>
        <pubDate>Fri, 27 Feb 2026 02:42:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/reverse-engineer-document-scanner/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/reverse-engineer-document-scanner/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>编译macOS版SANE</title>
        <description>&lt;p&gt;最近买了一台富士通的Fi-6130扫描仪，500多元，是比较便宜的馈纸式扫描仪。我想在macOS上使用它，但发现这种比较老的低端的扫描仪，官方已经不提供驱动了，只有通过SANE或者VueScan去使用。&lt;/p&gt;

&lt;p&gt;SANE可以通过homebrew安装，不过因为我想编一个分发方便的版本，所有决定重新编译。下面是我的操作步骤。&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;
    &lt;p&gt;安装homebrew。&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;安装相关依赖。&lt;/p&gt;

    &lt;div class=&quot;language-bash highlighter-rouge&quot;&gt;&lt;div class=&quot;highlight&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;brew &lt;span class=&quot;nb&quot;&gt;install &lt;/span&gt;autoconf automake libtool gettext git pkg-config libusb libjpeg
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;    &lt;/div&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;到sane官网下载源码包。&lt;/p&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;执行以下命令进行编译：&lt;/p&gt;

    &lt;div class=&quot;language-bash highlighter-rouge&quot;&gt;&lt;div class=&quot;highlight&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;./autogen.sh
./configure &lt;span class=&quot;nt&quot;&gt;--prefix&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;=&lt;/span&gt;/usr/local &lt;span class=&quot;se&quot;&gt;\&lt;/span&gt;
            &lt;span class=&quot;nv&quot;&gt;CPPFLAGS&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;=&lt;/span&gt;&lt;span class=&quot;s2&quot;&gt;&quot;-I/usr/local/include -I/opt/homebrew/include&quot;&lt;/span&gt; &lt;span class=&quot;se&quot;&gt;\&lt;/span&gt;
            &lt;span class=&quot;nv&quot;&gt;LDFLAGS&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;=&lt;/span&gt;&lt;span class=&quot;s2&quot;&gt;&quot;-L/usr/local/lib -L/opt/homebrew/lib&quot;&lt;/span&gt;
make
make &lt;span class=&quot;nb&quot;&gt;install&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;    &lt;/div&gt;
  &lt;/li&gt;
  &lt;li&gt;
    &lt;p&gt;如果要分发到没有homebrew的环境，可以用&lt;code class=&quot;language-plaintext highlighter-rouge&quot;&gt;otool&lt;/code&gt;和&lt;code class=&quot;language-plaintext highlighter-rouge&quot;&gt;install_name_tool&lt;/code&gt;再改一下path。&lt;/p&gt;
  &lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;的macOS版已经集成了SANE，可以直接调用这种老的扫描仪进行扫描。&lt;/p&gt;

</description>
        <pubDate>Tue, 24 Feb 2026 02:42:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/compile-sane-for-macos/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/compile-sane-for-macos/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>文档扫描应用程序接口概述</title>
        <description>&lt;p&gt;现代文档扫描仪大概在20世纪80年代出现，为了连接扫描仪和电脑，出现了很多文档扫描的API接口：TWAIN、ICA、SANE、WIA、eSCL等等。本文会对这些协议做个概述。&lt;/p&gt;

&lt;h2 id=&quot;twain&quot;&gt;TWAIN&lt;/h2&gt;

&lt;p&gt;扫描仪厂商会给主流的操作系统，通常是Windows和macOS提供专门的扫描软件，TWAIN是一种通用的调用厂商提供的软件进行扫描的接口。它和UI有比较强的绑定，虽然可以不显示默认的扫描界面，但执行操作时还是有可能显示不同的UI。&lt;/p&gt;

&lt;p&gt;因为直接调用厂商提供的软件，拥有比较多的能力，比如逐行获取扫描的图像、检测图像中的条形码、画面增强等等。&lt;/p&gt;

&lt;p&gt;使用TWAIN调用Epson Scan进行扫描：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/document-scanning-api/epson-scan.jpg&quot; alt=&quot;epson twain&quot; /&gt;&lt;/p&gt;

&lt;p&gt;TWAIN主要用于Windows。&lt;/p&gt;

&lt;h2 id=&quot;wia&quot;&gt;WIA&lt;/h2&gt;
&lt;p&gt;WIA是Windows官方支持的图像获取设备的接口。安装扫描仪驱动后，一般就可以通过Windows的传真和扫描应用进行扫描。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/document-scanning-api/windows-fax.jpg&quot; alt=&quot;windows fax&quot; /&gt;&lt;/p&gt;

&lt;p&gt;也可以通过COM，使用程序语言去调用，支持显示UI或者不显示UI。UI的话，是统一的WIA专门的版本。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/document-scanning-api/wia.jpg&quot; alt=&quot;wia&quot; /&gt;&lt;/p&gt;

&lt;p&gt;使用WIA就不能使用厂商提供的专门的扫描程序了。&lt;/p&gt;

&lt;h2 id=&quot;ica&quot;&gt;ICA&lt;/h2&gt;

&lt;p&gt;ICA是苹果官方提供的接口。安装专门的ICA驱动后，就可以在图像捕获应用中看到定制化的扫描界面了。也支持通过接口不显示UI进行调用。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/document-scanning-api/imagecapture.jpg&quot; alt=&quot;ica&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;sane&quot;&gt;SANE&lt;/h2&gt;

&lt;p&gt;SANE是类Unix系统（主要是Linux）上主要的扫描接口。也可以在macOS上使用。&lt;/p&gt;

&lt;p&gt;SANE的扫描仪驱动主要是通过逆向工程编写的，当然也有厂商专门提供了SANE驱动，比如Epson。&lt;/p&gt;

&lt;p&gt;SANE一开始就是为了网络扫描设计的，所以它不像TWAIN那样和UI强绑定。&lt;/p&gt;

&lt;h2 id=&quot;escl&quot;&gt;eSCL&lt;/h2&gt;

&lt;p&gt;eSCL是由苹果推动的一个基于HTTP的网络文档扫描协议，只要扫描仪连接了网络，就能直接通过这一接口进行扫描。现在由佳能、惠普等厂商发起的Mopria组织维护。&lt;/p&gt;

&lt;h2 id=&quot;扫描软件&quot;&gt;扫描软件&lt;/h2&gt;

&lt;h3 id=&quot;桌面软件&quot;&gt;桌面软件&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;NAPS2：支持TWAIN、WIA、SANE、eSCL、ICA，是一个开源的、一站式跨平台的扫描软件。&lt;/li&gt;
  &lt;li&gt;&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;：基于WIA、SANE、ICA和eSCL集成了文档扫描功能，可以直接扫描文档，完成OCR、翻译、可搜索PDF生成等任务。&lt;/li&gt;
  &lt;li&gt;VueScan：逆向了绝大多数扫描仪的驱动，不需要额外安装驱动就能直接调用扫描仪。&lt;/li&gt;
  &lt;li&gt;SilverFast：在扫描照片、底片领域非常专业，一般买扫描仪都会附赠这一软件。&lt;/li&gt;
&lt;/ul&gt;

&lt;h3 id=&quot;sdk&quot;&gt;SDK&lt;/h3&gt;

&lt;ul&gt;
  &lt;li&gt;Dynamsoft: Dynamic Web TWAIN&lt;/li&gt;
  &lt;li&gt;Asprise: JSane、JTWAIN、Scanner.js&lt;/li&gt;
  &lt;li&gt;Leadtools&lt;/li&gt;
  &lt;li&gt;Vintasoft&lt;/li&gt;
  &lt;li&gt;ScanOnWeb&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;在这些SDK中，以Dynamic Web TWAIN支持的协议最全，维护程度最高。&lt;/p&gt;

</description>
        <pubDate>Sat, 31 Jan 2026 11:32:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/overview-of-document-scanning-interfaces/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/overview-of-document-scanning-interfaces/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>支持国产操作系统的国产OCR和计算机辅助翻译软件</title>
        <description>&lt;p&gt;这几年国内一直在推信创，我老家海宁的公务员都用上了华为鲲鹏CPU上运行的国产统信操作系统。&lt;/p&gt;

&lt;p&gt;其实国产系统和硬件已经有很多年的发展了。国产CPU有MIPS和Loongson架构的龙芯、x86架构的兆芯和海光、arm架构的飞腾、鲲鹏。国产系统从早期的蓝点Linux、中科红旗Linux到现在的银河麒麟、深度、统信、安同等发行版。早期硬件水平和软件生态都远远不如Windows平台，现在逐渐跟了上来，日常办公已经不是问题了。&lt;/p&gt;

&lt;p&gt;本站点提供若干基于JavaFX的跨平台OCR和计算机辅助翻译软件，可以在不同CPU架构的国产操作系统上运行。作为原生桌面应用，性能、体验和安全性等方面比网页应用还是好不少的。&lt;/p&gt;

&lt;h2 id=&quot;imagetrans&quot;&gt;ImageTrans&lt;/h2&gt;

&lt;p&gt;ImageTrans是一款计算机辅助图片翻译软件，它基于ONNXRuntime集成了百度的PaddleOCR、mangaOCR、YOLO等OCR和深度学习模型，支持识别图片中的文字，翻译并在原图位置回填译文。此外也支持文档扫描、可搜索PDF生成、屏幕翻译等日常办公操作。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/imagetrans-kylinos.jpg&quot; alt=&quot;imagetrans kylinos&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;basiccat&quot;&gt;BasicCAT&lt;/h2&gt;

&lt;p&gt;BasicCAT是一款专业的计算机辅助翻译软件，可以处理Word、Excel、PowerPoint等文件的翻译。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/main.png&quot; alt=&quot;BasicCAT&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;silhouette&quot;&gt;Silhouette&lt;/h2&gt;

&lt;p&gt;Silhouette是一款计算机辅助音视频翻译软件，可以基于Whisper识别语音，生成字幕并翻译。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/silhouette/screenshot_zh.webp&quot; alt=&quot;Silhouette&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;aligner&quot;&gt;Aligner&lt;/h2&gt;

&lt;p&gt;Aligner是一个语料对齐软件，可以制作语料，为翻译提供参考。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/ass-aligning/home.jpg&quot; alt=&quot;Aligner&quot; /&gt;&lt;/p&gt;

&lt;h2 id=&quot;在国产系统上的问题&quot;&gt;在国产系统上的问题&lt;/h2&gt;

&lt;p&gt;Linux桌面软件对中文输入法的支持不佳，可能存在输入法不能跟随光标的问题。推荐更新系统到最新版本，使用Wayland提供桌面服务。&lt;/p&gt;

</description>
        <pubDate>Sat, 31 Jan 2026 11:08:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/OCR-and-CAT-tools-running-on-Chinese-Linux/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/OCR-and-CAT-tools-running-on-Chinese-Linux/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>批量OCR和翻译图片和PDF文件</title>
        <description>&lt;p&gt;ImageTrans在v5.6.0集成了一个Hot Folder功能，它可以监控某个文件夹是否有新的文件加入，如果有，它会以当前项目为模板，执行指定的工作流来处理这些文件。&lt;/p&gt;

&lt;p&gt;下面是相关操作事项：&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;新建一个项目，设置好语言、OCR、自定义工作流等常规操作。&lt;/li&gt;
  &lt;li&gt;如果要支持导入和导出PDF，需要在项目设置中提前定义导入导出的设置，并在工作流中添加导出PDF。&lt;/li&gt;
  &lt;li&gt;通过菜单栏-工具-Hot Folder，打开Hot Folder，设置好需要监控的文件夹后就可以批量OCR和翻译文件了。&lt;/li&gt;
&lt;/ol&gt;

</description>
        <pubDate>Mon, 05 Jan 2026 11:00:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/batch-ocr-and-translate-image-and-PDF/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/batch-ocr-and-translate-image-and-PDF/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>转换超星图书馆下载的PDZ文件为PDF</title>
        <description>&lt;p&gt;上大学时一直用超星的汇雅图书馆阅读电子扫描版的图书，毕业了我以为不能用了，最近发现只要注册一个个人账号，然后输入之前学校的学号就可以继续使用了。&lt;/p&gt;

&lt;p&gt;于是我兴致冲冲地下载几本电子书，但发现都是PDZ格式的，没办法在电子墨水平板上阅读。
我便稍微研究了下，将这一功能集成到了&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;中。&lt;/p&gt;

&lt;p&gt;一般转换PDZ为PDF有三种方法：&lt;/p&gt;

&lt;ol&gt;
  &lt;li&gt;直接使用阅读器打印为PDF。这种方式比较费时，而且得到的文件非常大。&lt;/li&gt;
  &lt;li&gt;直接复制阅读器缓存的图片文件，然后做成PDF&lt;/li&gt;
  &lt;li&gt;直接下载网页版的图片&lt;/li&gt;
&lt;/ol&gt;

&lt;p&gt;ImageTrans使用了第二种方法。选择好要导出图片的pdz文件，它会自动用超星阅读器打开文件，自动切换页面，直到获取所有图片，并且能读取目录信息。&lt;/p&gt;

&lt;p&gt;超星图书馆扫描的图书质量可能不佳，不适合直接用电子墨水设备看，我还专门给图像做了漂白的处理，具体见这篇文章：&lt;a href=&quot;/zh/clean-deskew-enhance-scanned-books/&quot;&gt;扫描图书的漂白、矫正和清晰化处理&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;视频教程：&lt;/p&gt;

&lt;iframe src=&quot;//player.bilibili.com/player.html?isOutside=true&amp;amp;aid=115847666336407&amp;amp;bvid=BV1ztqwBaEod&amp;amp;cid=35224554595&amp;amp;p=1&quot; scrolling=&quot;no&quot; border=&quot;0&quot; frameborder=&quot;no&quot; framespacing=&quot;0&quot; allowfullscreen=&quot;true&quot;&gt;&lt;/iframe&gt;
</description>
        <pubDate>Mon, 05 Jan 2026 10:50:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/convert-sslibrary-pdz-pdg-to-pdf/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/convert-sslibrary-pdz-pdg-to-pdf/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>扫描图书的漂白、矫正和清晰化处理</title>
        <description>&lt;p&gt;最近下了几本超星图书馆的电子书，打算转换成PDF用大上电子墨水平板阅读。但我发现这些扫描的图书存在分辨率低、文字倾斜、对比度不够、文字透印、背景干扰等问题，在电子书阅读器上的效果很差（见下方例图）。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/clean-scanned-document/uncleaned-on-eink-tablet.jpg&quot; alt=&quot;不清晰电子墨水屏&quot; /&gt;&lt;/p&gt;

&lt;p&gt;最后我经过一番处理，得到了一个清晰版的PDF，总算在电子墨水设备上能看了。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/clean-scanned-document/cleaned-on-eink-tablet.jpg&quot; alt=&quot;清晰电子墨水屏&quot; /&gt;&lt;/p&gt;

&lt;p&gt;下面是经过的处理步骤。&lt;/p&gt;

&lt;p&gt;原图：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/clean-scanned-document/original.jpg&quot; alt=&quot;原图&quot; /&gt;&lt;/p&gt;

&lt;p&gt;对图片做超分辨率操作，提升清晰度：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/clean-scanned-document/superresolution.jpg&quot; alt=&quot;&quot; /&gt;&lt;/p&gt;

&lt;p&gt;识别图片中的文字的倾斜角度，根据这一角度矫正图像：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/clean-scanned-document/deskewed.jpg&quot; alt=&quot;矫正版&quot; /&gt;&lt;/p&gt;

&lt;p&gt;识别图片中的文字，以文字区域为单位进行二值化，得到只有黑白两种颜色的版本：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/clean-scanned-document/black-white.png&quot; alt=&quot;黑白版&quot; /&gt;&lt;/p&gt;

&lt;p&gt;最后得到这本203页的《学说上海话》的PDF只有8MB大小，同时支持搜索PDF中的文字。&lt;/p&gt;

&lt;p&gt;以上操作使用&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;一站式完成。&lt;/p&gt;

</description>
        <pubDate>Mon, 05 Jan 2026 10:36:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/clean-deskew-enhance-scanned-books/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/clean-deskew-enhance-scanned-books/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>使用大模型取得好的OCR结果</title>
        <description>&lt;p&gt;大模型可以准确地理解和处理文本，甚至一些多模态视觉大模型可以直接图像。下面是一些使用它取得好的OCR结果的方法。&lt;/p&gt;

&lt;h2 id=&quot;直接ocr&quot;&gt;直接OCR&lt;/h2&gt;

&lt;p&gt;直接使用大模型，比如qwen-vl，处理图片，提取图片中的文字，结果非常精确。&lt;/p&gt;

&lt;p&gt;但现在大模型无法准确返回文字坐标，通常需要先用专门的文字定位方法去定位文字，再用大模型去识别文字。&lt;/p&gt;

&lt;h2 id=&quot;纠正识别结果&quot;&gt;纠正识别结果&lt;/h2&gt;

&lt;p&gt;用大模型直接校对OCR结果。这一方法比直接处理图片，对性能的要求更低，但需要模型参数足够大，小参数的比如7B的大模型校对效果较差。&lt;/p&gt;

&lt;h2 id=&quot;版面分析&quot;&gt;版面分析&lt;/h2&gt;

&lt;p&gt;大模型还支持做版面分析，可以用于确定图片中的文字属于哪个段落，正确地按顺序输出文字。&lt;/p&gt;
</description>
        <pubDate>Mon, 08 Dec 2025 12:26:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/use-large-language-models-to-get-good-OCR-results/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/use-large-language-models-to-get-good-OCR-results/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
      <item>
        <title>大模型能取代人工译员吗？（以漫画翻译为例）</title>
        <description>&lt;style&gt;
.post-content table {
  width: auto;
}
&lt;/style&gt;

&lt;p&gt;大模型在漫画翻译领域能取代人工译员吗？我们可以以下面这张《乱马1/2》漫画为例，比对一下大模型的翻译和人工翻译。比对了ChatGPT、Claude、Gemini等在线大模型，Sakura、Qwen等本地大模型和谷歌、百度、彩云等传统机器翻译。&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/imagetrans-language-learning/Ranma1_012.jpg&quot; alt=&quot;原图&quot; /&gt;&lt;/p&gt;

&lt;p&gt;比对表格（日译中）：&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;翻译来源&lt;/th&gt;
      &lt;th&gt;1. 破っ!!&lt;/th&gt;
      &lt;th&gt;2. あー、&lt;/th&gt;
      &lt;th&gt;3. 調子いい。&lt;/th&gt;
      &lt;th&gt;4. まーたあかねはー。&lt;/th&gt;
      &lt;th&gt;5. んなことばっかやってるからまともにモテないのよ。&lt;/th&gt;
      &lt;th&gt;6. よけーなお世話よ。&lt;/th&gt;
      &lt;th&gt;7. あたしはおねーちゃんと違って男なんか、&lt;/th&gt;
      &lt;th&gt;8. 大っ嫌いなの。&lt;/th&gt;
      &lt;th&gt;9. ふーん、&lt;/th&gt;
      &lt;th&gt;10. じゃーこの話あんたにゃ関係ないか。&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;人工（香港）&lt;/td&gt;
      &lt;td&gt;嘿！&lt;/td&gt;
      &lt;td&gt;嘘！&lt;/td&gt;
      &lt;td&gt;厉害吧。&lt;/td&gt;
      &lt;td&gt;小茜。&lt;/td&gt;
      &lt;td&gt;这玩意不适合女孩子玩。&lt;/td&gt;
      &lt;td&gt;多谢关心了。&lt;/td&gt;
      &lt;td&gt;我和你不同。&lt;/td&gt;
      &lt;td&gt;我最讨厌男孩子！&lt;/td&gt;
      &lt;td&gt;唔！&lt;/td&gt;
      &lt;td&gt;那这事和你一点关系也没有了……&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;人工（哔哩哔哩）&lt;/td&gt;
      &lt;td&gt;哈！&lt;/td&gt;
      &lt;td&gt;呼！&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;小茜你又在练这个。&lt;/td&gt;
      &lt;td&gt;老干这种事，可是交不到男朋友的哦。&lt;/td&gt;
      &lt;td&gt;要你管。&lt;/td&gt;
      &lt;td&gt;我跟姐姐你不一样，我最讨厌的就是。&lt;/td&gt;
      &lt;td&gt;男孩子了！&lt;/td&gt;
      &lt;td&gt;呵呵。&lt;/td&gt;
      &lt;td&gt;那这事就和你没关系了吧。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;人工（博主）&lt;/td&gt;
      &lt;td&gt;哈！&lt;/td&gt;
      &lt;td&gt;呼，&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;小茜，你又在这里训练…&lt;/td&gt;
      &lt;td&gt;总是做这种事，可要找不到对象噢。&lt;/td&gt;
      &lt;td&gt;不用你管。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样，我最讨厌的&lt;/td&gt;
      &lt;td&gt;就是男生。&lt;/td&gt;
      &lt;td&gt;这样啊…&lt;/td&gt;
      &lt;td&gt;那这件事和你就没关系了。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;baidu&lt;/td&gt;
      &lt;td&gt;打破！！&lt;/td&gt;
      &lt;td&gt;啊&lt;/td&gt;
      &lt;td&gt;状态很好。&lt;/td&gt;
      &lt;td&gt;啊，茜啊。&lt;/td&gt;
      &lt;td&gt;因为只做这样的事，所以不受欢迎。&lt;/td&gt;
      &lt;td&gt;少管闲事。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样，男人什么的&lt;/td&gt;
      &lt;td&gt;最讨厌了。&lt;/td&gt;
      &lt;td&gt;嗯&lt;/td&gt;
      &lt;td&gt;那么这件事和你没关系吗。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;chatgpt-gpt4o&lt;/td&gt;
      &lt;td&gt;分裂！！&lt;/td&gt;
      &lt;td&gt;啊—&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;又是茜。&lt;/td&gt;
      &lt;td&gt;就是因为老干这些事情，才不会真正受欢迎。&lt;/td&gt;
      &lt;td&gt;不用你多管闲事。&lt;/td&gt;
      &lt;td&gt;我可不像姐姐那样，&lt;/td&gt;
      &lt;td&gt;最讨厌男人了。&lt;/td&gt;
      &lt;td&gt;哦，&lt;/td&gt;
      &lt;td&gt;那这件事就跟你没关系了。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;claude-4.5-sonnet&lt;/td&gt;
      &lt;td&gt;破！！&lt;/td&gt;
      &lt;td&gt;啊—&lt;/td&gt;
      &lt;td&gt;感觉不错。&lt;/td&gt;
      &lt;td&gt;茜又来了—&lt;/td&gt;
      &lt;td&gt;就是因为老做这种事才没人喜欢你。&lt;/td&gt;
      &lt;td&gt;多管闲事。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样，&lt;/td&gt;
      &lt;td&gt;我最讨厌男人了。&lt;/td&gt;
      &lt;td&gt;哦—&lt;/td&gt;
      &lt;td&gt;那这件事跟你没关系了。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;caiyun&lt;/td&gt;
      &lt;td&gt;突破！！&lt;/td&gt;
      &lt;td&gt;啊 ——&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;又见面了，茜。&lt;/td&gt;
      &lt;td&gt;就是因为总是做这种事，所以才不受欢迎啊。&lt;/td&gt;
      &lt;td&gt;多管闲事啊。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样，对男人什么的，&lt;/td&gt;
      &lt;td&gt;最讨厌了。&lt;/td&gt;
      &lt;td&gt;嗯 ——&lt;/td&gt;
      &lt;td&gt;那么，这件事跟你没关系吗？&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;deepseek-chat-v3.2&lt;/td&gt;
      &lt;td&gt;破っ!!&lt;/td&gt;
      &lt;td&gt;啊——&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;真是的 小红又这样。&lt;/td&gt;
      &lt;td&gt;你总干这种事所以才不受欢迎啊。&lt;/td&gt;
      &lt;td&gt;多管闲事。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样 对男人这种生物&lt;/td&gt;
      &lt;td&gt;最——讨厌了。&lt;/td&gt;
      &lt;td&gt;哼——&lt;/td&gt;
      &lt;td&gt;那这事就跟你没关系咯。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gemini-2.5-flash&lt;/td&gt;
      &lt;td&gt;打破!!&lt;/td&gt;
      &lt;td&gt;啊，&lt;/td&gt;
      &lt;td&gt;状态很好。&lt;/td&gt;
      &lt;td&gt;茜又来了。&lt;/td&gt;
      &lt;td&gt;就是因为老做这种事才没人喜欢你。&lt;/td&gt;
      &lt;td&gt;多管闲事。&lt;/td&gt;
      &lt;td&gt;我可不像姐姐，对男人什么的，&lt;/td&gt;
      &lt;td&gt;最讨厌了。&lt;/td&gt;
      &lt;td&gt;哦，&lt;/td&gt;
      &lt;td&gt;那这件事就和你没关系咯。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;google&lt;/td&gt;
      &lt;td&gt;打破它！！&lt;/td&gt;
      &lt;td&gt;啊，&lt;/td&gt;
      &lt;td&gt;我感觉很好。&lt;/td&gt;
      &lt;td&gt;又是茜。&lt;/td&gt;
      &lt;td&gt;这就是你永远不会真正受欢迎的原因。&lt;/td&gt;
      &lt;td&gt;那不关你的事。&lt;/td&gt;
      &lt;td&gt;与我姐姐不同，我不喜欢男生。&lt;/td&gt;
      &lt;td&gt;我恨它。&lt;/td&gt;
      &lt;td&gt;唔，&lt;/td&gt;
      &lt;td&gt;所以这个故事与你无关。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-120b&lt;/td&gt;
      &lt;td&gt;破!!&lt;/td&gt;
      &lt;td&gt;啊，&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;又是あかね啊——。&lt;/td&gt;
      &lt;td&gt;因为只会干那种事，根本不受人喜欢。&lt;/td&gt;
      &lt;td&gt;真是多管闲事啊。&lt;/td&gt;
      &lt;td&gt;我和姐姐不同，男人这种东西，&lt;/td&gt;
      &lt;td&gt;非常讨厌。&lt;/td&gt;
      &lt;td&gt;哼，&lt;/td&gt;
      &lt;td&gt;那么这件事跟你没关系吧。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-20b&lt;/td&gt;
      &lt;td&gt;破了!!&lt;/td&gt;
      &lt;td&gt;啊，&lt;/td&gt;
      &lt;td&gt;状态很好。&lt;/td&gt;
      &lt;td&gt;又是阿卡ネ啊。&lt;/td&gt;
      &lt;td&gt;因为只做那种事，根本没法正常受欢迎呢。&lt;/td&gt;
      &lt;td&gt;真麻烦的照顾啊。&lt;/td&gt;
      &lt;td&gt;我和姐姐不同，男人之类的，&lt;/td&gt;
      &lt;td&gt;非常讨厌。&lt;/td&gt;
      &lt;td&gt;嗯，&lt;/td&gt;
      &lt;td&gt;那这事跟你没关系吧。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-235b&lt;/td&gt;
      &lt;td&gt;破了！！&lt;/td&gt;
      &lt;td&gt;啊——，&lt;/td&gt;
      &lt;td&gt;状态不错。&lt;/td&gt;
      &lt;td&gt;又在搞那个红呢。&lt;/td&gt;
      &lt;td&gt;净做这种事，难怪一点都吸引不了别人。&lt;/td&gt;
      &lt;td&gt;少管闲事。&lt;/td&gt;
      &lt;td&gt;我和姐姐可不一样，对男人什么的，&lt;/td&gt;
      &lt;td&gt;最讨厌了。&lt;/td&gt;
      &lt;td&gt;哦——，&lt;/td&gt;
      &lt;td&gt;那这事跟你没关系了。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-8b&lt;/td&gt;
      &lt;td&gt;破了！&lt;/td&gt;
      &lt;td&gt;啊——&lt;/td&gt;
      &lt;td&gt;气势不错。&lt;/td&gt;
      &lt;td&gt;好吧，我又输了。&lt;/td&gt;
      &lt;td&gt;你老是这么说话，怎么能吸引到正常的人呢。&lt;/td&gt;
      &lt;td&gt;你可真是个麻烦人物。&lt;/td&gt;
      &lt;td&gt;我跟那个姐姐不一样，我一点都不喜欢男人，&lt;/td&gt;
      &lt;td&gt;非常讨厌。&lt;/td&gt;
      &lt;td&gt;哦——&lt;/td&gt;
      &lt;td&gt;所以这个故事跟你无关对吧。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;sakura-14b&lt;/td&gt;
      &lt;td&gt;破！！&lt;/td&gt;
      &lt;td&gt;啊——&lt;/td&gt;
      &lt;td&gt;真是的。&lt;/td&gt;
      &lt;td&gt;又来了。&lt;/td&gt;
      &lt;td&gt;就是成天搞这种事才会没有异性缘哦。&lt;/td&gt;
      &lt;td&gt;真是多管闲事。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样，最讨厌男生了。&lt;/td&gt;
      &lt;td&gt;大家都一个样。&lt;/td&gt;
      &lt;td&gt;嗯——&lt;/td&gt;
      &lt;td&gt;那这事和你没关系了。&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;sakura-7b&lt;/td&gt;
      &lt;td&gt;破！！&lt;/td&gt;
      &lt;td&gt;啊——&lt;/td&gt;
      &lt;td&gt;遵命。&lt;/td&gt;
      &lt;td&gt;又来了啊。&lt;/td&gt;
      &lt;td&gt;就是因为整天做这种事，所以才不受欢迎。&lt;/td&gt;
      &lt;td&gt;多管闲事。&lt;/td&gt;
      &lt;td&gt;我和姐姐不一样，&lt;/td&gt;
      &lt;td&gt;最讨厌男生了。&lt;/td&gt;
      &lt;td&gt;哦——&lt;/td&gt;
      &lt;td&gt;那这件事和你无关。&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;比对表格（日译英）：&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;翻译来源&lt;/th&gt;
      &lt;th&gt;1. 破っ!!&lt;/th&gt;
      &lt;th&gt;2. あー、&lt;/th&gt;
      &lt;th&gt;3. 調子いい。&lt;/th&gt;
      &lt;th&gt;4. まーたあかねはー。&lt;/th&gt;
      &lt;th&gt;5. んなことばっかやってるからまともにモテないのよ。&lt;/th&gt;
      &lt;th&gt;6. よけーなお世話よ。&lt;/th&gt;
      &lt;th&gt;7. あたしはおねーちゃんと違って男なんか、&lt;/th&gt;
      &lt;th&gt;8. 大っ嫌いなの。&lt;/th&gt;
      &lt;th&gt;9. ふーん、&lt;/th&gt;
      &lt;th&gt;10. じゃーこの話あんたにゃ関係ないか。&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;人工（vizmedia）&lt;/td&gt;
      &lt;td&gt;Hyaah!&lt;/td&gt;
      &lt;td&gt;Ahh！&lt;/td&gt;
      &lt;td&gt;That was nice.&lt;/td&gt;
      &lt;td&gt;There you go again, Akane.&lt;/td&gt;
      &lt;td&gt;No wonder the boys all think you’re so weird.&lt;/td&gt;
      &lt;td&gt;So why should I care?&lt;/td&gt;
      &lt;td&gt;Not everybody thinks the world revolves around boys, Nabiki.&lt;/td&gt;
      &lt;td&gt;Especially not me.&lt;/td&gt;
      &lt;td&gt;No?&lt;/td&gt;
      &lt;td&gt;Then I guess this would’t interest you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;人工（博主）&lt;/td&gt;
      &lt;td&gt;Yack…&lt;/td&gt;
      &lt;td&gt;Gasp…&lt;/td&gt;
      &lt;td&gt;Good.&lt;/td&gt;
      &lt;td&gt;Akane, you are training again…&lt;/td&gt;
      &lt;td&gt;It won’t help you with boys.&lt;/td&gt;
      &lt;td&gt;It is none of your business.&lt;/td&gt;
      &lt;td&gt;I am different from you…&lt;/td&gt;
      &lt;td&gt;I hate boys.&lt;/td&gt;
      &lt;td&gt;If so…&lt;/td&gt;
      &lt;td&gt;it has nothing to do with you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;baidu&lt;/td&gt;
      &lt;td&gt;Break!&lt;/td&gt;
      &lt;td&gt;Ah&lt;/td&gt;
      &lt;td&gt;Good condition.&lt;/td&gt;
      &lt;td&gt;Akane Akane.&lt;/td&gt;
      &lt;td&gt;Because I’m doing things like that, I’m really moody.&lt;/td&gt;
      &lt;td&gt;Good luck!&lt;/td&gt;
      &lt;td&gt;I’m quite different from a man&lt;/td&gt;
      &lt;td&gt;I hate you.&lt;/td&gt;
      &lt;td&gt;HMM&lt;/td&gt;
      &lt;td&gt;Why don’t you have this story?&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;chatgpt-gpt4o&lt;/td&gt;
      &lt;td&gt;Broke!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;I’m feeling good.&lt;/td&gt;
      &lt;td&gt;There goes Akane again.&lt;/td&gt;
      &lt;td&gt;That’s why you never genuinely attract anyone, because you’re always doing stuff like that.&lt;/td&gt;
      &lt;td&gt;None of your business.&lt;/td&gt;
      &lt;td&gt;Unlike you, big sis, I&lt;/td&gt;
      &lt;td&gt;absolutely hate guys.&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;so this has nothing to do with you then.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;claude-4.5-sonnet&lt;/td&gt;
      &lt;td&gt;Hya!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;I feel great.&lt;/td&gt;
      &lt;td&gt;There goes Akane again.&lt;/td&gt;
      &lt;td&gt;That’s why you can’t get a boyfriend acting like that.&lt;/td&gt;
      &lt;td&gt;Mind your own business.&lt;/td&gt;
      &lt;td&gt;Unlike you, sis, I&lt;/td&gt;
      &lt;td&gt;absolutely hate boys.&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;then this doesn’t concern you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;caiyun&lt;/td&gt;
      &lt;td&gt;Break!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;she‘s in good shape.&lt;/td&gt;
      &lt;td&gt;Well, Akane.&lt;/td&gt;
      &lt;td&gt;I‘m not really popular because I do all these things.&lt;/td&gt;
      &lt;td&gt;You‘re being too kind.&lt;/td&gt;
      &lt;td&gt;I‘m different from onee-chan, I’m not a man.&lt;/td&gt;
      &lt;td&gt;I really hate them.&lt;/td&gt;
      &lt;td&gt;Hmm.&lt;/td&gt;
      &lt;td&gt;Then this story has nothing to do with you?&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;deepseek-chat-v3.2&lt;/td&gt;
      &lt;td&gt;Break!!&lt;/td&gt;
      &lt;td&gt;Ahh,&lt;/td&gt;
      &lt;td&gt;Feeling good.&lt;/td&gt;
      &lt;td&gt;Maa, Akane is…&lt;/td&gt;
      &lt;td&gt;That’s why you keep doing things like that and can’t get a proper boyfriend.&lt;/td&gt;
      &lt;td&gt;Mind your own business.&lt;/td&gt;
      &lt;td&gt;Unlike you, sis, I hate men,&lt;/td&gt;
      &lt;td&gt;I really hate them.&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;Then this story has nothing to do with you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gemini-2.5-flash&lt;/td&gt;
      &lt;td&gt;Smash!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;I feel great.&lt;/td&gt;
      &lt;td&gt;Akane, again…&lt;/td&gt;
      &lt;td&gt;You’re always doing things like that, no wonder you’re not popular.&lt;/td&gt;
      &lt;td&gt;Mind your own business.&lt;/td&gt;
      &lt;td&gt;Unlike my sister, I don’t care about guys,&lt;/td&gt;
      &lt;td&gt;Hate them!&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;Then this conversation has nothing to do with you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;google&lt;/td&gt;
      &lt;td&gt;Break it!!&lt;/td&gt;
      &lt;td&gt;ah,&lt;/td&gt;
      &lt;td&gt;I’m feeling good.&lt;/td&gt;
      &lt;td&gt;Akane again.&lt;/td&gt;
      &lt;td&gt;That’s why you’re never really popular.&lt;/td&gt;
      &lt;td&gt;That’s none of your business.&lt;/td&gt;
      &lt;td&gt;Unlike my sister, I don’t like guys.&lt;/td&gt;
      &lt;td&gt;I hate it.&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;So this story doesn’t concern you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-120b&lt;/td&gt;
      &lt;td&gt;Break!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;Feeling good.&lt;/td&gt;
      &lt;td&gt;There goes Akane again.&lt;/td&gt;
      &lt;td&gt;Because you’re always doing stuff like that, you never get any proper attention from the opposite sex.&lt;/td&gt;
      &lt;td&gt;What a big help.&lt;/td&gt;
      &lt;td&gt;Unlike my sister, I…&lt;/td&gt;
      &lt;td&gt;I really hate men.&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;Well then, this story doesn’t concern you, does it?&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-20b&lt;/td&gt;
      &lt;td&gt;Shattered!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;I’m feeling good.&lt;/td&gt;
      &lt;td&gt;Akane again.&lt;/td&gt;
      &lt;td&gt;Because I keep doing things like that, I can’t attract anyone properly.&lt;/td&gt;
      &lt;td&gt;You’re such a nuisance.&lt;/td&gt;
      &lt;td&gt;Unlike my older sister, I don’t like men.&lt;/td&gt;
      &lt;td&gt;I hate them.&lt;/td&gt;
      &lt;td&gt;Hmm,&lt;/td&gt;
      &lt;td&gt;So this story doesn’t concern you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-235b&lt;/td&gt;
      &lt;td&gt;Break!!&lt;/td&gt;
      &lt;td&gt;Ah,&lt;/td&gt;
      &lt;td&gt;I’m feeling great.&lt;/td&gt;
      &lt;td&gt;Akane, again…&lt;/td&gt;
      &lt;td&gt;That’s why you never get properly liked by anyone.&lt;/td&gt;
      &lt;td&gt;None of your business.&lt;/td&gt;
      &lt;td&gt;Unlike onee-chan, I hate guys,&lt;/td&gt;
      &lt;td&gt;I really hate them.&lt;/td&gt;
      &lt;td&gt;Huh,&lt;/td&gt;
      &lt;td&gt;Then this conversation has nothing to do with you.&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-8b&lt;/td&gt;
      &lt;td&gt;Break!!&lt;/td&gt;
      &lt;td&gt;Ugh,&lt;/td&gt;
      &lt;td&gt;I’m in a good mood.&lt;/td&gt;
      &lt;td&gt;You’re always so clumsy.&lt;/td&gt;
      &lt;td&gt;Because you keep doing such stupid things, you can’t attract anyone properly.&lt;/td&gt;
      &lt;td&gt;You’re really making things easy for me.&lt;/td&gt;
      &lt;td&gt;Unlike you, I don’t like guys,&lt;/td&gt;
      &lt;td&gt;At all.&lt;/td&gt;
      &lt;td&gt;Hmmm,&lt;/td&gt;
      &lt;td&gt;Then this story has nothing to do with you.&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;通过比对可以发现，目前的人工智能大模型，在翻译日语这样高语境的语言时还是明显不如人工翻译，存在人称不对、人名翻译错误、衔接不当、过于遵循原文句式不够自然等问题。&lt;/p&gt;

&lt;p&gt;不过人工翻译也存在译者过度发挥，不够遵循原文的问题。这一现象在高质量机器翻译出现前会比较明显，而现在普遍采用机器翻译译后编辑模式，很多人工翻译可能会直接采用机器翻译结果，对原文的忠实度会更高一点。&lt;/p&gt;

&lt;p&gt;关于哪个大模型效果最好，可以看到，模型参数越多，对应的质量也会更好。有些大模型，比如Sakura，会使用日中语料进行微调，但因为模型参数少，实际翻译效果仍然不佳，容易出现幻觉，不如参数多的大模型。但比同参数级别的通用模型还是要好的。&lt;/p&gt;

&lt;p&gt;下面是比较不同引擎的BLEU分数的表格。BLEU分数通过计算和人工译文的相似度得到，可以用于评估翻译质量。&lt;/p&gt;

&lt;p&gt;日译中：&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;翻译引擎&lt;/th&gt;
      &lt;th&gt;BLEU@哔哩哔哩&lt;/th&gt;
      &lt;th&gt;BLEU@香港&lt;/th&gt;
      &lt;th&gt;BLEU@博主&lt;/th&gt;
      &lt;th&gt;平均分&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-235b&lt;/td&gt;
      &lt;td&gt;0.2035&lt;/td&gt;
      &lt;td&gt;0.0484&lt;/td&gt;
      &lt;td&gt;0.2247&lt;/td&gt;
      &lt;td&gt;0.1589&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;caiyun&lt;/td&gt;
      &lt;td&gt;0.1760&lt;/td&gt;
      &lt;td&gt;0.0481&lt;/td&gt;
      &lt;td&gt;0.2147&lt;/td&gt;
      &lt;td&gt;0.1463&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;deepseek-chat-v3.2&lt;/td&gt;
      &lt;td&gt;0.1803&lt;/td&gt;
      &lt;td&gt;0.0335&lt;/td&gt;
      &lt;td&gt;0.1719&lt;/td&gt;
      &lt;td&gt;0.1286&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;claude-4.5-sonnet&lt;/td&gt;
      &lt;td&gt;0.1104&lt;/td&gt;
      &lt;td&gt;0.0917&lt;/td&gt;
      &lt;td&gt;0.1751&lt;/td&gt;
      &lt;td&gt;0.1257&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;chatgpt-gpt4o&lt;/td&gt;
      &lt;td&gt;0.1253&lt;/td&gt;
      &lt;td&gt;0.0565&lt;/td&gt;
      &lt;td&gt;0.1448&lt;/td&gt;
      &lt;td&gt;0.1089&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;sakura-14b&lt;/td&gt;
      &lt;td&gt;0.1115&lt;/td&gt;
      &lt;td&gt;0.0652&lt;/td&gt;
      &lt;td&gt;0.1370&lt;/td&gt;
      &lt;td&gt;0.1046&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;sakura-7b&lt;/td&gt;
      &lt;td&gt;0.0647&lt;/td&gt;
      &lt;td&gt;0.0816&lt;/td&gt;
      &lt;td&gt;0.1530&lt;/td&gt;
      &lt;td&gt;0.0998&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;baidu&lt;/td&gt;
      &lt;td&gt;0.0933&lt;/td&gt;
      &lt;td&gt;0.0533&lt;/td&gt;
      &lt;td&gt;0.1408&lt;/td&gt;
      &lt;td&gt;0.0958&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-120b&lt;/td&gt;
      &lt;td&gt;0.1032&lt;/td&gt;
      &lt;td&gt;0.0225&lt;/td&gt;
      &lt;td&gt;0.1226&lt;/td&gt;
      &lt;td&gt;0.0828&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gemini-2.5-flash&lt;/td&gt;
      &lt;td&gt;0.0961&lt;/td&gt;
      &lt;td&gt;0.0400&lt;/td&gt;
      &lt;td&gt;0.0981&lt;/td&gt;
      &lt;td&gt;0.0781&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-20b&lt;/td&gt;
      &lt;td&gt;0.0616&lt;/td&gt;
      &lt;td&gt;0.0320&lt;/td&gt;
      &lt;td&gt;0.0868&lt;/td&gt;
      &lt;td&gt;0.0601&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-8b&lt;/td&gt;
      &lt;td&gt;0.0527&lt;/td&gt;
      &lt;td&gt;0.0225&lt;/td&gt;
      &lt;td&gt;0.0601&lt;/td&gt;
      &lt;td&gt;0.0451&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;google&lt;/td&gt;
      &lt;td&gt;0.0247&lt;/td&gt;
      &lt;td&gt;0.0552&lt;/td&gt;
      &lt;td&gt;0.0502&lt;/td&gt;
      &lt;td&gt;0.0434&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;日译英：&lt;/p&gt;

&lt;table&gt;
  &lt;thead&gt;
    &lt;tr&gt;
      &lt;th&gt;翻译引擎&lt;/th&gt;
      &lt;th&gt;BLEU@vizmedia&lt;/th&gt;
      &lt;th&gt;BLEU@博主&lt;/th&gt;
      &lt;th&gt;平均分&lt;/th&gt;
    &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
    &lt;tr&gt;
      &lt;td&gt;chatgpt-gpt4o&lt;/td&gt;
      &lt;td&gt;0.0545&lt;/td&gt;
      &lt;td&gt;0.1968&lt;/td&gt;
      &lt;td&gt;0.1257&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-235b&lt;/td&gt;
      &lt;td&gt;0.0523&lt;/td&gt;
      &lt;td&gt;0.1864&lt;/td&gt;
      &lt;td&gt;0.1194&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;deepseek-chat-v3.2&lt;/td&gt;
      &lt;td&gt;0.0813&lt;/td&gt;
      &lt;td&gt;0.1432&lt;/td&gt;
      &lt;td&gt;0.1122&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;claude-4.5-sonnet&lt;/td&gt;
      &lt;td&gt;0.0606&lt;/td&gt;
      &lt;td&gt;0.1267&lt;/td&gt;
      &lt;td&gt;0.0937&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;caiyun&lt;/td&gt;
      &lt;td&gt;0.0625&lt;/td&gt;
      &lt;td&gt;0.1193&lt;/td&gt;
      &lt;td&gt;0.0909&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;google&lt;/td&gt;
      &lt;td&gt;0.0468&lt;/td&gt;
      &lt;td&gt;0.1348&lt;/td&gt;
      &lt;td&gt;0.0908&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gemini-2.5-flash&lt;/td&gt;
      &lt;td&gt;0.0515&lt;/td&gt;
      &lt;td&gt;0.1294&lt;/td&gt;
      &lt;td&gt;0.0904&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;baidu&lt;/td&gt;
      &lt;td&gt;0.0540&lt;/td&gt;
      &lt;td&gt;0.1065&lt;/td&gt;
      &lt;td&gt;0.0803&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;qwen3-8b&lt;/td&gt;
      &lt;td&gt;0.0438&lt;/td&gt;
      &lt;td&gt;0.1081&lt;/td&gt;
      &lt;td&gt;0.0760&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-120b&lt;/td&gt;
      &lt;td&gt;0.0473&lt;/td&gt;
      &lt;td&gt;0.0850&lt;/td&gt;
      &lt;td&gt;0.0662&lt;/td&gt;
    &lt;/tr&gt;
    &lt;tr&gt;
      &lt;td&gt;gpt-oss-20b&lt;/td&gt;
      &lt;td&gt;0.0477&lt;/td&gt;
      &lt;td&gt;0.0711&lt;/td&gt;
      &lt;td&gt;0.0594&lt;/td&gt;
    &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;

&lt;p&gt;当然，漫画翻译是种多模态翻译，实际翻译工作还有嵌字、重修等各种环节。以下是Viz Media的英文版：&lt;/p&gt;

&lt;p&gt;&lt;img src=&quot;/album/ranma-vizmedia.webp&quot; alt=&quot;Vizmedia&quot; /&gt;&lt;/p&gt;

&lt;p&gt;欢迎使用计算机辅助漫画翻译软件&lt;a href=&quot;/zh/imagetrans/&quot;&gt;ImageTrans&lt;/a&gt;，可以在各种大模型的帮助下，一站式完成OCR、翻译、嵌字、修图等工作。&lt;/p&gt;

</description>
        <pubDate>Tue, 25 Nov 2025 13:20:50 +0000</pubDate>
        <link>https://www.basiccat.org/zh/can-large-language-model-replace-human-translator-in-terms-of-manga-translation/</link>
        <guid isPermaLink="true">https://www.basiccat.org/zh/can-large-language-model-replace-human-translator-in-terms-of-manga-translation/</guid>
        
        <category>imagetrans</category>
        
        
        <category>blog</category>
        
      </item>
    
  </channel>
</rss>
