我最近找了几篇台湾比较老的论文,发现都是竖排繁体的PDF,而且是黑白的扫描版本,文字都难以辨识,看这样的论文莫不是要加深近视。于是我想了些优化阅读的方式,对于中国大陆用户,还是直接把竖排转成横排,比较便于阅读。不过有时还是保持原文排版比较好,我又尝试了用OCR识别文字,去除原文,用清晰的文字重新排版。下面是效果演示和具体的操作方法。

效果演示

原始文件(PDF):

原始文件

转换成横排的markdown格式的文本:

卷五十第

期一十二第

## 那一個甘蔗品種好?

## 選擇蔗種的基本原則

選擇甘蔗品種的基本原則,是「適地適種」,而「適地」的意義,並不是單指適合的土壤的意思,還包括蔗園所在地點的一切環境條件,諸如氣候狀況、灌溉條件、肥料多少、勞力充份否,間作不間作,留宿根不留等等,都要考慮到.只有適合種蔗環境的品種,才能有好的收成,所以在選擇品種之前,首先要明白所經營的蔗園的環境.下面幾點是主要的考慮對象:

(1)土質和地力:土質的粘重或輕鬆,主要關係土壤水分的保持與喪失.粘重的土壤,保水力较强,纵然在灌溉水不够充分的地方,也能栽培比較不耐旱的品種,但是粘重的蔗園容易排水不良,根系太深,不耐浸的品种就发育不良.土质轻松的土壤適恰相反,不適合栽培不耐旱品種,而適應根系深的品種.

甘蔗品種的耐肥性是個個不同的,有的適合在好地方的蔗園,有的在地方好的蔗園反而減產.所以地方的肥沃瘦瘠也需要密切注意.

(2)灌溉的條件:要說甘蔗是水做的,一點也沒有錯,一支甘蔗有七〇%以上是水.因之,水成了種蔗的必具條件,只是甘蔗品種裏有些特別喜愛水一些,缺了水,產量隨即降低,另一些對水淡漠一些,早一點影響產量不大.選擇品種的時候,不能不顧到這點.

(3)宿根:每一個品種的宿根能力多有不同,有些可以宿根,有些宿根产量很低,留宿根化不來,要是選錯了就要自己吃虧.

(4)植期不同:有些品种只能作为秋植,而且必須早秋植;延遲種植,產量降低.另一些品種又只適合春植,作為秋植時並不理想.而二期糊仔有二期糊仔的品種,一期糊仔有一期糊仔的品種,

都混雜不得的.

(5)勞力的多少:有的蔗友家中勞力很多,或者財力雄厚,足以招雇够量的勞力來從事精耕栽培,那麼就應該選擇適合精耕栽培的品種.否則,應該選擇在粗放耕作時仍有相當產量的品種.

(6)病蟲害問題:現在推廣的品種,大致說對於主要的病蟲害都是抵抗的,但在容易發生病蟲害的環境如玉米栽培地區,有些品種比較容易發生露菌病,應該避免栽培.

## 目前推廣的優良蔗種

談完了選擇品種時考慮的主要種蔗環境條件,現在來選擇品種,首先要介紹一些最近由糖業試驗所育成,在推廣中的甘蔗新品種.

F一四六已經推廣三個年期了,大家對它都已十分認識,它是一個中大莖,多分櫱的品種.初期生育緩慢,而在次年高溫多水的季節迅F一四六速生長.原料莖很多,只是短一點,適合在地力中等以上,有水灌溉,不很粘重的地方作为早秋植,F一四六可以間作,宿根也不錯,最高的產量可以達到三十萬公斤.

F一四八作為春植或晚秋植時,它增產能力比在早秋植時高,同時也不適合二期糊仔.蔗莖又細小一點,所以蔗友們不很歡迎.事實F一四八上,用F一四八作晚植蔗園的品種,它的產量比F一四六,和F一五二安定.而且在所有的新品種中,F一四八是糖份最高的一個,也是最不怕露菌病的品種,又因為它很早熟,種了它,多半是在製糖季初收穫,蔗友們可以提前利用種蔗後的土地.

F一四八也不適合在粘重或過份輕鬆,以及乾旱的地方栽培,間作和宿根的條件不及F一四六.

## F一五一

F一五一適合在粘土蔗園秋植及二期糊仔

,在溫度較低,土壤較乾的時候,萌

芽比其他新品種好.它是中莖種,原料莖比F一四六細而長,也比F一四六容易倒伏,但不易开花;和F一四六同样地晚熟,步留也差不多.露菌病的感染程度較重.F一五一的新植產量在輕鬆的壤土裏不及F一四六,在粘重的土壤則勝過F一四六.宿根的產量和F一四六相仿.

F一五一不能作為晚植蔗園的品種.

F一五二是地力肥沃,灌溉水充沛蕉園的增產王牌,它的原料莖高而粗,只要保持適當的原料莖數,很容易的得上二十萬公斤以上的F一五一甲當產量.不過在灌溉水缺乏,地力不夠而又沒有辦法施用重肥的蔗園,F一五二沒有增產的希望.

七、八月種植的F一五二容易母莖徒長,因此不如九月種植的蔗園產量穩定.F一五二是個好


## ·紹介者作期本·

▼湯冠雄:曾任臺灣糖業試驗所種藝系技師,現任該所虎尾蔗作改良場場長,從事甘蔗栽培研究已十七年.

![图片]()

夏輔禹:安東省岡城縣人,臺灣省立農學院畢業,現任糖業試驗所虎尾蔗作改良場研究組組長,一直擔任蔗田間作試驗方面工作.

![图片]()

保持原有排版的清晰化的版本(图片+PDF):

清晰化版本

文字PDF,矢量文字,放大后依然非常清晰:

文件链接

操作方法

需要用到ImageTrans这款OCR软件。

  1. 使用自带的气泡检测功能,检测竖排文字行。
  2. 使用大语言模型进行OCR。因为这里文字比较模糊,只有大语言模型才有比较好的效果,我这里选用了qwen3-vl-235b-a22b-instruct这个模型。
  3. 使用PaddleOCR的DocLayout分镜检测模型检测文字段落,按从右往左的阅读顺序对文字行进行排序。
  4. 为竖排和横排指定文字样式。然后根据宽高比,确定哪些文字是横排的、哪些是竖排的。
  5. 输出为PDF。
  6. 接着输出为markdown,这里我们可以按照段落对文字行进行合并,去除多余的换行。

软件主界面:

软件主界面

显示分镜和顺序:

显示分镜和顺序