文字 「教程」提取课程的逐字稿
文字
取消

「教程」提取课程的逐字稿

材料

  1. VideoSubFinder下载
  2. Umi-OCR下载
  3. 豆包Kimi

具体过程

  • 打开VideoSubFinder,导入视频。

1

  • 调整要提取字幕的位置。

2

  • 点击Run Search,生成RGBImages。

3

  • 换到OCR选项,点击Create Cleared Text Images(RGBImages->TXTImages),生成TXTImages。

4

  • 生成的TXTImages在这个软件的根目录,可以转移到你知道的位置,这个路径后面OCR时会用到,我们假定路径为/home/TXTImages

5

  • 安装Umi-OCR,这个工具有个命令行工具,使用命令:
1
umi-ocr --path "/home/TXTImages" --output_append "识别文本输出文件路径"

会产生一个文本文件。

  • 最后使用豆包进行标点的添加和自动分段。
本文由作者按照 CC BY 4.0 进行授权