硬字幕识别 srt-recognizer

2021-06-19

Table of Contents

为什么要提取硬字幕⌗

硬字幕也称“内嵌字幕”，把字幕文件和视频流压制在同一组数据里，像水印一样，无法分离。正因为它是内嵌在视频之中的，在我们保存一些优秀的学习资料时，我们必须要将整个视频下载下来保存。可是，大部分视频中重要的部分恰恰就是它的文字稿。

基于这个需求，srt-recognizer“应运而生”。srt-recognizer是一个基于cnOCR的硬字幕提取软件，可以将硬字幕导出为纯文本文件和srt文件。

项目优点⌗

本地识别：不需要申请额外的API，也不需要安装其它的软件
大小适中：相比其他项目，模型加上软件大小约为130M
准确度较好：cnOCR的识别率能够达到95%左右

获取方式⌗

可执行文件：Windows下载链接
手动配置：如果你是Mac无法使用exe文件或者是想自己配置的话，可以采用如下的配置方法。
1. 安装python
2. 安装cnocr库: pip install cnocr
3. 安装cv2: pip install cv2
4. 愉快使用吧！

使用教程⌗

是否需要多行识别？
如果需要识别带有多行的字幕，建议开启这个功能。如果不需要，可以关闭。关闭之后可以提升识别速度。
是否需要导出为srt
如果需要导出为srt字幕文件，选择这项功能。如果不需要，软件将默认到处字母内容为txt文件
输入文件地址
输入文件地址即可，需要加入后缀名
选择字幕区域：在ocr字幕内容之前，软件会打开一个窗口让您选择字幕的区域，为此软件提供了两种框选方式。
1. 矩形选择
  1. 矩形选择需要左键点击字幕的左上角，右键点击字幕的右下角
  2. 因为不好确定最长的字幕的左上角和右下角位置，使用这项功能有一定几率会导致后面的字幕无法准确识别
2. 非矩形选择
  1. 左键点击字幕的最上方，右键点击字幕的最下方
  2. 该功能可以准确框选字幕，但有可能会导致识别的字幕带有一些干扰信息。
  3. 推荐使用非矩形选择！
3. 如果弹出窗口没有字幕，可以按空格跳转到下一帧。选择完成之后按空格键退出选择窗口。

Read other posts

← Macbook M1 安装 pygame 用 Vercel 搭建网站访问数据统计工具 Ackee →