硬字幕识别 srt-recognizer
Table of Contents
为什么要提取硬字幕⌗
硬字幕也称“内嵌字幕”,把字幕文件和视频流压制在同一组数据里,像水印一样,无法分离。 正因为它是内嵌在视频之中的,在我们保存一些优秀的学习资料时,我们必须要将整个视频下载下来保存。可是,大部分视频中重要的部分恰恰就是它的文字稿。
基于这个需求,srt-recognizer“应运而生”。srt-recognizer是一个基于cnOCR的硬字幕提取软件,可以将硬字幕导出为纯文本文件和srt文件。
项目优点⌗
- 本地识别:不需要申请额外的API,也不需要安装其它的软件
- 大小适中:相比其他项目,模型加上软件大小约为130M
- 准确度较好:cnOCR的识别率能够达到95%左右
获取方式⌗
可执行文件:Windows下载链接
手动配置:如果你是Mac无法使用exe文件或者是想自己配置的话,可以采用如下的配置方法。
- 安装python
- 安装cnocr库:
pip install cnocr
- 安装cv2:
pip install cv2
- 愉快使用吧!
使用教程⌗
是否需要多行识别?
如果需要识别带有多行的字幕,建议开启这个功能。如果不需要,可以关闭。关闭之后可以提升识别速度。
是否需要导出为srt
如果需要导出为srt字幕文件,选择这项功能。如果不需要,软件将默认到处字母内容为txt文件
输入文件地址
输入文件地址即可,需要加入后缀名
选择字幕区域:在ocr字幕内容之前,软件会打开一个窗口让您选择字幕的区域,为此软件提供了两种框选方式。
- 矩形选择
- 矩形选择需要左键点击字幕的左上角,右键点击字幕的右下角
- 因为不好确定最长的字幕的左上角和右下角位置,使用这项功能有一定几率会导致后面的字幕无法准确识别
- 非矩形选择
- 左键点击字幕的最上方,右键点击字幕的最下方
- 该功能可以准确框选字幕,但有可能会导致识别的字幕带有一些干扰信息。
- 推荐使用非矩形选择!
- 如果弹出窗口没有字幕,可以按空格跳转到下一帧。选择完成之后按空格键退出选择窗口。
- 矩形选择
Read other posts