“审判长、人民陪审员,根据《中国人民共和国刑事诉讼法》第184条、第193条、203条规定……”近日,不少在网上看庭审直播的公众发现,与以往只有视频画面和声音不同,还增加了实时动态的字幕,成为庭审视频直播的新亮点。
原来,为全国法院提供庭审过程互联网视频直播及案件开庭录像云服务的新浪法院频道,引入了搜狗公司提供的人工智能语音识别技术,在庭审直播中实现了各角色发言自动转写为文字,视频和语音识别文字的融合,让全过程一目了然,进一步创新司法公正手段。
截止到今年8月15日,搜狗与新浪合作的庭审语音识别系统已经部署在全国17个省份的50家法院,提供了357场次的庭审语音识别服务,其中有194场次同步进行了庭审直播。
图:芜湖开发区法院庭审直播,右侧语音识别庭审笔录同步显示
据悉,利用搜狗语音识别技术,将庭审时各个诉讼参与人的发言自动地转写成文字,不仅适用于字幕式庭审直播和索引式视频播放,还可用于书记员自动制作庭审笔录和手机扫码看庭审等多个场景。
在过去,书记员制作庭审笔录是一项费时费力还不一定能够完全准确还原现场情况的工作任务,当新浪使用搜狗语音识别技术,共同开发出书记员专用的客户端软件,语音识别的结果会自动反馈到该客户端软件上,书记员可以很方便地修改、标注、打印庭审笔录。不仅仅用AI提速了书记员的工作效率,而且形成
大数据文本,可以进行高频词分析、内容检索、知识挖掘等,用技术加快互联网+司法进程。
而在手机扫码看庭审的场景下,通过给每间法庭生成一个智慧庭审二维码,用手机扫码后,可以同步查看庭审视频和语音识别后的笔录文字,这种方式可支持诉讼参与人(当事人、旁听人员等)实时查看庭审过程。也可以把二维码推送给法院领导、代表委员,支持他们通过移动设备监督指导庭审活动,为司法公正增加“阳光”通道。
对于公众接触到的字幕式庭审直播和索引式视频播放,借助搜狗语音识别技术实现了庭审视频数据和笔录文字数据的关联,为庭审直播配上字幕,以及通过笔录文字对庭审视频进行反向的索引定位。通过这种方式,可面向社会公众实现更好的庭审公开效果,并支持法官、律师等在阅卷时更好地定位查看庭审视频。
作为国内最早进行语音识别研究的公司,搜狗每天响应超过2.6亿次的语音请求,为搜狗智能语音系统提供了海量的真实语料数据,使得机器不断自我学习,识别准确率越来越高,可
应用的场景也越来越广泛。
此次,搜狗与已建成为全国最大的庭审视频大数据存储中心和应用平台的新浪法院频道合作,是搜狗语音自研团队深入垂直业务场景下的又一个全新探索,解决智能庭审系统的现存问题,并着力推进语音识别等
人工智能技术为行业赋能。
针对实际应用的痛点,让语音技术为行业、为用户所用,“让人工智能真正服务于人”成为搜狗在人工智能领域的又一次场景突破。