百度硅谷AI实验室(SVAIL)近日宣布,百度已开源关键 人工智能 (AI)软件Warp-CTC,并公开了关键代码。百度硅谷实验室已向GitHub上传了Warp-CTCC代码库,鼓励开发者试用这些代码。百度表示,代码将开放给所有从业者,包括但不限于创业者。百度此次开源 人工智能 软件代码,让全球知识共享又迈出了一大步,知识共享领域将激发出更多创新,开发者能获取更丰富的技术学习途径,促进开发者进行技术开发,对全球 人工智能 行业发展有着极其重要的现实意义。
Warp-CTC是百度前期为了在最新的计算机芯片上更快速运行而专门研发的一种改良版深度学习 算法 。CTC(链结式时间分类 算法 )方法始于2006年,在瑞士AI实验室IDSIA的论文中有所描述。CTC结合了多个不同的 神经网络 设计,以处理不完美的数据集。百度SVAIL工程师在打造端对端 语音识别 系统时,在CTC基础上开发了Warp-CTC,该软件可用于解决绘制输入序列到输出序列图谱过程中的监督问题,改善培训模型的可扩展性,目前百度已经将其运用在了 语音识别 的改进和优化上。
在此次正式开源之前,Warp-CTC已被用于开发一款强大的深度 语音识别 系统DeepSpeech2。对于一些简短的句子,该系统甚至比大多数人类正确识别语音的能力强。该技术目前已帮助百度数亿用户在移动端更好的获取相应的服务。百度也表示,希望此次开源能促使端到端的深度学习变得更简单、速度更快,加快研究者的进度,进而对 机器学习 领域的进步做出贡献。
近几年来,包括深度学习、 语音识别 等在内的 人工智能 技术已经成为行业热点。以深度学习为例,将这项技术应用到 互联网 产品中之后,就可以实现各种“用脑”的学习型操作,如精致地转录语音或识别物体图像,相当于将特定字词的音频或特定物体的图像导入一个大型模拟 神经网络 ,随着时间推移,此网络将不断“自我学习”,从而可以识别出更多的新目标。Warp-CTC技术的应用将有效改善用现有的方式应用CTC时对内存的庞大需求,提升速度数十甚至数百倍。
随着百度、谷歌、Facebook等企业全面免费开放各自的深度学习技术,研究者和开发者们很快就可以使用这些国际顶尖的基础技术平台开发 机器学习 系统产品,从而推动整个 人工智能 生态的繁荣。作为一家技术驱动的公司,百度深知,公开技术源代码将会引起业界更多的兴趣和热情,使得相关的技术发展进入良性发展的循环,为整个产业提供强大的技术驱动力。文字/于琦