二十五年前(1990年),当时在清华紫光集团工作的张连毅几乎拜访了清华大学每一个从事人工智能相关技术研究的实验室,接触到了语音合成、语音识别、光学字符识别(OCR)、手写识别、语义理解、机器翻译等人工智能技术,但那个时候大部分的技术还停留在实验室研究阶段。面对分布在不同实验室的技术,张连毅在想:如果有这些技术都成熟了,应该组合起来,这样会产生更大的作用。1991年,张连毅选择以OCR为突破口,与清华大学吴佑寿院士、丁晓青教授一起推动OCR技术的商品化进程,并将清华OCR打造成国内。清华OCR不仅是国内人工智能领域第一个实现商品化的技术,也自此打开了中国人工智能技术实现商品化的大门,开启了中国人工智能技术产业化的进程。
人工智能技术经过整整二十年(1990-2010)起起伏伏但又规律性的发展变化,终于在互联网、移动互联网的推动下,大数据与机器学习的完美结合推动人工智能迎来一个崭新的发展阶段。创建十年之久的捷通华声,果断抓住机遇,倾全力打造定位于全方位人工智能技术的开放平台—灵云(hcicloud.com)。
创建于2011年的灵云作为第一个开放的全方位人工智能云服务平台,将智能语音交互、图像识别、语义理解、生物特征识别等人工智能技术完美整合,用户可通过移动互联网、互联网,使用任何设备,在任何时间、任何地点,随时随地享受灵云提供的“听、说、读、写、意……”等全方位人工智能技术服务。创建灵云,不要说对一家处于创业发展中的民营企业,即使对财大气粗、人才济济的BAT恐也不是一件容易的事,因为涉及的技术太多,如语音合成、语音识别、声纹识别、手写识别、OCR、人脸识别、指纹识别、自然语言理解、大数据分析等,其中每项技术都有很高的技术门槛,甚至围绕每一项技术都可以创建一家企业。回忆当时所面对的挑战、争议,甚至怀疑,张连毅平静地说:灵云不仅是个全方位人工智能开放平台,即使在世界范围内至今也还没见到同类型的全方位人工智能开放平台。中国互联网缺乏原创,有一些争议、怀疑属于正常。坚定信心,不意味忽视挑战,而二十年前的梦想,将张连毅与捷通华声重新带回到梦想的发源地—清华大学。
捷通华声创建灵云的规划与设想,很快得到清华大学相关部门的支持。2012年,清华大学产业发展基金入资捷通华声,2013年、2014年、2015年,捷通华声与清华大学战略合作相继创建了“清华灵云人工智能研究中心”、“清华校友人工智能联盟“、“清华海峡研究院人工智能研究中心”。在清华大学人工智能科技力量的支持下,灵云平台“如虎添翼”,历经四年发展,灵云已成为中国人工智能领域、最全、影响力的云服务平台,“灵云科技源自清华”已成为中国人工智能产业中最响亮的品牌。
每个企业都是根据对人工智能的理解去发展,捷通华声对人工智能有着自身独特的理解,捷通华声期望从人的角度去理解,真正从人的生活、交流、交往和学习过程中去理解,从产业实际应用的角度去理解,以此来推动人工智能技术的发展,也正基于这种理解,捷通华声将灵云定位为全方位人工智能云服务平台。
在张连毅看来,人工智能技术能够真正地帮助人与人、人与机器人的沟通一定要实现全方位交互,要做到“能说会听、能写会看、能思考会判断”。张连毅解释说:“就像一个人,如果只会说与听,但眼不能看,那是个盲人;如果眼睛能看,但不能说与听,那是个聋哑人;如果一个人能说会听,能写会看,但没有思维,或者不认识其他人,那可能是个弱智”。
灵云经过四年发展,在清华大学的支持下,实现了技术上从少到多,各项技术准确率、识别率从低到高的过程;实现了从提供灵云语音合成、手写识别技术服务,到向产业合作伙伴、社会大众全面提供灵云语音识别、声纹识别、OCR、人脸识别、指纹识别、语义理解、大数据分析等全方位人工智能技术服务。
创建灵云也并非这几年之功,捷通华声自2000年创建之初,就已经定位发展全方位人工智能技术,十几年的发展中,通过向合作伙伴提供核心技术产品的模式走向市场,依托数千家企业的支持,其语音合成、手写识别技术保持拥有国内50%的市场份额。捷通华声在发展中,一直保持低调务实的风格,但如果你用滴滴、快的找过车;使用过百度导航、搜狗导航、导航犬导航;使用各种品牌输入法中的手写识别;打电话去各家银行、各大运营商听到智能语音服务;坐过高铁……那你就可能是捷通华声的用户,享受过捷通华声的人工智能技术服务。正是坚持以人工智能技术服务十三亿社会大众,捷通华声打下了创建灵云,发展全方位人工智能技术服务的基石。
2015年第一届清华校友人工智能论坛张连毅(左四)与张钹院士(左五)、清华教授、校友合影
<上一页 1 2 3 4 5 6 7 下一页> 余下全文