近日,中译语通在北京举办“Hi, Five”2018品牌战略发布会,会上发布了科技
大数据平台JoveEye、知识图谱构建分析平台JoveMind、企业级人工智能应用硬件MerCube、VC短视频。亿欧有幸在会后采访了中译语通CEO于洋,从新产品JoveMind出发,畅谈了关于知识图谱与大数据在垂直细分领域的应用价值。 3年数据积淀,终磨成剑 要介绍JoveMind,就不得不提到中译语通在过去几年的发展与积淀。
成立于2009年的中译语通,是中国对外翻译出版有限公司的控股子公司,出身传统翻译却没有因此禁锢住自己的脚步,中译语通一直将自己定位于一家从事大数据与人工智能研究应用的科技公司。
在过去的3年里,中译语通先后研发了多语言呼叫中心、多语言机器翻译平台和全球大数据分析平台等产品,并且针对不同垂直行业,中译语通还推出了Insider标准大数据、JoveBird金融大数据、公共安全大数据等行业大数据解决方案,服务对象包括企业、政府、新闻媒体、金融投资等行业用户。同时,基于知识图谱、大数据分析、大数据可视化等技术,中译语通构建了“译云”语言科技与“译见”大数据生态体系。
本次发布的新品JoveMind,是一款全领域知识图谱构建分析平台,定位于企业级风险控制引擎。设计这款产品的目的,是希望它能够对企业做出包括跨地域竞争关系、市场风险、操作风险、信用风险、资本风险和战略风险等一系列企业的全景分析。
中译语通CEO于洋对亿欧表示:“ 在JoveMind知识图谱背后,是中译语通积累了超过3年的庞大数据量,包括各类开放的社交数据、工商数据以及法律数据。”
JoveMind四大企业全景分析功能,赋予用户“想象力” 对于用户来说,JoveMind企业全景分析的功能主要有4大类:
关系挖掘:企业知识图谱会显示出与其相关的公司、
人物、位置、产品等等实体,实体之间的连线则代表着彼此之间的关系,包括投融资关系、同事关系、高管关系,更甚至是营销合作关系。
风险识别:从中译语通将JoveMind定义为一款风控引擎就可以看出,对于金融、保险以及证券领域的风险识别是其最为重要的功能。JoveMind能够在海量信息中智能的识别和标记出企业在声誉、信用、
政策、资本等方方面面可能会遇到的风险,并通过关联关系清楚的将信息传达给用户。
时序推演:企业的发展是动态的,每一件事物的发展都有时序性,因此可以利用时序信息将企业的重大阶段一一重现。例如搜索“马斯克”,可以看到今年7月马斯克迎来了一波关注高峰,其原因是特斯拉将在上海开始建设超级工厂。
分析工具:于洋在介绍JoveMind时重点强调了它是一个
应用工具,原因在于,不论任何一家企业或者投资机构,也不论是电信、通讯、金融、法律等不同行业的数据,只要将其导入到JoveMind知识图谱中,它就可以将数据结构化的呈现出来。
于洋表示:“爱因斯坦曾说过,逻辑会把你从A带到B,想象力则能够带你去任何地方,我希望JoveMind能带给大家的就是这样一种想象力。” 知识图谱难落地?最怕你忽略了用户的需求 其实知识图谱分析工具早已经不是一个新鲜的名词,BAT都曾先后提出过相关概念,然而实际产品并没有真正落地。于洋认为,这一产品设计的核心是需要思考用户到底应该如何使用知识图谱进行分析,或者说,用户希望找到什么结果。
为了使产品更加贴近用户的需求,中译语通将产品定位到
金融领域,从垂直细分切入应用市场。在数据上,中译语通使用了全球最大规模的的结构化数据作为产品的支撑。在应用上,JoveMind能够按照时间节点对事件进行分析,挖掘出每一笔交易的逐级关系、竞对关系等风险因素。
“通过数据可视化和知识图谱可视化,每一家公司、每一个人、每一次事件都可以进行有维度的分析,这就是知识图谱带来的价值。”于洋进一步介绍:“JoveMind只是一款工具,想要将知识图谱的价值凸显出来,需要产品踏实地渗透到垂直应用场景中。”
这里的渗透有两个方面的表现:
一是基于现有的大规模结构化数据,Jovemind可以进行更智能的图谱构建、挖掘更深层次的实体关系、寻找更精准的风控线索。另一方面,JoveMind的技术已经触及到大数据的底层架构,对于系统原本没有的一些数据,可以通过AI技术体系进行全格式数据源引接。“JoveMind相当于一个底座,新数据导入到平台后,JoveMind可以对其进行快速的结构化处理和分析,最终输出一个可视化的知识图谱。”于洋介绍道。
探索大数据技术,是AI发展的必然阶段 随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网具有内容的大规模、异质多元、组织结构松散的特点,人们在获取有效信息时难免会受到阻碍。而知识图谱,则以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。
很多专家学者都认为知识图谱是
人工智能应用的先决条件。知识图谱用节点和关系所组成的图谱,为真实世界各个场景进行直观地建模,通过不同知识的关联性形成一个网状的知识结构,即机器所能理解的图谱。而形成知识图谱的过程本质,就是机器在建立认知、理解应用行业或者领域。
归根结底,知识图谱是对大数据的加工处理,使其能够发挥更大的应用价值。知识图谱的构建离不开自然语言处理技术,而中译语通依托原有的机器翻译和多语言呼叫中心业务,已经具备了能够将多语言数据集合在一起进行计算的能力。
作为一家重度to B的公司,中译语通未来会深耕于金融市场和科技研发等市场,依托大数据与人工智能技术,为企业方提供更多的“想象力”。于洋认为,探索大数据技术,是人工智能未来深入行业发展的必然阶段。而从技术角度来看,大数据在垂直领域也必将爆发出巨大的潜力。