视频也能提取“指纹” 阿里达摩院人工智能技术解决版权难题-人工智能-技术-爱吧机器人网

视频也能提取“指纹” 阿里达摩院人工智能技术解决版权难题

2017-12-05 21世纪经济报导浏览量：

　　版权问题一直是困扰视频行业发展的一大瓶颈，随着人工智能技术的逐渐成熟，这一问题也有望得到解决。

　　日前，阿里大文娱集团联合阿里巴巴达摩院共同发布了名为“鲸观”的全链路数字版权服务平台。据悉，该平台通过搭载达摩院iDST（数据科学技术研究院）的人工智能技术，可实现对视频的智能编辑，同时在音视频素材上抽取“指纹”，让其在全网范围可追溯。

马云与达摩院各位重量级人工智能学术权威合照

达摩院人工智能学术团队

　　这也是阿里达摩院自成立以后，研究成果的首次落地。阿里巴巴达摩院iDST首席科学家兼副院长任小枫告诉21世纪经济报道记者：“马老师（指马云）给我们定的目标非常高，我们要做的就是解决未来的问题。”其中就包括视频行业的版权保护问题。

　　解决盗版难题

　　近年来，视频行业得到了迅猛的发展。据中国互联网络信息中心第40次《中国互联网络发展状况统计报告》显示，截至2017年6月，中国网络视频用户规模已达到5.65亿。

　　与之对应的是视频数量的爆发。据今日头条创始人张一鸣近日表示，仅今日头条旗下的平台，每天就有超过2150万条短视频上传。但是，随着行业的迅猛发展，“搬运工”、“剪刀手”等侵权现象也变得日益突出，如何更高效地进行版权保护，成为视频行业发展的当务之急。

　　任小枫告诉21世纪经济报道记者，指纹对于视频的版权保护来说非常重要。如果能够像指纹一样去计算视频的精确特征，那就可以对每一个视频实现唯一的匹配。

　　以往，侵权者会通过加logo、压缩分辨率或者调整亮度等一系列操作来改变某一视频的特征。“但通过指纹技术，就能够在各种各样的变化中找出他们，现在我们已经可以去分辨多场景的视频，且准确率在99%以上。”任小枫说。

　　实现这一成果的背后，人工智能功不可没。据悉，鲸观平台在处理视频时，会利用达摩院iDST的人工智能技术对视频内容进行各个维度的分析，并为之打上两万余种标签，同时利用知识图谱对标签进行多维度编目。这样一来，视频内容就变得可识别和搜索了。

　　另据21世纪经济报道记者了解，除了精准的识别技术外，鲸观平台在视频处理效率上也实现了突破。目前，其通过一台机器就可以处理近30万小时的视频。

　　任小枫告诉记者，这是因为该平台采用了一个“二值”的索引引擎。简单来说，就是把视频所有的变化都转化成“二值”，即零或一，这样便能简化视频的指纹特征，使得存储和计算速度得到大幅提升。

　　目前，鲸观平台上视频的下载、解码、编码都能够达到毫秒级的处理速度，5分钟时长的视频经过上述全链路处理可在10秒内完成。更为重要的是，在这个过程中，视频的精度不会损失，和原始特征一模一样。

　　视频技术接近美国

　　今年6月，任小枫加入阿里担任阿里巴巴iDST首席科学家和副院长。资料显示，iDST是阿里巴巴负责人工智能技术研发的核心团队，成立于2014年，由一批杰出的科学家及工程师组成，分布在杭州、北京、西雅图、硅谷等地。

　　而在此之前，任小枫是亚马逊级别最高的华人科学家。他从2013年开始任职于亚马逊无人零售店AmazonGo部门，并领导计算机视觉算法团队。因此，其对计算机视觉领域中的图像分类、物体识别、跟踪、检测、事件检测等均有全面且深入的理解。

　　任小枫告诉21世纪经济报道记者，对于视频技术，他有很多期望，这次与阿里大文娱一起发布鲸观平台，也是希望视频技术在这个平台上能够得到锻炼和提高。

　　加入阿里以后，任小枫仍专注于计算机视觉领域的研究，并主攻图像视频内容的识别和理解。在他看来，目前的工作内容其实与在亚马逊并无太大差异，都是对动态的人体或者物体进行检测，同时对其姿态、动作进行分析等。

　　从技术角度来说，动态的视频要比静态的图片更加难以识别和分析。以人脸识别为例，在视频中就可能会受到分辨率、角度、距离等因素的影响。“为解决这些问题，我们选择使用超深卷积网络，并对模型简化加速，从而实现精准的人脸检测、跟踪、识别。”任小枫说。

　　但对于这位技术大牛而言，他脑海中对视频的理解，并不是简单的给视频加上一些标签，而是要能对视频内容更加细致的理解和分析。比如有些视频的人物、场景都无法识别，但可以分析他们的关系；或者可以对一些动作、行为进行识别和分析。这也将是阿里巴巴iDST未来要研究的方向。

　　任小枫坦言，视频技术正处于快速发展的阶段，他自己也在思考，除了提升现有的一些技术应用外，还有没有新的领域可以进行探索。

　　而在谈及中美的技术差异时，他告诉记者，中国在人工智能技术上与美国其实还是有一些差距，不过，在人脸和图像的识别技术上，这个距离已经非常接近。

精选推荐

一个让深度学习惨败的通用人工智能领域——语境处理

[2019-11-04] Context是指用来解释一段给定文本或语句的来源框架，我们可以翻译为上下文或语境。维基百科将context定义为：*在符号学、语言学、社会学和 ...

麻省理工正研究植物机器人让植物自主控制机器人

[2018-12-08] 控制论通常指人类用机器人部件增强自己。我们听说过动物机器人或昆虫机器人，但我们很少听说植物机器人对吧？一个机器人其实是对植物有很大益处的，因为一般植物根本无法移动......

研究人员融合人类与AI的创造力显著提高了深度学习的表现

[2019-10-12] 由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族，可以在智能 ...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

人工智能民主化能否实现取决于科技巨头

[2017-12-29] 我们经常听到像谷歌和微软这样的公司说他们希望人工智能民主化。这是一个很好的词，民主化。但这些公司如何界定“民主化”还不清楚，像AI本身一样，它似乎有点炒作的味道...

全自动膝关节置换手术机器人被美国FDA批准上市

[2019-10-14] 美国Think Surgical公司已获得美国食品和药物管理局（FDA）的批准，在美国销售用于全膝关节置换（TKA）的TSolution One®全膝关节应用 ...

美国Natilus公司试飞水上无人货机设计简单成本降低

[2017-12-28] Natilus创业公司成立于2014年，其梦想是建造大型无人机，以半价提供比船舶快得多国际货运。在十二月份，Natilus计划在旧金山湾测试一个9米翼展的小型原型无人机的水上滑行能力......

MIT用深度学习处理3D点云数据应用于无人汽车等领域

[2019-10-23] 如果你见过自动驾驶汽车，也许会对车顶上那个一直在旋转的圆柱体感到好奇。这是一个雷达传感器，无人驾驶汽车依靠它在现实世界中进行导航。 ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

说一说那些进入日常生活的智能机器人

[1970-01-01] 　　从《星球大战》里的机器人英雄，到前些年大受欢迎的电影《我，机器人》，无数的科幻作品里都少不了机器人元素，人们将之视为未来感的 ...

奇点大学：人工智能与“奇点理论”

[1970-01-01] 　　就在前几天和行业内的几个朋友吃饭时，内容在不经意间又转向了那个老生常谈的话题-到底什么是在智能电视上最好的交互方式上，于是乎五 ...

说客小π情感机器人体验【评测】

[2015-12-29] 　　前言　　随着语音识别技术的发展，声控灯、语音输入法、语音交互等各具特色 ...

Facebook人工智能机器人生成照片以假乱真

[1970-01-01] 　　无论你是否认为面部识别令人毛骨悚然，很明显全球多家科技公司正在继续投资开发更强大的图像智能技术。　　无论是微软的猜年龄机器人， ...

麻省理工智能机器人最新技术机器手指研究获得突破

[2015-12-27] 　　麻省理工智能机器人最新消息，今年在研究机器手方面跨出了一大步，现在它又 ...