机器学习太讨厌！细数ML五大罪，引发网友大讨论-机器学习-技术-爱吧机器人网

机器学习太讨厌！细数ML五大罪，引发网友大讨论

2019-07-15 量子位浏览量：

鱼羊发自凹非寺

在当今的人工智能领域，机器学习已成主宰，独领时代风骚。

但登上技术王座并不意味着地位永固，万众归心。

偏偏就有人不买账，恨不能拿着大喇叭向全世界宣布：讨厌机器学习！

甚至还有理有据，灵魂拷问机器学习。

振臂一呼，追随者众。对机器学习的质疑掀起波澜，引发了一片热议。

五问机器学习

质疑源自一位不愿透露姓名的人工智能研（shou）究（nue）者。

灵魂质疑一：今年的技术明年就out

当年还说RNN好，转头就投入了CNN的怀抱。

如果不做技术的弄潮儿，转眼机器学习的大浪就把你拍死在沙滩上。

技术迭代是正常的，可无休止的更新会让一天的专注学习全都付诸流水。

灵魂质疑二：付费墙

想做机器学习，数据集和算力缺一不可。

拥有更强大的计算资源，你就可以快人一步地训练并测试方案。

那不就是比谁更能烧钱吗？

诚然在许多工业领域，资金投入一样非常重要，钱总能带来更快更好的进步，但在机器学习领域，问题远不止于此。

只要肯烧钱，即使你的数据集分类器是一坨垃圾，你的模型也可能比别人学得更快更好——这才是问题所在。

哦，做数据集也要花钱呢！

这还不够让人讨厌的吗？

灵魂质疑三：code/改进机器学习代码令人沮丧

黑盒是老生常谈了，但你可知道，它竟给程序员造成了精神折磨？

码代码解决问题给人一种创造的快感，但神经网络的黑盒属性破坏了这一切。

做一个炼丹师会快乐吗？不会的。我调参了，我的分类准确度提升了，可它是为什么提升的？鬼知道！

这位工程师举了个例子，Ta曾花费了数周的时间在改变输入数据的形态和设置，调整每个层的节点数量这样的事情上，然而，这一切毫无效果。

有一天Ta把稠密层上的激活函数从relu换成了selu，神奇的事情出现了，只是改变了字母，网络的准确度就超越了过去几周里所有的尝试！

这样的感觉太糟糕了，就好像你并把握不住你的代码。你做出了调整并且也知道会有所改进，可这个改进在何时何地以何种程度出现，没人能给出准确的答案。

花费在这种事情上的时间越久，失望的感觉就会捆得人越紧，到底是我玩机器学习，还是机器学习玩我？

工程师可不是无情的调参机器啊。

灵魂质疑四：依赖数据集

没有数据集的神经网络是没有灵魂的空壳，可数据集会存在什么样的bias可说不好。

拿考试复习来举个例子，非机器学习的方式是从头开始建立对学习资料的理解，扎实的理解足以解决任何可能出现的问题。

而机器学习的方式则是搜集教授前几年出的试题，而后疯狂刷题。

诚然刷题可能会让成绩更好看，但问题是在考试结束之后，在实际解决问题之时，真正掌握了知识的人更有可能发挥坚实的作用。

更糟糕的是，在机器学习的逻辑里，如果答题出错，那么一定是因为这道题没出过。

在实际应用场景当中，神经网络会把数据集里的固有偏差变成自己的特质，在遇到以前没有见过的情况时它就变成了那个不靠谱的猪队友。

灵魂质疑五：建议使用机器学习解决问题的人和真正的ML工程师缺乏联系

引发热议

五点质疑引起热烈讨论，许多人产生了共鸣：

我非常烦恼的是有些人文章写得稀烂还沾沾自喜，要是不开源代码，我压根不想读他们的文章。在这个领域里，许多结果根本无法重现。

付费墙这件事我也很想吐槽。看英伟达的论文里说的：噢，看我们这个网络多么鹅妹子嘤，你只需要8个V100就能复现我们的工作哟。简直想打人。

赞成。让模型变快基本就是纯靠经验，课程和教材都没啥帮助。不过倒是有一些技术标准可以用来诊断模型里偏差 vs. 方差的问题。

也有人不以为然：

我认为这些方法并没有变化得那么快。注意力机制是在2013年提出的，但它对机器翻译来说依然非常重要。同样的例子还有LSTM，90年代末期它就出现了。

甚至是RNN，尽管用的比以前少了（这也是有争议的），但ResNet在概念上仍对LSTM有很大影响。

机器学习的准入门槛很低了，有时候甚至能从Google和AWS上拿到免费的GPU时间。即使是在计算机科学领域，ML也不是最贵的。更何况ML是非常开放的，很多最新研究成果都能轻松获取。

其实，机器学习还是一个非常年轻的领域，它潜力巨大，但这也意味着存在许多未知。随着基础研究的推进，这个黑盒在未来很可能渐渐透明，发挥更加强大的超能力。

你觉得呢？

精选推荐

谷歌在中国成立一个新的人工智能（AI）研究中心

[2017-12-13] 谷歌正在中国建立一个新的人工智能（AI）研究中心，希望进一步扩展到中国，以充分利用中国高度重视的人工智能技术。人工智能是目前地球上最具竞争力的领域之一，亚马逊，微软......

CES 2018：英特尔推出49量子位芯片争夺量子霸权

[2018-01-10] 在与Google、IBM的一场关于建立量子计算系统的马拉松比赛中，英特尔通过了一个关键的里程碑。近日，这个科技巨头已经推出了一个49个量子位 ...

农业将为高科技行业农业机器人的应用领域

[2017-12-17] 农业正在迅速成为一个令人兴奋的高科技产业，吸引了新专业人士，新公司和新投资者。技术发展迅速，不仅提高了农民的生产能力，而且促进了我们所知道的机器人和自动化技术的发展。...

担心机器换人？自1950年以来只有一个职业被机器彻底取代

[2017-03-21] 虽然有很多关于机器人取代工人的担心，但哈佛经济学家James Bessen的论文指出，在过去的67年里机器人仅仅淘汰掉人类工作中的一个。在1950 ...

从AI中窥探人性

[2018-01-03] 人们对人造智能的恐惧早已成为科幻书籍和电影的极好题材。但现在，一些同样的担忧开始影响关于现实世界AI技术的政策讨论。如果这样的担忧演变成为一种技术恐慌...

机器人iCub作为嵌入式AI的标准机器人研究平台的重要性

[2017-12-24] 机器人的研究在过去10年中得益于一个具有嵌入式人工智能（AI）的标准化开源平台——人形机器人iCub。iCub最初在意大利被创建，如今在欧洲、美国、韩国、新加坡和日本的实验室......

机器人从工业走向家庭库卡KUKA目标是引领中国市场

[2017-12-08] 机器人正在改变着人们的生活方式，而库卡KUKA想要在中国这个大蛋糕中占有一块大份额，库卡公司正在引领市场...

英伟达用联合学习创建医学影像AI 可共享数据和保护隐私

[2019-10-14] 英伟达（Nvidia）和伦敦国王学院（King’s College London）的人工智能研究人员利用联合学习训练了一种用于脑肿瘤分类的神经网络， ...

本站内容除了特别注明本站原创以外均来自互联网，文章观点不代表本站立场，文章版权归属原作者；如涉及版权问题，请联系smf101@163.com，我们会立即处理。谢谢配合！

本周栏目热点

盘点全球十大最具影响力的机器人摇篮

[1970-01-01] 　　人工智能（AI）研究现正迅速发展，如无人驾驶汽车、计算机在《危险边缘》智力竞赛节目中获胜、数字私人助手Siri、GoogleNow和语音助手C ...

深度学习反向传播算法（BP）原理推导及代码实现

[2017-12-19] 分析了手写字数据集分类的原理，利用神经网络模型，编写了SGD算法的代码，分多个epochs，每个 epoch 又对 mini_batch 样本做多次迭代计算。这其中，非常重要的一个步骤，......

如何在机器学习项目中使用统计方法的示例

[2018-07-23] 事实上，机器学习预测建模项目必须通过统计学方法才能有效的进行。在本文中，我们将通过实例介绍一些在预测建模问题中起关键作用的统计学方法。...

模拟退火算法（SAA）

[2017-08-28] 模拟退火（Simulated Annealing，简称SA）是一种通用概率算法，用来在一个大的搜寻空间内找寻命题的最优解。1、固体退火原理：将固体加温 ...

Machine Learning-感知器分类算法详解

[2018-05-31] 今天我们来讲解的内容是感知器分类算法，本文的结构如下：什么是感知器分类算法，在Python中实现感知器学习算法，在iris（鸢尾花）数据集上训练一个感知器模型，自适应线性神......