在我国,似乎永远没有一个满意的标准,能够简洁而客观公正地评价科技成果。
用论文数量吗?论文多不代表影响力大;用影响因子吗?不同专业领域有很大差距;用领域期刊排名吗?不同领域的研究深度和难度确实有差别;靠人评价吧?中国人有关系、派别、背景,还有名不副实者;那全部请外国人来评吧?好像也不靠谱。
众说纷纭,莫衷一是。找不到一致的办法,只好沿用既有的办法评下去。
不久前,国家重点实验室评估,把微生物领域3个实验室齐整整地评到黄牌警告行列里。我很受刺激,因为至少有两个实验室在微生物领域水平是很高的。再这样评下去,不是人为地把一些重要领域和专业方向从中国版图上抹掉吗?
报道称,中科院自动化研究所研发出评分机器人,将参与音乐比赛评分。人工智能可做声像识别、棋局推演,甚至行文作诗,基于算法、利用
大数据,加上自主学习,表现往往超过人类中的专业高手。而且,人工智能没有门派关系,没有专业偏见,当然前提是没有被主人设定某种歧视软件。
于是,我想象着让这些研究机构做一批人工智能机器人,奔赴国家奖、省奖、杰青、长江、千人,重点研发计划、重大专项、重点实验室评估,还有各类职称、荣誉评定等各种不见硝烟的战场。让不同型号、算法的人工智能定量、定性评价,占总分的50%,另外50%让人类专家评定,两相加权,得出总体评价和取舍意见。
这样的做法靠谱吗?那就论证一下吧。
首先,这样做又让中国多一个领先世界的突破口。当年,就是中国人率先把SCI影响因子变成大范围学术评价的规范做法,可谓领世界科学风气之先,后来西方科学期刊纷纷标明自己的影响因子,连西方教授们投稿也要看看期刊有几分。可SCI影响因子毕竟是西方人发明的,我们最多是
应用推广。现在,如果能把科技评价机器人做成功,广为应用,推向世界,岂不是对世界科学的一大原创性贡献?
其次,除了公正无私的特点,
人工智能有绝对超人的文献储备和阅读耐心,更有批量、快速处理的特征。
笔者见过太多评审,申报人多年的工作在评审会上只是几分钟决定命运。没有多少专家有耐心或者有时间认真阅读申请人的论文,更不可能研究其在专业领域的真实水平和实质性贡献。往往只能靠一两个恰好在场的小同行专家的介绍。
那么,在更大领域里怎样比较出优良中差呢?几乎没有办法,最后只好用公认的硬通货——CNS论文,或者影响因子。
人工智能不同,以它们每秒数万亿,甚至亿亿次的运算,可以在一分钟内搞定送审材料原文的阅读、专业文献检索、对学术水平和贡献的权衡掂量,还有对未来影响力的判断。
假如有一篇热门问题的文章发表于《自然》,另一篇原始创新的论文发表于JBC,到了人工智能面前,它要依据自身对这两篇论文的阅读,与大领域、小领域文献的比较、分析,凭借历史上科学评价的大数据和其自我学习功能,作出独立判断,而不是像《自然》的小编那样,查查是不是热点问题和大牛实验室而作出是否送审决定。
再次,人工智能不仅评价论文,还适合于评价专利、转化、推广等各类贡献。将来物联网、大数据的应用会把足够多的经济社会信息融会贯通,成为人工智能作评价的信息资源。一项成果的原始创新性、应用价值、实际效果和未来前景在专业评价机器人面前将一览无遗。
最后,从科技评价机器人做起,将来各类评价机器人的市场将极为广阔。譬如,城市排名、大学排名,年终评优、人才选拔以及恋爱相亲等等。
放飞脑子得出的结论,或许还能有点启发。