自年始,剑桥大学博士IanHogarth与NathanBenaich合著发布《AI全景报告》。在最新一期赛迪译丛中,赛迪智库工业经济研究所对该报告进行了编译。
年10月发布的年度报告指出,当前人工智能研究的开放性并不高;美国仍是当前人工智能国际研究中心;人工智能在医疗领域发展迅猛;人脸识别面临隐私风险,亟待有效监管等。在报告的最后,作者对未来人工智能领域做出了八大预测。
01
研究进展
AI学习框架、语言和模型
AI的开放性并没有我们预想的那么高
大多AI技术都封闭源代码,只有15%的AI论文公布了其源代码。自年中以来,这种情况几乎没有得到改善。一般来讲,与学术机构相比,行业机构更不倾向于发布其代码。OpenAI和DeepMind1这两大著名机构就没有发布其所有代码。对于大型科技公司而言,它们的代码通常与不能对外发布的专利性内容交织在一起。
在深度学习框架上,PyTorch逐渐受到欢迎
在AI相关研究论文中,对Facebook的机器学习框架PyTorch的使用迅速超过谷歌的机器学习框架TensorFlow。PyTorch提供更大的灵活性和动态计算图,使实验变得更加容易。在这些论文中有20-35%提到了他们使用的框架,其中有75%使用了PyTorch,而非TensorFIow。年,在位作者中,多数人发表的论文都是基于TensorFLow框架,但现在有55%转向了PyTorch。在代码托管平台GitHub上发布的论文中,PyTorch也比TensorFlow受欢迎。其中,47%的论文实现基于PyTorch,而18%基于TensorFIow。
自然语言处理全新评估基准SuperGLUE正式发布
GLUE是在一系列任务中评估自然语言处理系统的基准,这些任务涉及逻辑、常识理解和词汇语义。就在12个月前,在GLUE基准测试中,人类被AI超越1分。年8月,自然语言处理(NLP)全新评估基准SuperGLUE正式发布。基于一年前推出的GLUE基准,SuperGLUE包含了一系列更难理解的语言挑战、改进的资源和公开的排行榜。
模型参数和模型性能调整花费巨大
现阶段,哪怕略微提升一下模型性能,我们都需要付出高昂的计算、经济和环境成本。如果没有新的重大突破,将ImageNet错误率从11.5%降至1%将需要超过千亿美元的费用。许多从业者认为想要在机器学习的成熟领域进行突破变得十分困难。要实现相同的性能,较大模型比较小模型需要的数据更少,这会对训练数据样本生成成本昂贵的领域产生影响,而对使用基于监督学习的模型进入新领域的大公司来说是优势。
生物学相关AI技术
生物学正经历其“AI时刻”。自年以来,涉及生物学AI方法(如深度学习、自然语言处理、计算机视觉、强化学习)的出版物同比增长超过50%。
年以来发表的论文占年以来总产出的25%,年,有超过篇涉及生物学的AI论文发表。
因果推理助力机器学习
大多数机器学习应用程序使用统计技术来探索变量之间的相关性。这就要求实验条件保持不变,并且训练后的机器学习系统只能应用于与训练数据相同的数据。这个过程忽略了人类学习的一个主要组成部分——因果推理关系。有时我们需要了解策略变化对结果的影响,如,医生是否应该给病人进行某个特定疗程的治疗。基于相关性的机器学习系统并不能达到该设计目标,因为一旦策略发生变化,输入和输出变量之间的关系将与训练数据不同。因果推理明确地解决了这个问题,这将是一种有效的新方法,使机器学习系统能够更快普及,功能更加强大,并为决策提供更具参考价值的意见。
图形神经网络可以利用3D输入数据解决问题
大多数深度学习方法侧重于从2D输入数据学习。图形神经网络(GNNs)是一个新兴的处理3D数据的方法。一个团队利用分子及其二元抗生素毒性的经验数据训练出了一个图形神经网络。这个模型对数百万种潜在的抗生素化合物进行筛选,最终找到一种结构不同的抗生素—Halicin(暂命名为海利霉素),其在小鼠体内具有广谱活性。
AI可通过用DNA编码的小分子文库(DEL)对化学空间进行筛选
用DNA编码的小分子文库是由数百万到数十亿个小分子组成,这些小分子带有独特的DNA标签,可以看作是大分子的砌块。基于用DNA编码的小分子文库数据训练图形神经网络,并将其应用于三种不同的蛋白质靶点,在30微米时产生72%(sEH)、33%(ERa)和16%(c-KIT)的命中率。这与传统的高通量小分子筛选(无机器学习)形成鲜明对比,后者的命中率通常为1%左右。
语言模型有助于仅依靠氨基酸序列预测蛋白质特性
蛋白质是一种生物分子,可以通过晶体结构()或氨基酸序列(万)对其进行描述。与学习单词向量的过程类似,这项工作表明,通过循环神经网络(RRN)学习得出的氨基酸序列表征,可以预测不同蛋白质的各种结构和功能特性。
其他相关AI技术
计算机视觉任务获得更多
转载请注明:http://www.0431gb208.com/sjszjzl/4446.html