(原标题:“天机芯”让无人自行车有了“大脑”)
8月1日,施路平及团队的研究成果被《自然》杂志选为封面论文。
行驶中的无人自行车。 清华大学图片
天机芯片单片(左)和5x5阵列扩展板(右)。 清华大学图片
要让一辆普普通通的自行车学会“无人驾驶”,使它具备维持平衡、躲避障碍、跟踪目标、识别语音等十八般武艺,需要多长时间?
对于清华大学教授施路平及其研究团队来说,这个问题的答案是“七年”。
研发难点在于无人自行车的“大脑”——能兼容多种算法和任务的人工智能芯片,适合未来迭代发展。为此,施路平及团队选择了一条少有人走的路:沿着类脑计算的路径,研发出全世界首款异构融合类脑芯片。
北京时间8月1日,施路平及团队的研究成果在《自然》杂志发表,并被选为封面论文。施路平说,无人自行车只是一种展示,团队将芯片命名为“天机芯”,希望能推动人工通用智能的发展。
AI芯片
对人工智能至关重要的“大脑”
2016年,谷歌旗下的AlphaGo大胜韩国围棋国手李世石,技惊四座。随后的这几年里,人工智能应用遍地开花,从工厂里的零件组装到论坛上的实时翻译,人工智能在许多方面展现出了超越人类的能力。
在人工智能系统中,芯片就像坐镇指挥的“大脑”,起着至关重要的作用。从海量数据的获取、存储到算法的运行,都离不开芯片这一基础。人工智能系统的数据规模大、计算量大,传统的中央处理器已经不能满足其算力需求。因此,近年来,英伟达、谷歌、亚马逊等大公司都在着力研发自己的人工智能芯片。AlphaGo下围棋时,就动用了谷歌为机器学习特别定制的芯片。
然而,无论是AlphaGo还是其他应用,都没有走出“专用人工智能”的范畴。专用人工智能,即只能处理某个领域特定任务的人工智能系统——例如,AlphaGo下围棋很厉害,却未必能解出小学一年级的数学题。
与专用人工智能相对的,是“人工通用智能”。人的大脑,就是最典型的通用智能系统,能处理视觉、听觉、学习、推理等多种任务,具备举一反三、融会贯通的能力。发展通用人工智能,是人工智能学界一直在努力的方向。
施路平介绍,一直以来,学界有两种研发人工智能的方法,分别是基于计算机科学和神经科学为导向。前者主要是让计算机运行机器学习算法;后者则让计算机尽可能模拟人类大脑,用硬件模拟人脑神经元和突触的信息处理特性,进行类脑计算。
虽然这两种方法都可以解决特定领域的问题,但仍然难以让人工智能系统像人类一样解决复杂动态问题。同时,两种方法的计算原理和编码方案存在根本差异,且依赖于截然不同且互不兼容的平台。这极大地限制了人工通用智能的发展。
施路平和同事研发了一款融合上述两种方法的类脑计算芯片,名为“天机芯”。该芯片有多个高度可重构的功能性核,可以同时支持机器学习和类脑计算。
“天机”问世
让人工智能处理复杂任务
北京时间8月1日,相关研究成果在《自然》杂志发表,并被选为封面论文。据清华大学介绍,这也是中国在芯片和人工智能两大领域实现《自然》论文的零突破。
在本研究中,机器学习算法以人工神经网络(ANN)为代表,类脑计算算法以脉冲神经网络(SNN)为代表。论文作者之一、清华大学类脑计算研究中心首位博士生邓磊说,两种算法有不同的计算原理和编码方式,计算架构和存储架构也非常不一样,因此,芯片设计时最大的难点,是如何让两种算法模型深度、高效、无缝地融合。
据了解,SNN的计算要考虑到模拟神经元的变量,这是由脉冲事件驱动的;ANN的计算主要与密集的乘法、累加操作相关。同时,SNN需要可编程存储器和额外的高精度存储器,以存储模拟神经元的膜电位、发射阈值和不应期,而ANN仅需要用于激活存储和变换的字节存储器。
邓磊解释,要实现融合,仅仅把支持两种算法的器件模块“拼在一起”是不行的。要让新的芯片架构能够兼容不同的算法,而且又可以灵活的配置、具有高性能,芯片每一部分的比例、面积、功耗都要进行精密地安排。
为此,研究团队设计了一个统一的功能核心FCore。为了实现深度融合,几乎整个FCore都可以重新配置,以便在不同模式下实现高利用率。模拟神经元的胞体、树突在运行过程中分为多组,每个组内的计算是并行的,而组间计算是串行的。FCore能够作为ANN和SNN之间的转换器,涵盖大多数SNN和ANN使用的线性积分和非线性变换操作。
天机芯片由156个FCore组成,包含大约4万个神经元和1000万个突触。研究团队用一个无人自行车系统验证了“天机芯”的处理能力。
试验中,无人自行车不仅可以识别语音指令、实现自平衡控制,还能对前方行人进行探测和跟踪,并自动过障、避障。也就是说,无人自行车已经在一定程度上展示了一点“通用智能”。团队希望通过改变环境迫使系统因应改变,从这个过程中总结规律,探索发展人工通用智能可能的路径。
邓磊介绍,无人自行车的语音识别使用的是脉冲神经网络,目标和障碍探测使用的是机器学习中的卷积神经网络。“传统的人工智能芯片只能支持单一类别的模型,很难要让这些多模态的模型实时高效交互”,他说。
兼容多种算法后,芯片不仅可以提高信息处理速度,还能大幅度降低功耗。施路平说,目前只是初步的尝试,芯片还有非常大的优化改进空间,团队正在为此而努力。
商用转化
推动通用人工智能发展
天机芯片融合了类脑计算和基于计算机科学的人工神经网络计算。这种融合,有望提升各个系统的能力,提供一个研究人工通用智能的计算平台,推动人工通用智能研究,从而赋能各行各业。
值得关注的是,天机芯片由中国科学家完全自主研发。据了解,人工智能和机器学习技术是美国拟列入出口管制的14类技术之一,不对中国开放。2008年,IBM在美国国防研究局的支持下开展类脑芯片研发,直到2014年才推出首款类脑芯片“TrueNorth”。
TrueNorth的面积为430平方毫米,内置100万个模拟神经元。论文作者之一、清华大学精密仪器系副研究员裴京说,天机的面积为14.4平方毫米,内置4万个神经元。“折合成密度来看,天机比TrueNorth高了20%”,速度提高一个数量级,带宽提高两个数量级,裴京说,这意味着,天机能更好地满足人工智能计算的需求。
谈到过去七年来的挑战,施路平说,难在多学科融合,也难在没有任何先例可以借鉴。研究刚起步时,找不到相关文献一度让他很苦恼。为了寻找灵感,他在一次独自登山的行程中,故意让自己走丢,思考怎么在困境之中找到出路。
他说,天机芯片得以诞生,要感谢清华大学、北京市、科技部和自然基金委的长期支持——在《自然》杂志此次选用论文之前,团队几乎没有发表过任何研究成果。没有“论文绩效”的压力,团队得以心无旁骛地进行研究。
据了解,天机芯片的商用版本最快今年年底将问世。届时,单芯片峰值算力和能效还会有大幅度提升。裴京说,类脑芯片的最大特点是低能耗,将来有望在民用领域得到广泛应用。
采写:南都记者 冯群星