数据科学学院丁宏强教授专访:做学术不崇拜权威
数说名师|导语
香港中文大学(深圳)数据科学学院(SDS)以师资见长,学院拥有一支由计算机科学、运筹学、统计学等学科国际化学术人才组成的高水平教授队伍。
全球千强科学家中五位教授任职于SDS(点击查看Guide2Research“全球千强科学家”榜单),其中还有跻身全球百强的教授。教授队伍中有曾在世界顶尖高校任教的终身教授,有培养出四位院士的名师,也有《人民日报》报道过的高端人才,他们在学术界和工业界都有着显著的国际影响力。
SDS在成立一年内,汇聚了众多拥有辉煌履历的国内外名师。我们将推出系列教授访谈,带您探索SDS教授们的学术实力、育人理念以及他们对学术的坚持。相信在访谈中,你们会找到适合追随的人生导师,也会更加了解SDS。
数据科学学院
校长讲座教授
丁宏强
Chris Ding
全球前0.1%顶尖科学家之一
全世界计算机领域Top 400高被引学者之一
原德克萨斯大学阿灵顿分校终身教授
原劳伦斯伯克利国家实验室计算机科学家
曾获NASA团体成就奖
曾获ICDM、ICMLA、ECML、ISUG最佳论文奖
曾发表美国《科学》(Science)杂志封面文章
研究领域:
机器学习、数据挖掘、生物信息学、信息检索、网络链接分析、高性能计算
简介:
丁宏强教授曾入选中美联合培养物理类研究生计划(CUSPEA)项目并赴哥伦比亚大学深造,获得博士学位。博士期间参与建造了一个并行计算机,并在Science杂志发表封面文章。
丁教授曾任职于加州理工学院、美国国家航空航天局喷气推进实验室、劳伦斯伯克利国家实验室,研究用于固体材料、计算生物学、气候数据同化、气候模型、稀疏矩阵线性解算和图形划分的并行计算算法、高性能计算、教授MPI等课程。后来研究机器学习、数据挖掘、信息检索、网络链接分析。他在主成分分析、K-均值聚类、非负矩阵分解等课题做了一些原创性的工作,证明了谷歌的PageRank本质上是一个按入度排序。他提出了L21范数,广泛应用于人工智能、机器学习、计算机视觉、计算生物学。设计了最小冗余度最大相关性特征选择算法,被很多(如Uber)科技公司采用,一篇相关论文被引用8600次。
名校名师能成就学生
丁宏强教授与李政道先生交谈
您的研究领域是计算机科学,曾师从诺贝尔物理学奖获得者、物理学家李政道,能分享一下您的学习和科研经历吗?
我在1981年进入CUSPEA(以全国第27名的成绩),这项计划是由物理学家李政道和中国物理学界合作创立的人才培养计划。我被耶鲁大学等一些美国名校同时录取,最终选择了哥伦比亚大学,在李政道研究小组攻读博士学位。
我刚开始学习的是物理专业,由于大规模计算的需要,通过自学转到计算机科学领域。当然最初物理学的积累对未来计算机领域的研究是很有帮助的。物理学需要大规模理论和计算验证,我也因此在这个学习的过程中渐渐对计算机本质的东西变得很熟悉,也有了很大的兴趣。我和导师、同学设计和组装了并行计算机,研究结果在《科学》(Science)杂志作为封面文章发表,也因此由理论物理转到计算机领域。
结束在李政道实验室的学习后,我在1987年进入加州理工学院,做并行计算的相关研究,一做就是十几年。加州理工非常有名气,在当时是全球第一第二的学校。我在1996年加入了美国最杰出的国家实验室之一劳伦斯伯克利国家实验室,成为一名科学家,劳伦斯伯克利实验室的科学家曾获得过13个诺贝尔奖。我这一辈子很幸运,能够去几个世界上真正一流的学校工作。我的学术生涯里遇到几位名师,他们引领了我学术生涯的方向。比如在伯克利期间,偶然机会旁听了半年机器学习泰斗Michael Jordan的课程,很快转到机器学习领域。
1999年是机器学习的繁荣期,我们是第一个用支持向量机解决了分子三维结构问题的科研团队,比当时神经网络的效果好很多。后面我也和查宏远教授(现任SDS执行院长)合作做了一些原创性的研究工作,比如发明了L21范数,在机器学习领域可以说是有一定的影响力。
做学术不崇拜权威
丁教授在哥伦比亚大学著名雕塑Alma Mater前
您切换研究领域的过程中有遇到什么困难吗?您有没有什么学习或科研的心得经验可以分享给学生们的?
从理论物理转到机器学习,我认为没有什么困难。学习机器学习需要数学和统计学知识,物理专业这两方面的知识积累都很扎实。机器学习解决问题需要建模,而物理专业的人很擅长建模。有很多机器学习名人都是从物理转过来的,像深度学习最有名的Geoffrey Hinton曾经就是物理专业的。所以,扎实的数学和统计学知识对机器学习来说是很重要的。
我在学习的过程中,最大的感受有三点:1.做事认真严谨;2.不崇拜权威;3.尊重但不迷信现有知识。这些感悟有很大一部分来自于李政道先生。李先生曾经说过,一个理论应该从前后左右多个角度来研究和理解。不能因为哪个名人说它对,我们就说它对。爱因斯坦也曾有理论是错误的。李政道先生的这段话对我后来的科研有很大的帮助,上面说到的三点也成为了我学术和科研的准则,也希望分享给学生们。
软件科学即将世界领先
2020年7月SDS正式成立
您有丰富的海外科研和执教经历,还是德州大学阿灵顿分校的终生教授。为什么会 港中大(深圳)数据科学学院的?
选择回国的原因我觉得有三个方面,首先是中国人的情怀,落叶归根。其次,中国现在高速发展,AI技术有逐渐在全球领先的趋势,可以说经历10年或者一代人,AI技术就会达到世界领先。中国在硬件科学如芯片制造业方面还不是非常发达,但是中国人很聪明,我们很快就赶上了。中国很早就意识到了软件科学像优化、AI等技术的重要性。第三个方面,是国内的生活品质非常高,特别是食物,我喜欢中国饭菜,我其实吃不惯汉堡牛排。
加入SDS是因为这里有很多世界知名的教授,我来的时候戴建岗教授(SDS院长、校长讲座教授)、张寅教授(SDS校长讲座教授)、查宏远教授(SDS执行院长、校长讲座教授)都已经加入SDS,他们在业界很有名,让我觉得这个学院的档次非常高。另外,SDS刚刚成立,学校的规模也还没有那么大,但是学生的质量非常高,在国内都是拔尖的,学院属于“小而精”,我很喜欢这样的学校,因为会有很多教授们、不同学科之间的交流和合作的机会,教授和学生之间也会非常紧密。美国很多顶尖名校都是小而精的,比如加州理工学院,本科生、研究生、教师和研究人员加一起共3000人左右;像我女儿毕业的哈佛大学、我读书的哥伦比亚大学,学校的规模并不大,但是培养了很多优秀的人才。
培养市场所需人才
您在数据科学学院教授的课程与海外高校的课程相比,有什么不同?
SDS的课程是计算机、统计和运筹等交叉学科结合一体的,也很注重理论和实践的结合。学院的课程都是软科学领域的,符合当今先进科学技术发展的趋势,学生们在毕业后会很受市场或者社会的需要,也更容易就业。
教学模式和海外顶级高校其实相似,一年的通识教育,之后才选定专业,像美国一流的高校都是在刚进入的时候不划分专业,学生在学习的过程中发现自己的兴趣所在,了解自己适合做什么事情。
研究成果获得应用
您能介绍一下目前您研究团队的规模、方向和成果吗?
我目前刚刚加入SDS一年时间,研究团队还不大,去年9月刚刚加入了3个学生。团队主要研究的是人工智能最重要的组成部分--机器学习的一些基础算法,比如L21范数。在最近的三五年,我们在这个领域可以说贡献还是比较大的。L21范数的应用非常广泛,比如我们的研究成果被Uber AI Platform采用。我团队的研究成果也曾经在很多顶级学术会议发表过。
不一定要最聪明的学生
您培养了一大批优秀的学生,请问您如何选拔和考核学生呢?
我对学生的要求是有上进心、做事主动、肯钻研、肯埋下头做事情,但不一定要最聪明的学生。因为有一些非常聪明的学生会自视甚高,有大主见,不愿意做在他看来不重要的课题。学生们要真正理解一个科题的重要性、底层的意义,需要一个过程,不是一个星期、两个月就能理解的,有些可能需要四五年静下心来做研究,才能真正明白其中的意义,有些甚至是一辈子的体会。
中国处于伟大的时代
您如何看待计算机/AI技术的发展历程和未来的应用前景?特别是您如何看待中国AI技术发展的昨天、今天和明天?
AI领域有些技术已经非常成熟了,而且应用已经非常广泛,比如无人车、人脸识别,这个领域还会继续蓬勃发展,我觉得还要火10到20年。AI的研究是算法的研究,工业界有很好的应用,算法目前在不断地扩张,应用到更广的领域。一些AI重大技术发展到成熟实用,还有好多年的路要走。比如无人车在繁华街道穿行,在强光弱光场合不同角度的人脸识别,真实的人机对话等等,到实用阶段还很远,至少需要5到10年。
中国正处于一个伟大的时代,中国的发展了不得、朝气蓬勃。中国能够把握住先进科学技术发展的大趋势,无论是人员还是资金的投入都非常充足,这也是我选择来回国的原因之一。
保持好奇不闭门造车
深圳卫视报道丁宏强教授排名全球Top 0.1%顶尖科学家
您坚持在学术、在机器学习领域深耕了几十年,您有什么好的建议给到现在或未来打算从事这一领域的学生们,鼓励他们坚持下去?
做学问、做科研,在我看来要慢,需要在确定的领域里沉下心来,积累扎实的知识。另外就是人要活跃,要拥有广泛的感兴趣,要好奇心很强,而不是闭门造车。比如研究机器学习要不仅只看机器学习和数学,还要经常看看别人都在做什么,能不能获得启发。神经网络也是从生物学人体的基本细胞里得到的启发,构建计算、组建很复杂的函数。像我之前读书工作的学校、研究所,大家的交流非常多,我们的数据科学学院也是这样,不同学科之间也有交流,其实新兴的技术都是在交叉边缘发展起来的。
还有就是做研究不要钻牛角尖。钻牛角尖虽然是对待学术要有的品质,但过分钻牛角尖反而达不到研究目的。就好比打仗时有座城堡一直攻克不下的,每次攻城都不成功,但从其他路径打到敌军后方,这座孤立的城堡也就没有军事意义了。技术也是这样,刚开始很难,但走另外一条路,过一段时间就会发现问题解决了。
机器学习解决的是实际问题,我认为是最有用处的学科之一,就业也非常容易,也比较容易找到高薪、发展前景大的工作。
科技发展蒸蒸日上
您已到耳顺之年——60岁,但仍奋战在科研的第一线,激励您不断前进的力量是什么?
做科研是我的爱好和兴趣,而且科技发展蒸蒸日上,新技术新思路层出不穷,我的专业领域——机器学习发展得也非常快,非常exciting。所以我要一直干下去,坚持做科研第一线的工作者。做科研的人,没有早退休的。