中国AI技术的全球地位:李海洲教授与亚洲新闻台CNA深度对话
在当今科技迅猛发展的时代,人工智能(AI)无疑是最具变革潜力的领域之一,而中国在这一领域的迅速崛起引起了广泛关注。
2024年8月10日,亚洲新闻台(Channel News Asia)在其焦点访谈文章“IN FOCUS: Delayed or on track? Here’s a midpoint report card on China’s bid to be global AI leader by 2030”(聚焦:延迟还是按计划推进?这是中国力争在2030年成为全球AI领导者的中期报告)中,对中国在AI领域的现状进行了深入报道。
新加坡工程院院士、香港中文大学(深圳)校长学勤讲座教授、数据科学学院执行院长李海洲教授受邀接受英文采访,深入探讨了中国在AI领域的最新进展、面临的挑战以及在全球竞争中的未来前景,他的见解为理解中国AI领域的全球地位和发展趋势提供了深刻的洞察。
CNA以插画的形式描绘了中国AI技术领域的雄心,插画中的文字写道:“在人工智能时代的背景下,一只熊猫站立在无人驾驶汽车的驾驶舱内。”
(插画:CNA/Rafa Estrada)
中国AI技术发展的“中期成绩单”
2017年,国务院发布了《新一代人工智能发展规划》,为中国未来十几年人工智能的发展描绘了一幅宏伟蓝图。该规划明确了到2030年,中国的人工智能理论、技术与应用总体达到世界领先水平,力争成为全球主要的人工智能创新中心。(中国政府网报道)
CNA在文章中指出,如今中国距离实现这一目标的时间已过半,其AI技术发展现状已交出了令人瞩目的“中期成绩单”。从生成式AI工具到AI技术的工业应用,中国在AI领域的不断进步引发了国际社会的广泛关注。
特别是在生成式AI工具方面,中国的进展尤为显著。2024年2月,美国人工智能公司OpenAI(ChatGPT的开发者)推出了最新工具Sora,能够根据书面提示生成视频。仅仅6个月后,中国已有三家企业相继推出了高质量的本土文本转视频AI工具:智谱AI的清影、生数科技的Vidu,以及快手旗下的可灵大模型(Kling)。与此同时,百度推出的文心一言和字节跳动的豆包等聊天机器人逐渐成为ChatGPT的有力替代品。
Kling AI(左)和Sora(右)生成的AI视频,使用了相同的提示。Kling AI的视频由CNA生成,而Sora的视频则从OpenAI的官方网站获取。(图片来源:CNA)
工业应用方面,中国AI技术正在不断扩展其影响力,特别是在自动驾驶出租车领域。CNA报道称,在中国,越来越多的城市开始部署自动驾驶技术,企业们也在积极推动其发展并寻求商业化。在武汉,约500辆由百度研发的自动驾驶出租车“萝卜快跑”已经投入运营,并计划在年底前将数量增加到1000辆。
2023年2月24日,一辆来自百度无人驾驶出租车服务Apollo Go的汽车在中国湖北省武汉市的道路上行驶。(图片来源:CNA引用自路透社/Josh Arslan)
可见,中国AI技术快速进步并逐渐成为全球创新的重要力量,而这一显著进展离不开一系列强有力的推动因素。
那么,哪些关键因素在推动中国AI技术的迅猛发展?
中国AI技术发展的推动力
李海洲教授在接受CNA采访时表示,中国AI技术的蓬勃发展离不开国家的大力支持和战略举措,中国正努力使包括AI技术在内的数字经济成为未来十年内GDP的主要贡献者。
李海洲教授采访观点
“在推动AI发展的道路上,(数字经济)无疑是推动力,持续投资于增长至关重要……因此,数字经济将成为中国GDP的重要支柱。”
“So moving down this path of AI, this course is definitely the driving force, you always invest into growth … so the digital economy will be China’s largest contributor to GDP.”
李海洲教授的观点不仅反映了中国政府对数字经济的重视,也表明了AI技术在经济转型中的关键作用。
CNA总结道,过去,农业、工业和服务业一直是中国经济的主要驱动力,而如今,数字经济正在崛起,成为推动社会发展的新动力。官方数据显示,2023年中国服务业占GDP的54.6%,工业占38.3%,农业占7.1%。根据国务院新闻办在2024年7月发布的数据,数字经济核心产业的增值产出已占GDP的10%。中国信息通信研究院的报告预测,到2025年,中国数字经济的总值可达到70.8万亿元人民币。由此可见,数字经济正日益成为中国经济发展的重要引擎。
在国家的大力支持的背景下,数字经济的兴起无疑为中国AI技术的发展提供了强大的助力。然而,随着中国在AI领域的持续投入和突破,所面临的问题和挑战也逐渐显现出来。
那么,目前具体存在哪些挑战可能会影响中国AI技术的未来进程?
中国AI技术发展面临的挑战
在探讨中国AI发展面临的挑战时,李海洲教授与CNA记者讨论了三个关键问题:地缘政治紧张导致的芯片垄断、开源与闭源的选择,以及AI技术发展可能带来的高能耗对环境的影响。
1、地缘政治紧张
CNA指出,中国在争取人工智能领域主导地位的过程中,面临地缘政治关系紧张(尤其是与美国的矛盾)带来的挑战。
图形处理单元(GPU)在推动AI事业中至关重要,尤其是尖端GPU。为了阻碍中国超级计算和人工智能技术突破,美国在过去两年内对中国实施了先进芯片和芯片制造设备的出口管制。根据路透社1月的报道,美国科技巨头NVIDIA在禁令实施之前占据了中国人工智能芯片市场的90%,而NVIDIA在全球芯片市场上也掌控了大部分份额。
拍摄于2023年3月6日,一部带有NVIDIA标志的智能手机放置在计算机主板上。(照片来源:CNA引用自REUTERS/Dado Ruvic)
李海洲教授采访观点
“我认为目前的挫折只是非常短暂的问题。尽管面临挑战,中国的人工智能发展反而有机会因此得到加速。因为国内企业正在积极努力生产自己的先进芯片,从而减少对外部资源的依赖。”
"I believe the current setbacks are just a very temporary issue. Despite these challenges, the country’s AI development could actually be accelerated. This is because domestic companies are actively working on producing their own advanced chips, which will reduce reliance on external resources."
李海洲教授指出,中国当前因地缘政治紧张而面临的芯片垄断挑战仅是非常短期的问题。他提到,许多中国学者相信,国内企业有能力通过自主研发先进芯片和技术来克服这些障碍。李教授还表示,这些挫折反而可能推动中国加速AI技术的发展,促使国内企业减少对外国技术的依赖,从而提升中国在全球AI领域的竞争力。
2、开源模型 vs. 闭源模型
CNA报道还讨论了AI技术研发过程中开源与闭源模型之间的争论,指出这一争论在全球范围内日益激烈。
开源模型是指允许源代码自由访问,使任何人可以使用、修改和分发它。而闭源模型则限制对源代码的访问,防止外部对其进行修改或扩展。
开源模型与闭源模型两者各有优缺点。开源模型的优点包括允许其他研究人员和开发者使用、学习和在其基础上进行创新。然而,开源模型需要依赖志愿者,会遇到资源和支持的限制。闭源模型的优势在于对训练数据和内部架构的访问限制,可以减少滥用或误用的风险,并提供了更多的盈利机会,但只能提供有限的控制和定制。目前中国科技公司的情况较为混合,尚未表现出明显倾向:一些科技公司倾向于采用开源模型,而另一些则更倾向于闭源模型。
李海洲教授采访观点
“我们不需要100个大型模型;几款高质量的可共享模型更为理想。”
"We don’t need 100 large models; a few well-contributed and shared models would be ideal."
李海洲教授接受CNA记者采访时表示,他观察到,尽管中国AI企业会利用开源模型从零开始开发自己的模型,但本地社区通常缺乏创建模型以应对复杂编程挑战的视野。
作为开源运动的支持者,李教授认为坚持开源原则有助于推动技术进步和共享知识。他指出,与其开发大量大型模型,不如专注于打造几个高质量且广泛共享的模型,这样更能有效促进技术创新和应用。
3、环境保护
此外,CNA报道称,人工智能技术的高能耗可能对中国的环境保护造成负面影响。尽管AI在应对气候变化方面有实际用途,如预测天气和改善农业,但其巨大的电力需求不容忽视,更高的计算能力需求导致了电力消耗和碳排放的增加。国际能源署预测,未来几年全球数据中心的电力需求将大幅增长,而中国计划到2025年将计算能力提高30%以上,这将进一步加剧电力消耗。
李海洲教授采访观点
“现在(环境保护方面的)挑战是需要找到一种更巧妙的方法,以更低的计算成本提供高水准的智能水平,我相信这是其他国家也在面临的挑战。”
“The challenge now is to find a clever way to deliver the same quality of intelligence, but with lower computational cost, I believe it is the same challenge that other countries are facing.”
李海洲教授指出,在技术创新与可持续发展之间找到平衡至关重要,以避免对环境造成负担。他认为,尽管中国在人工智能领域取得了卓越的进步,但仍需找到更高效的方法来提供同样水平的智能程度,而不增加过多的资源消耗。
最后,李教授还强调,这不仅是中国面临的问题,也是全球各个推进AI技术发展的国家共同需要解决的挑战。
尽管存在挑战,中国在AI领域的发展潜力依然强劲随着技术不断进步和政策逐步调整,中国正逐步突破这些障碍,并在全球AI竞争中稳居领先地位。
那么,中国AI领域的前景与未来将会如何?
中国AI技术的前景与未来
CNA的报道指出,中国已经在全球AI竞争中占据了领先的地位,在全球竞争中仅次于美国。斯坦福大学最新的AI指数报告显示,中国的AI初创公司在2013年至2023年间总计初创公司1,446家,筹集了1,040亿美元的资金,在全球AI竞争中排名第二,仅次于美国。
CNA报道整合的全球AI技术竞赛前十国家图表(数据来源:Quid 2023, 2024 AI Index Report)
分析师强调,中国在AI领域的大量投资吸引了众多卓越的研究成果。芝加哥保尔森研究所的MacroPolo全球AI追踪报告发现,尽管美国仍然在吸引和留住顶尖AI专家方面处于领先地位(截至2022年,75%的顶级研究人员在美国机构工作),中国也正在吸引大量顶尖AI研究人员:2022年全球近一半(47%)的顶尖AI研究人员来自中国。在2021年也在全球AI领域出版论文数量排名前十的机构中,中国机构占据了九个位置。
李海洲教授采访观点
“如果国家投入更多资金,相关的研究自然也会增加。这种趋势如果持续下去,我相信在未来几年,或许不到十年,中国不仅会在人工智能应用方面继续表现出色,保持领先优势,还将在人工智能科学领域取得重要进展。”
“If you have the country invest more money, then of course, there is more research. If this momentum continues, I believe that in the years to come, maybe a decade or less, China will not only continue to do well in AI implementation, continue to have this leading edge, but also in AI science.”
李海洲教授认为,中国高水平人工智能机构数量的快速增长表明,国内政府和企业的大规模投资正在直接推动该领域的研究进展:更多的资金投入带来了更丰富的研究资源和机会,从而促进了学术和技术的突破
李教授对中国AI技术发展前景持乐观态度,他相信,如果这种积极的投资和研究势头能够持续,在未来几年,甚至不到十年,中国在人工智能领域将继续保持领先优势,并在人工智能科学方面取得显著进展。
李海洲教授简介
研究领域:
语音信息处理、自然语言处理、类脑计算、人机交互
简介:
李海洲教授(新加坡工程院院士、IEEE Fellow、ISCA Fellow)现任香港中文大学(深圳)数据科学学院执行院长、校长学勤讲座教授,同时他也是新加坡国立大学客座教授和德国不来梅大学卓越讲座教授。此前,他曾于2006年至2016年分别担任新加坡南洋理工大学和新加坡国立大学教授,于2009年担任东芬兰大学客座教授,于2011年至2016年任澳洲新南威尔士大学客座教授,于2003年至2016年担任新加坡科技研究局通信与资讯研究院首席科学家和研究总监。
李教授曾任顶级期刊IEEE/ACM Transactions on Audio、Speech and Language Processing主编 (2015-2018年);目前任Computer Speech and Language副主编 (2012-2022年)、Springer International Journal of Social Robotics副主编 (2008-2022年)。李教授也曾担任多个学术委员会委员:IEEE语音与语言处理技术委员会委员 (2013-2015年)、IEEE信号处理学会出版委员会委员 (2015-2018年)、 IEEE 信号处理学会奖励委员会委员 (2021-2023年)。李教授也曾是多个学会主席:国际语音通信学会主席 (ISCA, 2015-2017年)、亚太信号与信息处理协会主席 (APSIPA, 2015-2016年)、亚洲自然语言处理联合会主席 (AFNLP, 2017-2018年)、IEEE 信号处理学会副会长(IEEE SPS, 2024-2026年)。此外,他还担任过ACL 2012、INTERSPEECH 2014、IEEE ICASSP 2022 等多个大型学术会议的大会主席。
李教授享誉国际,他不仅在语音识别和自然语言处理研究领域有着突出贡献,还领导研发了多项知名的语音产品,如1996年苹果电脑公司为Macintosh发行的中文听写套件、1999年Lernout & Hauspie公司为亚洲语言发行的Speech-Pen-Keyboard文本输入解决方案。他是一系列重大技术项目的架构师,项目包括2001年为新加坡樟宜国际机场研发的具有多语种语音识别功能的TELEFIQS自动呼叫中心、2012年为联想A586智能手机研发的声纹识别引擎、2013年为百度音乐研发的听歌识曲引擎。