本文来自微信公众号“大数据分析和应用”,作者/于涧。
“2024年,全球人工智能的竞争将进一步升级为系统性竞争,各国在基础大模型、行业应用、硬件、产业链等方面开始全面较量,中美在大模型深度应用和战略需求上角逐,今年将是关键期。”全国人大代表、科大讯飞(002230)董事长刘庆峰说。
从ChatGPT到Sora,通用人工智能作为全球科技竞争的焦点,已成为中美科技博弈和战略竞争的必争之地。为应对竞争,刘庆峰建议制定国家《通用人工智能发展规划》,系统性加快推动我国通用人工智能发展。
“通过发挥举国体制优势,加大并保持对通用大模型底座‘主战场’的持续投入,不断缩小中国与其他国家在通用底座平台方面的差距,并在行业应用和价值创造上打造我国的比较优势。”刘庆峰说。
举国体制投入大模型主战场
刘庆峰认为,在2017年出台的《新一代人工智能发展规划》指引下,中国在认知智能领域已具备非常扎实的技术储备和成建制的团队,有望成为全球智慧涌现的第二极。其中最核心的“主战场”就是在通用底座能力上持续进行对标。而当前OpenAI的GPT-4/4V代表全球通用大模型底座能力的最先进水平,DALL-E3、Whisper、Sora等都是基于GPT-4/4V的底座能力平台所延伸出来的特定领域的成功实践。
刘庆峰建议,在2017年《新一代人工智能发展规划》的基础上,瞄准我国通用人工智能发展中需要重点补上的短板进行设计,围绕自主可控算力生态构建、高质量数据开放共享、科学的评测标准制定、源头技术前瞻研发、人才培养、法律制定和伦理人文等维度,系统性制定国家《通用人工智能发展规划》(下称《规划》),国家高位推动规划的制定和落地,不断缩小中美通用人工智能产业在通用底座平台方面的差距,并在行业应用和价值创造上打造我国的比较优势。
为此,刘庆峰建议发挥举国体制优势,加大并保持对通用大模型底座“主战场”的持续投入。
建议以专项的形式从算力、数据、算法上在未来5年内持续支持我国通用大模型的研发攻关;建议支持有条件的地方政府,以专项债的形式支持通用和行业大模型研发以及应用生态发展所需的算力基础设施建设;建议制定相关政策,推动工业和民生等领域的大模型应用,从而让“底座大模型+行业应用”形成相互促进的良好局面;建议鼓励国资央企优先应用国产大模型,在关键敏感领域和核心战略领域只能用自主可控的大模型;建议面向“一带一路”设立专项,支持多语种大模型技术研发,以及在主要产业链合作国家、地区的落地应用。
同时,他建议加快形成围绕国产大模型的自主可控产业生态。支持工业大模型在工业互联网领域的赋能,支持软件大模型对软件行业的赋能,支持行业大模型对汽车、家电、服务机器人等行业领域的应用,以“人工智能+”推动我国自主可控的大模型产业生态蓬勃发展。
此外,他建议推动国家级高质量训练数据开放和共享,出台更加客观、公正、可信的评测方法,坚持源头核心技术系统性创新,在战略性、前瞻性的基础研究领域做好布局。
在人工智能人才培养方面,他建议加快推广大模型赋能全学段,以全新机制加快探索我国人工智能拔尖创新人才培养;研究通用人工智能时代人才能力素质模型和培养方案,加快应用型人才培养。
在法规与伦理方面,他建议加速通用人工智能技术相关的法律法规制定与审议,围绕大模型的数据安全、隐私泄露、可靠性、知识产权等几大关键方面制定法律法规,提升通用人工智能技术可靠性与规范性。同时,建议设立软课题进行通用人工智能相关的伦理人文研究。
国产大模型有望实现典型行业领域的超越
在刘庆峰看来,国产大模型离全球最高水平的差距并没有太大。
以我国首个基于全国产算力训练的全民开放大模型——讯飞星火大模型为例,刘庆峰预计在6个月内可达到GPT4/4V当前最好水平,随着GPT-5的发布,这个差距可能会被拉到一年以上。
但如果从算力、数据、模型训练等方面组织好资源全力追赶,这个差距也有望在1—2年内被追平到相当的水平。
同时,我国也在语音大模型、医疗大模型等领域形成了国际领先的比较优势。
“我们有信心在通用大模型底座上不会出现代差级落后的差距,在此基础上结合行业场景和数据进行打磨,有望实现典型行业领域的超越。”刘庆峰说。
科大讯飞之所以要将大模型建立在全国产算力自平台上,源于美国的极限施压。
“2019年10月,我们被美国列入实体清单,含有美国技术超过25%的产品都不可以采购;时隔三年之后,2022年10月我们被美国再次极限施压,含有美国技术的产品我们都不能使用,我们必须从核心技术研究,各种各样的人工智能算法的训练推理,再到各种消费类产品全部要国产自主;另一方面,通用大模型是近几十年来最具颠覆性的技术创新,会彻底改变产业形态和竞争格局,也是中美科技博弈和战略竞争的必争之地,通用大模型又是未来赋能千行百业、像水和电一样的最基础的能力,从国家战略安全考虑,中国必须发展自己的通用大模型。”科大讯飞相关人士说。而这样的切身经历,或许就是刘庆峰呼吁用举国体制推进大模型发展的原因。