长期以来,美国凭藉其雄厚的科研实力、蓬勃的科技产业和宽松的监管环境,在人工智慧领域独领风骚。然而,近年来,中国AI 如同 awakened giant,以惊人的速度崛起,向美国的霸主地位发起强力挑战。
传统上看,美国一直处於人工智慧创新的前沿,受益於领先的研究型大学、强大的技术部门以及迄今为止的支持性监管环境;然而,在过去十年中,中国已成为一个强大的竞争对手。中国的学术机构和创新研究,特别是清华大学,造就了中国大部分顶尖的人工智慧新创企业,包括目前排名前四的生成式人工智慧新创公司智普人工智慧、百川人工智慧、探月人工智慧和MiniMax;同时,中国的人工智慧研究成果比美国还多,并且正在迅速缩小与美国法学硕士的表现差距,特别是在双语基准方面。
虽然中国在研究数量上处於领先地位,但在私人企业的推动下,美国在将尖端研究转化为现实产品方面表现出色,美国具备更多着名的机器学习和基础模型就证明了这一点:根据调查,到2023 年,美国将有61 个着名的机器学习模型,而中国有15 个;美国的基础模型有109 个,而中国有20 个。
中国的资金支持进一步证明其快速追赶的能力,尽管美国在私人人工智慧投资方面使中国相形见绌,但外国投资正开始流入中国的生成式人工智慧领域,举例而胫,沙乌地阿拉伯国家石油公司(Aramco)的创投部门最近以4亿美元的交易支持智普人工智慧,而中国政府也在介入填补资金缺囗,透过国家引导的资本和财政援助支持国内人工智慧公司,事实证明,这在支持通常被私营部门忽视的地区的国内人工智慧业者方面相当有效。
同时,即便美国透过出囗管制广泛努力限制中国取得先进技术,但这些措施成效有限,事实上,这些措施反而刺激中国发展本土生态系统。中国企业正在透过尽可能在公有云中进行培训来规避限制,而在无法做到的情况下则透过开发本地私有云(例如华为的「AI-in-a-box」)产品来进行创新。
整体来看,中国政府提供财政支援来培育高潜力企业,特别是在可能被忽视的地区,从而培育更广泛的创新基础;其次,在着名的清华大学的支持下,出现一群新兴的中国人工智慧新创企业,它们不是复制现有技术,而是突破人工智慧创新的界限,特别是在生成式人工智慧领域;最後,与美国相比,中国能够生产出有竞争力、有时甚至更优越的人工智慧模型。
中国政府为国内人工智慧企业提供财政支持
政府引导基金本质上是国家引导的资本基金。这些资金是从公共和私营部门筹集的,用於符合政府目标的项目,根据国家经济研究局发布的2024年研究报告,2000年至2023年间,中国政府创投基金透过20,000 多笔交易投资人工智慧领域的 9,623 家「独特公司」,总额达1,840亿美元。
政府引导基金广泛用於各种策略性产业和商业活动,但其影响却不明显:这些基金筹集的资金往往少於预期,并且在许多情况下未能部署投资,而且有太多优先事项重叠,导致效率低下。但评估专门为人工智慧公司创建的基金会发现三个重要优势:首先,政府创投基金的空间分布比私募基金更广泛,私募基金主要集中在中国富裕的沿海地区,由於中国政府创投基金更均匀地分布在全国各地,包括欠发达的内陆地区,因此政府正在帮助支持私人风险投资可能因流动性限制和资讯差距而忽视的地区的高潜力企业。
其次,政府创投基金投资於最初绩效指标较弱的公司,但这些公司最终的成长速度快於私人创投的公司,最後,政府创投基金通常会先於私人创投基金投资人工智慧公司,而这些政府投资会吸引随後的私人创投。当政府直接投资最初绩效指标较弱的企业时,这种模式尤其明显,这表明政府的选择被私人投资者视为有价值的讯号。
最後,中国政府也透过补贴支持人工智慧产业,例如,北京市当局对购买国产人工智慧晶片的企业实施补贴,以促进中国半导体产业的发展并减少对外国技术的依赖,此举措将根据企业对国产图形处理单元(GPU)晶片的投资比例提供财政支持;此外,包括最大的上海在内的至少16个政府正在向企业招商,以获取来自大型国有资料中心的补贴处理能力,这些资料中心整合有限的先进晶片供应。
在新创公司部分,智谱AI、百川AI、Moonshot AI、Minimax和01.AI这五家生成式人工智慧新创公司跻身中国人工智慧「独角兽」之列,这意味着它们的估值超过10亿美元,是中国生成式人工智慧生态系统的核心,业界将他们称为「中国新人工智慧虎」,因为他们代表了新一波专注於法学硕士的人工智慧公司,就像 OpenAI 和 Anthropic 等西方同行一样,这也是为了将它们与主要专注於脸部和影像辨识技术的商汤科技、旷视科技、云从科技和依图科技等所谓的老科技「龙」进行对比。
虽然许多新的中国生成式人工智慧公司正试图透过ChatGPT 复制OpenAI 的成功,但并没有明确的领导者或突破性应用程式成为中国最受欢迎或使用最广泛的应用程序,一些分析师报告称客户很难确定哪家公司的人工智慧解决方案最适合他们的特定需求,然而,其他人则认为,智浦 AI 的模型表现稳定,是挑战 OpenAI 的中国业者。有趣的是,这些中国新创企业的影响力如此之大,甚至连西方学研机构也开始效法他们的做法,最近涉及史丹佛大学的争议显示,其人工智慧模型 Llama 3-V 与清华大学自然语言处理实验室和中国新创公司 ModelBest 开发的模型 MiniCPM-Llama3-V 2.5 相似,ModelBest 联合创始人刘志远强调这一转变,他承认中国的生成式人工智慧模型与GPT-4 等西方顶级项目之间存在「巨大」差距,但依旧有机会缩小技术劣势。
中国的策略方针优先考虑专业的工业人工智慧应用,而不是大型语言模型等更广泛、多功能的用途,发展的重点是将人工智慧嵌入制造和原材料等领域,以提高效率和获利能力,而不是开发面向一般、面向消费者的人工智慧技术,以更有效率地推动产业成长。
政府也透过完善政策规划支持AI发展
中国最高立法机关和政治谘询机构全国人民代表大会和中国人民政治协商会议於2024年3月4日至11日在北京举行年度会议,两会期间的重要事件之一是政府工作报告的提交,该报告强调近期进展并为未来制定新的政策目标,《政府工作报告》明确指出,中国未来一年的首要任务之一是透过将人工智慧融入经济各领域来达到全方位数位转型,作为新宣布的「AI+」倡议的一部分,该倡议涵盖有四个主要类别:模型开发、资料共享、技能开发和安全,AI+计划是中国经济数位转型历史的一部分。例如,2015年政府工作报告提出「互联网+」,2019年又提出「智能+」,今年宣布的「AI+」,中国过去的注意力主要集中在技术开发上,但它已暗示2024年将是「人工智慧应用年」。
首先,一些与会者呼吁中国专注於建立尖端人工智慧模型,以追赶OpenAI等外国竞争对手,并复制ChatGPT的成功;360集团CEO周鸿??对AI模型的发展提出两方面的建议,鼓励大型科技公司与重点研究机构之间的合作,类似於微软与OpenAI 之间的合作夥伴关系,即那些致力於人工智慧技术突破的人与资源丰富的公司结对。在第二个轨道上,他也呼吁长期的人工智慧开源项目,建立多个国家级的开源人工智慧模型和开放的创新生态系统。同时,科大讯飞董事长刘厌峰在两会期间提出,要制定国家人工智慧发展规划,建构国内人工智慧大模型生态系统,呼应打造国家人工智慧模式的愿??。
第二,一些代表提出改进数据共享。刘还呼吁开放共享高品质数据,并指出中国应在国家层级开放和共享各行业的高品质训练数据,以发展人工智慧产业。微博财务长曹飞提出了推动人工智慧数据交易市场发展的建议,让中国企业更容易买卖开发领先人工智慧模型所需的高品质数据,同时保护数据主体的权利。她也呼吁加快和支持跨境资料流动新规则的实施,以促进国际计画合作。

图二 : 小米CEO雷军。(source:小米发布会影片截图) |
|
第三,部分与会者提出人工智慧人才培养的设想。小米CEO雷军指出,人工智慧技术的快速发展对各领域人工智慧人才产生巨大需求,加强人工智慧培训将是推动产业持续进步的关键因素。因此,雷军建议将人工智慧课程纳入K-12课程大纲,并在大学开设更多人工智慧相关专业,他也鼓励公司与大学合作,帮助未来的工人适应快速变化的人工智慧环境,知??CEO周源也对人工智慧人才培养提出了建议,要求技能人才职业培训方案更好地与企业需求相结合,并建议技术人才学院与企业合作设置课程。
中国科学院研究员张云泉也意识到人工智慧教育的资源缺囗,他认为高品质的课程、经验丰富的教授和先进的技术都聚集在顶尖大学和城市。他建议建立一个教育平台,分享人工智慧教学的资源和内容,从而带来更多的教育机会,包括在农村地区,与其他代表一样,他鼓励公司和大学之间合作,开发适用於现实场景的人工智慧知识。
最後,一些企业代表重点讨论人工智慧安全和监管问题。360集团CEO周鸿??认为,企业和地方政府应关注人工智慧可能带来的风险,QAX执行长齐向东建议,更重视围绕「AI+安全」进行创新,在各行业推广「AI+安全」产品,金杜律师事务所合夥人张毅主张尽快出台新的人工智慧法,将人工智慧演算法依照风险等级进行分类,并针对不同层级采取不同的监管措施,知??CEO周源对大型人工智慧模型的资料收集来源、处理方法、合规性进行监督和审查,并进行社会影响和风险评估,及时发现和解决潜在问题的模型。
中国政府正在增加计算和数据资源的获取,以支持其国内创新生态系统。其一,它计划通过继续实施「东方数据、西方运算」工程,「创建全国统一的计算系统」,以确保计算资源的充分利用,该措施目的为透过将数据处理需求较高的东部地区的企业与土地和能源便宜得多的西部地区的数据中心连接起来,优化中国数据中心的分布,这些对数位基础设施的投资将确保中国企业能够获得采用人工智慧所需的运算资源。
中国政府也认识到数据作为使用人工智慧的关键要素的重要性,2024年的目标之一是「完善基础资料系统,大力促进资料开发、开放、分配和利用」,事实上,中国已经在这一领域取得了重大进展;2023年,政府成立了国家数据管理局,这是一个新机构,负责创建数据基础设施并促进整个经济的数据利用。中国也正在研究支援特定产业人工智慧创新的特定类型数据;例如,国家有多项促进国家生物数据持有的政策。其中包括国家资讯化「十四五」规划等政策,要求医院将健康档案数位化;国家卫生健康委员会的「健康中国2030」倡议,促进卫生服务和机构之间的数据标准化;《生物安全法》强调国家对收集、管理和分享某些生物资料的主权。
中国公司从这些政策中受益匪浅,他们能透过广泛获取生物数据来开发人工智慧技术,而其他国家的类似公司必须与特定医院或研究机构合作才能获取某些类型的生物数据,不对称优势在此体现。
案例分析:智谱AI
智谱AI是中国最着名的生成式人工智慧新创企业,以员工数量而言是中国最大的人工智慧新创企业,拥有800名员工,也是中国估值最高的人工智慧新创公司之一,截至2024年5月估值为30亿美元,该公司由清华大学计算机科学与技术系教授唐杰和李娟子创立,两者皆为是该大学知识工程组(KEG)的成员,该研究实验室专注於网路环境中的知识工程理论、方法和应用。

图三 : 智谱AI创建ChatGLM作为基於其GLM架构的应用程式,擅长中英文双语任务。(source:智谱AI) |
|
智谱AI於2020年开始投资和训练大型语言模型,并领先许多其他公司,在其研究人员於2022 年4 月发表的一篇题为「GLM:使用自回归空白填充的通用语言模型预训练」的论文中,智谱AI介绍其语言模型GLM,并明确表示该公司正在尝试解决与现有语言模型不同的挑战。 BERT、GPT 和智谱AI的GLM 都基於Transformer 模型架构,该架构是Google 科学家在2017 年的一篇开创性论文《Attention is All You Need》中介绍的,但智谱AI 将创新功能整合到GLM中,制作了一个独特的模型,对於中文和英文任务都非常准确,这些模型的介绍如下。
1. BERT(来自Transformers 的双向编码器表示)使用一种称为掩码语言建模的方法,该方法本质上隐藏输入文字中的某些单词,并训练模型使用两个方向(隐藏单词之前和之後)的上下文来猜测这些隐藏单字。这有助於 BERT 理解上下文中单字的意思。
2. GPT(生成式预训练变压器)使用自回归模型,其中每个标记都是根据其前面的标记进行预测的。这是一种单向方法,因为模型经过训练,可以透过只查看句子前面的单字来预测句子中的下一个单字。 GPT 的优点在於在较长的段落中产生连贯且上下文适当的文本,利用其训练根据先前的所有单字预测下一个单字。
3. GLM(通用语言模型)透过隐藏部分文字然後按顺序预测丢失的部分来结合这两种方法的特徵。这种方法可以帮助模型从两个方向理解上下文(如 BERT),并产生如 GPT 的文本。 GLM 还使用先进的技术来有效地处理中文和英文,使其对於一系列语言任务非常通用和强大。
就像OpenAI建立ChatGPT作为GPT模型的专门应用程式一样,智谱AI创建ChatGLM作为基於其GLM架构的应用程式,擅长中英文双语任务。但ChatGLM并不是智谱AI唯一的产品;该公司拥有一整套产品,包括WebGLM,专为网路搜寻和检索功能而设计 VisualGLM负责理解和产生文字和图像; CogVLM,一种多模态理解模型,目的为有效执行需要解释视觉资料的任务;最後是程式码生成模型CodeGeeX2-6B。
公司的目标是追求突破性进步,而不是渐进式改进,执行长张鹏曾表示,公司的囗愿景是努力实现通用人工智慧(AGI),这也是OpenAI和GoogleDeepMind的使命;同时,对许多人来说,智谱AI可能会成为OpenAI的竞争对手,不希??矽谷在人工智慧领域占据主导地位的外国投资者正在向公司投入资金:沙乌地阿拉伯的 Prosperity7 隶属於国营石油集团阿美公司的创投部门,於 2024 年成为智谱AI的首个外国投资者,叁与该公司 4 亿美元的投资。