1月14日,据《华尔街日报》报道,韩国一心想要发展本土AI大模型,但是被寄予厚望的国产大模型却被发现使用了中国公司的大模型代码。这件事表明,韩国想要摆脱对美国或中国科技巨头的依赖是何其困难。

韩国公司Naver的大模型被指与中美模型有相似之处
去年6月,韩国政府发起了一场竞赛,希望打造一个使用韩国技术开发的全新、独立的AI模型。在美国和中国主导AI领域的全球格局下,开发这样的本土工具对于确保韩国技术自主至关重要。
但事实证明,说起来容易,做起来难。在这项为期三年的竞赛中,五家入围决赛的公司里有三家被发现至少使用了部分来自外国AI模型的开源代码,其中包括中国的模型。
这些公司和AI专家辩称,刻意回避现有AI模型、试图从零开始构建一切并不明智。但反对者表示,任何对外国工具的使用都会带来潜在的安全风险,并削弱培育真正属于本国的AI模型的希望。
哈佛大学电气工程教授魏裕炎(Gu-Yeon Wei,音译)表示,在推进AI模型开发时,要求每一行代码都完全自主编写并不现实。他熟悉这项韩国竞赛,但并未直接参与任何参赛公司。
“若放弃开源软件,无异于将海量技术红利置于一旁。”他表示。
眼下,全球各国越来越重视减少对外国技术的依赖,并提升自身在AI领域的能力。AI可能深刻影响这些国家的经济竞争力与国家安全。
韩国拥有众多芯片巨头、软件公司,而且发展AI也获得了政治支持,是所谓“主权AI”的最积极推动者之一。上述竞赛旨在2027年前评选出两款本土胜出模型,其性能能达到或超过OpenAI、Google等领先AI模型的95%。获胜者将获得政府提供的数据和人才招聘资金支持,并有权使用政府采购的、对AI计算至关重要的芯片。
中国代码
近日,入围决赛企业之一的Upstage引发了争议。韩国本土竞争对手Sionic AI的CEO高锡贤(Ko Suk-hyun,音译)称,Upstage AI模型的部分模块与中国智谱AI的开源模型存在相似之处。他声称,Upstage的部分代码中甚至还留有智谱AI的版权标记.
“一款被怀疑是根据中国模型微调的套壳模型,却提交到由纳税人资金资助的项目中,这令人深感遗憾。”高锡贤在领英上表示。Sionic也曾参与韩国这一竞赛,但未能进入决赛名单。
对此,Upstage举行了一场直播验证会,公开了其开发日志以证明其模型是从零开始,采用自有方法进行开发和训练的。但其用于运行模型的推理代码确实使用了源自智谱AI的开源元素,这些元素在全球范围内被广泛采用。高锡贤随后就此道歉。
这场争议也促使韩国对其他入围决赛的模型进行更严格的审视。 Naver公司AI模型的视觉与音频编码器被指与中国阿里巴巴及美国OpenAI的产品存在相似之处。视觉与音频编码器负责将图像和声音转换为机器可理解的格式。
韩国SK电讯也遭到批评,原因是其用于运行AI模型的推理代码被指与中国DeepSeek的代码存在相似之处。
Naver承认使用了外部编码器,但解释称这是采用标准化技术的战略决策,并强调决定模型如何学习和训练的核心引擎完全由该公司自主开发。SK电讯也提出了类似观点,着重说明其模型核心的独立性。

SK电讯在韩国IT展会上的展台
该竞赛的规则并未明确说明是否允许使用外国企业的开源代码。自争议出现以来,负责监督此次竞赛的韩国科学部尚未发布任何新的指导方针。韩国科学部长裴庆勋(Bae Kyung-hoon)对此番激烈讨论表示欢迎。
“当我看到搅动我国AI行业的技术辩论时,我实际上看到了韩国AI的光明未来。”裴庆勋本月早些时候在社交媒体上写道。
韩国科学部拒绝就此置评,该部门计划按原定安排在本周从五家决赛入围企业中淘汰一家。
首尔国立大学AI研究所所长李在武(Jae W. Lee,音译)称,AI模型的开发是通过设定和微调内部数值以获得输出,而在受到质疑的入围决赛模型中,这些核心任务似乎并未依赖外国工具。
“他们是从零开始训练的。”他表示。