多国看重“主权人工智能” 竞相研发本地语言产品

新华社北京2月5日电 特稿|多国看重“主权人工智能” 竞相研发本地语言产品

新华社记者黄堃

联合国教科文组织定于5日和6日召开全球人工智能伦理论坛,重要议题包括与人工智能相关的平等、多样性等。过去一年多来,各国竞相研发本地语言的生成式人工智能,背后是对数字主权领域的深层考量。

涌现多种语言产品

美国OpenAI公司研发的英文生成式人工智能ChatGPT在2022年底横空出世后,多国研究人员纷纷跟进“大语言模型”技术,在全球多地形成了开发本地语言生成式人工智能的热潮。

在中国,百度公司“文心一言”和科大讯飞公司“星火”等大语言模型产品经过快速迭代,已显示出较好的中文处理能力,被不少企业用作生产力工具。中国人工智能学会人工智能伦理与治理工委会主任陈小平告诉新华社记者:“中国相关研发进展较快,一些跨领域大模型不断取得新进展,垂直领域大模型的发展态势也很好。”

在法国,截至去年9月已有79家生成式人工智能初创公司。其中米斯特拉尔人工智能公司估值已近20亿欧元,成为欧洲人工智能领域的领军企业。去年12月,该公司发布了“Mixtral 8x7B”模型,掌握法语、西班牙语、意大利语、英语和德语5种语言。

俄罗斯网络巨头央捷科斯公司开发的YandexGPT去年10月成功通过了俄国家统一考试中的文学科目,比高校文学科目最低录取线高出15分。该公司搜索和广告技术团队经理德米特里·马修克说,它在俄语回复方面已超越ChatGPT的3.5版本。

此外,日本、韩国、越南等国也都研发了本国语言的生成式人工智能,新加坡计划开发能理解印尼语、马来语和泰语的大语言模型。

注重“主权人工智能”

从不同语种产品相继问世可以看出,生成式人工智能的巨大影响正在全球范围逐渐显现,“主权人工智能”的重要性也在各国日益凸显。

“主权人工智能”是生成式人工智能爆火后被频繁提及的概念,大致指国家支持人工智能基础设施建设,用符合本国文化和思维方式等的数据训练大模型,支持本地产品形成生态系统等。

法国将人工智能技术与国家的工业和数字主权挂钩。在去年设立“生成式人工智能委员会”时,经济、财政及工业、数字主权部长布鲁诺·勒梅尔强调:“30年前,我们错过了数字革命……我们不能错过这第二次机会。在这场国家竞赛中,法国拥有重要资源,我们必须走得更快更远。”

印度电子和信息技术国务部长拉吉夫·钱德拉塞卡尔不久前公开表态:“我们已下定决心,必须要有自己的主权人工智能。”

美国芯片企业英伟达表示将支持各国发展主权人工智能。“人们意识到不能把自己国家的知识、文化提供给其他人,再(由这些人)把人工智能卖回给他们。”英伟达公司首席执行官黄仁勋日前谈及“主权人工智能”时说。

而这反映了各国发展主权人工智能的一大问题。当前美国企业在人工智能领域处于领先地位,如果他国要跟上潮流就必须采用美国产品,这可能导致后续发展受制于人。不止硬件芯片,在软件方面,全球许多大模型也是“套壳”美国的开源软件。比如日本东京工业大学等机构去年12月公布的日语大模型Swallow,就是以美国“元”公司的Llama 2大模型为基础。

德国数据分析专家米娜·赛义泽表示:“多数人工智能的语言模型都使用英语,大部分供应商都来自美国……德国等欧洲国家的很多人工智能技术都依赖于美国供应商,在这一领域完全不独立。”

警惕新的数字鸿沟

全球在生成式人工智能方面发展不平衡,可能导致新的不平等。联合国秘书长古特雷斯今年年初在达沃斯论坛上说:“我们需要通过系统性努力增加人工智能的可及性,这样发展中经济体才能从其巨大潜力中受益。我们需要弥合数字鸿沟,而不是加深数字鸿沟。”

陈小平指出,大量数据分析表明,随着新技术的普及应用,一些国家或地区的数字鸿沟在不断加深,很多人担心不同语种的大模型之间也会产生类似后果。对于人工智能时代产生的新问题,需要用高质量发展等新观点来追求经济效益与社会效益的统一,才能有效保证和提升全社会、全人类的福祉。

在这一过程中,中国由于在人工智能领域展现出较好势头,受到一些发展中国家的期待。巴西中国问题研究中心主任罗尼·林斯告诉记者,巴西的人工智能发展尚不充分,而中美两国已在人工智能领域进行大量投资。人工智能可能导致的一个全球性问题是影响就业。期待中国发挥优势,在运用新技术为年轻人创造新岗位方面作出贡献。

此次全球人工智能伦理论坛包含上述种种议题。在不同语种人工智能竞相发展的当下,联合国教科文组织负责社会科学与人文科学的助理总干事加芙列拉·拉莫斯指出:“我们需要真正全球性的协调和知识分享,以建立一个负责任的人工智能生态系统,让每一个人受益。”(参与记者:徐永春、陈畅、钱铮、孙一、杜哲宇、卞卓丹、冯亚松、陆睿、李龚)

Like (0)
Previous 2024 年 6 月 7 日 下午4:15
Next 2024 年 6 月 7 日 下午4:25

猜你喜欢