资讯参考,东方金报

微信
手机版
东方金报

中国AI公司几个月就弄通了OpenAI的推理模型,美研究人员:我们很惊讶

作者 :中华军事 2024-12-25 12:29:14 围观 : 评论

【文/东方军事 赖家琪】“中国初创公司已展现出赶超美国人工智能(AI)模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。”美国《华尔街日报》在12月24日的一篇报道中,通过对比中美两国AI企业推理模型的表现以及研发速度,得出了以上结论。

11月,由中国私募巨头幻方量化投资的AI公司DeepSeek(深度求索)发布了其推理模型DeepSeek-R1的预览版。根据DeepSeek的说法,这一模型的能力已接近甚至超越了OpenAI于今年9月发布的推理模型o1的预览版。

除了DeepSeek外,拥有中国互联网巨头阿里巴巴和腾讯投资的初创公司Moonshot AI(月之暗面)表示,他们开发了一种专门用于数学的模型,其功能接近o1。阿里巴巴也称,他们自己的一个实验模型在解决数学问题上的表现优于美国模型的预览版。

《华尔街日报》称,由于这些公司尚未发表描述其模型的论文,且现在没有一致认可的对AI模型能力进行评估的单一测试,目前很难验证这些中国公司的说法。尽管如此,一些美国专家表示,他们对此“印象深刻”。

“中国正在更快地迎头赶上。”OpenAI前研究员、现为AI企业家的安德鲁·卡尔(Andrew Carr)说,DeepSeek研究员在“在几个月内就弄通了OpenAI推理模型的办法,坦率地说,我的许多同事都对此感到惊讶”。

◐◐◐◐●☛█▼▲东方金报网HTtp://Www.dfjb.net◐◐◐◐●☛█▼▲◐◐◐◐●☛█▼▲

《华尔街日报》用今年美国数学竞赛AIME中的15个问题进行了测试。他们发现,OpenAI的推理模型还是要比中国几家公司的推理模型更快地找到答案。测试结果显示,OpenAI模型在10秒内给出了答案,而DeepSeek花了2分多钟。

不过,该报仍称赞了DeepSeek的表现,称在目前很多AI模型被简单数学问题难倒的情况下,DeepSeek第一次就得到正确答案是“一项壮举”。

DeepSeek(深度求索)官网

HTTP://WWW.dfjb.net◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐东方金报网

中国AI公司能在短时间内达成“壮举”得益于多重原因。

与许多美国公司不同,大部分中国公司更愿意与其他企业和软件开发商共享底层代码。这种共享代码的行为在AI领域被称为“开源”。美国《纽约时报》称,开源一直是计算机软件、互联网以及当前AI发展的基石,因为开源的支持者认为,当代码可供任何人免费检查、使用和改进时,技术就会进步得更快。

“开源技术是中国的战略优势。”美国《科技时报》12月17日称,中国公司让任何人都能接触到模型源代码,可以在全球范围内引发创新并建立开发人员社区,这不仅推动了技术的进步,而且使中国的模型出现在全球AI地图上。

《纽约时报》也注意到了开源模式给中国带来的优势。该报称,2023年年底有人发现,李开复创建的AI公司01.AI(零一万物)使用了美国公司Meta的开源模型构建其AI系统。但转折发生在6个月后。当时,01.AI发布了新一代模型,美国斯坦福大学的一个团队也在那段时间也推出了Llama 3-V开源模型。但随后,Llama 3-V很快被爆出与中国大模型公司面壁智能的开源成果MiniCPM-Llama3-V 2.5拥有几乎完全相同的模型架构与代码,引发“抄袭”质疑。

该报指出,这与01.AI去年面临的争议相反:中国开发人员不再在美国技术之上构建,而是美国开发人员在中国技术之上构建。

◐◐◐◐●☛█▼▲东方金报网http://www.dfjb.net▼▲▼▲▼▲▼▲▼●●●●●●●▼▲▼▲▼▲

总部位于纽约的AI公司Hugging Face(抱抱脸)的首席执行官克莱门特·德朗格(Clément Delangue)表示,美国监管机构限制美国的开源项目,中国的开源模型成为黄金标准,此类事情可能会成为常态,“如果这种趋势继续下去,美国将面临越来越大的挑战”。

为了扼制中国发展AI的能力,美国政府自2022年来一直在限制中国获得世界上最先进的AI芯片。今年12月,临卸任的拜登政府再次收紧了对中国出口AI芯片的途径。

但是,《华尔街日报》称,中国开发人员已经找到了解决方法。Moonshot AI创始人杨植麟称,该公司专注于强化学习(Reinforcement Learning,一种机器学习方法),模仿人类的试错。报道称,这种方法在提高性能时,可能会减少算力的使用强度。

《华尔街日报》报道称,自去年年底以来,AI开发人员越来越多地使用一种称为“混合专家模型”(MoE)的技术。该技术将问题引导到专门的子模型(即“专家”)处去解决问题,就像主厨将意大利面订单定向到厨房的意大利厨师处那样。这个过程也减轻了对芯片的要求。

腾讯的混合专家模型于今年11月发布。据称,该模型的性能与Meta今年7月推出的Llama 3.1模型相当。审查了两家公司论文的研究人员表示,腾讯的模型可能仅用了Meta约1/10的算力训练的。

◐◐◐◐●☛█▼▲东方金报网███████东方金报网HTtp://www.dfjb.net▼▲▼▲▼▲▼▲▼●●●●●●●▼▲▼▲▼▲

DeepSeek在2021年用1万个英伟达A100芯片构建了一个用于AI训练的Fire-Flyer 2集群。今年8月,DeepSeek在一篇论文中表示,Fire-Flyer 2的性能接近于英伟达的一个包含类似芯片的系统,但DeepSeek的系统成本更低,能耗更低。

美国AI初创公司Anthropic联合创始人杰克·克拉克(Jack Clark)在他的博客中写道,“中国绕过出口管制的一种方式是,利用他可以访问的硬件构建非常好的软件和硬件训练堆栈”,“就像电动汽车、无人机和其他技术一样,中国制造将在AI模型中占据一席之地”。

HTTP://WWW.dfjb.net东方金报网采集不好玩哦◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐◐撒旦法师打发斯蒂芬

《华尔街日报》指出,缺乏尖端芯片、筹资难等问题仍是中国AI公司面临的几大挑战。但接受该报采访的中国AI公司高管将这比作带着镣铐跳舞,他表示“专注于我们擅长的事情是生存的唯一机会,而且可能是获胜”。

《科技时报》称,美国和中国在AI生态系统上的竞争,与过去windows和iOS操作系统的竞争类似,赢家可能会主导数字行业,影响未来几年全球市场和用户的行为。虽然美国制裁很难突破,但中国更加专注于开源模型和国内创新,这使它成为世界上最大的AI大国之一。“全世界都在等着看,中国是否会超越西方竞争对手。”

本文系东方军事独家稿件,转载请注明出处。

相关文章

  • “外卖战”背后,东哥的“权力游戏”!
    “外卖战”背后,东哥的“权力游戏”!

    来源:圆方你怎么看啊微信ID:yflooklook012025年的春天,当刘强东身着骑手服亲自配送外卖的照片刷屏社交平台时候,当东哥有了新的一起吃火锅的“兄弟们”的时候,当京东举起了“替天行道”“为民除害”的大旗的时候。这场刷屏的“外卖战争”,早已超出了商业竞争的范畴。今天我们一起换个视角,去看看可能存在的一场关于权力重构的剧本:离京东决策层两年多的东哥,或许正以“对外战争”为名,重演着历史上君主收拢权柄的经典戏码。02翻开人类组织史,对外战争始终是重构内部秩序的最短路径 。拿破仑通过意大利远征将雅各宾派...

    2025-04-24 14:08:26
  • 聊聊国际油价!
    聊聊国际油价!

    作者:卡夫卡很忙来源:局外人的视界(ID:hooyar_380097485)这几天气温反复,一夜降个十来度,但你能说降温意味着冬天来了吗?气温反复,但整体的趋势还是逐渐升温,慢慢步入盛夏。天气如此,油价也会如此。别跟我说什么国际油价暴跌,什么美国破坏全球化,导致需求下滑。真正让全球原油需求下滑的是中国新能源技术的发展和推广。看看最近五年中国原油进口量就知道了。看出来了吗?中国原油进口量已经停止增长了。别跟我说什么OPEC+联合起来控制产量,笑死了,你们把产量控制下来了,美帝可没有,既然美帝不肯控制产量,那...

    2025-04-24 14:08:25
  • 那位西方大佬去世,让人想起一位东方大佬!
    那位西方大佬去世,让人想起一位东方大佬!

    作者: 虚声来源:虚声(公众号ID:lxlong20)已获授权转载舆论界,美国副总统万斯被调侃为“有毒”。因为他嘴巴毒,做事风格也激进。前几天出访意大利,又尝试着扯下几块欧洲的遮羞布。他此次意大利之行,之所以会成为舆论界焦点,并非是因为国事访问,而是见了一位大佬。4月20日复活节当天,万斯从意大利跨国到梵蒂冈,去会见了教皇方济各。就这件事本身而言,非常乏味。因为整个会见过程只持续了几分钟,刚好够摆造型拍照。随后万斯的车子又返回意大利。从意大利跨国去梵蒂冈,会见教皇,再从梵蒂冈返回意大利,万斯一共用了17分...

    2025-04-24 14:08:23
  • 马斯克熟读中国历史!
    马斯克熟读中国历史!

    作者:叶立华来源:求实处(ID:gh_a2f5eb6a8f0c)最近马斯克公开表态和特朗普的分歧,主要是因为看了点历史。 在特斯拉公司财报电话会议上,马斯克说他希望看到更低的关税,但决定权在特朗普手中。 还有就是,从五月开始,他在特朗普政府“政府效率部”(DOGE)投入的时间将显著减少到每周用“一两天”处理政府事务。 当然马斯克还是表态了,说自己对特朗普的支持不会改变,尽管今年特斯拉股价下跌超过40%,他将继续支持特朗普总统通过DOGE来遏制浪费。 这段时间的马斯克从了政,遇到了攻讦,也有内阁的争吵,搞了...

    2025-04-24 14:08:19
  • 要把几件事放一起看,别错判川普真认怂!
    要把几件事放一起看,别错判川普真认怂!

    作者:肖仲华来源:肖仲华开讲(ID:xiaozhweixin)在川普公开要求美联储主席鲍威尔辞职,并宣布对东南亚光伏板加征最高达3521%的天量关税后,美国再次迎来股债汇三杀以及美元指数大跌的惨象。面对这种惨象,川普公开说,“美元正在崩溃,很快将不再是世界标准,这是美国200年来最大的失败”,同时强调这是拜登政府造成的后果,也是美联储不作为的结果。然后,川普通过记者会回答了一系列问题,似乎又突然来了个180度大转弯:一是宣称他不会对中国强硬,将降低对中国的关税。他不仅不提已经公布的245%关税税率,还说1...

    2025-04-24 14:08:18
  • 特朗普要降关税?这是他的更大阴谋!面对美国,中国死抓一点就能赢!
    特朗普要降关税?这是他的更大阴谋!面对美国,中国死抓一点就能赢!

    原创:占豪来源公众号:占豪微信ID:zhanhao668特朗普要降关税?这是他的更大阴谋!特朗普真的要大幅降低对华关税了?谁说的?特朗普说的!据媒体报道,美国总统特朗普在谈到与中国的关税战时表示,我们与中国相处得不错,同中方谈判时不会采取强硬态度。对华145%关税确实很高,协议达成后美对华关税将大幅下降,但不会降至零。在特朗普发表这些言论后,美国股市应声大涨,道琼斯指数两天涨幅一度超过2200点。基于特朗普的这些言论,以及美国股市的表现,于是就有不少人有了乐观情绪,认为特朗普可能顶不住了要跪,他自己要主动...

    2025-04-24 14:08:16
  • 一个令人震惊的消息:俄国或许不愿停战!
    一个令人震惊的消息:俄国或许不愿停战!

    原创: 徐吉军来源公众号:汉唐智库微信ID:hantangzhiku2025年4月22日,乌克兰总统泽连斯基表示,如果俄罗斯首先同意全面停火,基辅准备与莫斯科直接谈判结束战争。这标志着乌克兰对战争形势的判断出现了重大转折。自俄乌战争2022年2月全面爆发以来,乌克兰一直拒绝与克里姆林宫进行任何直接对话。泽连斯基说,我们在复活节再次看到了这一点,他们可以在需要的时候减少空袭……如果俄罗斯人准备好完全停火,那么在完全停火之后,我们准备好与他们进行任何形式的谈判。荒谬的是,泽连斯基强调,乌克兰永远不会承认被占领...

    2025-04-24 14:08:12
  • 特朗普称美对华关税或将大幅下降,认怂的艺术!
    特朗普称美对华关税或将大幅下降,认怂的艺术!

    来源:大白话时事微信号:xhdb66从4月7日开始,持续升级的贸易战,以及特朗普近期说要撤换美联储主席鲍威尔的言论,让美国金融市场持续经历股债汇三杀,这给特朗普带来巨大压力。于是,昨天特朗普开始认怂。(1)认怂的艺术据美国《国会山报》报道,4月22日,特朗普在椭圆形办公室对记者说,“145%关税是非常高的。不会有那么高的……它将大幅下降,但不会是零。”此外,据美联社报道,4月22日,美国财政部长贝森特在一次闭门会议上表示,与中国的持续关税对抗是不可持续的,他预计中美贸易战将出现降级。他还提到,目前两国谈判...

    2025-04-24 14:08:10
  • 特朗普“认怂”了?
    特朗普“认怂”了?

    原创: 顾子明本文授权转载至微信公众号:顾子明说在引发了本周一美国的债股汇三杀后,万税帝君似乎终于“怂”。当地时间本周二,特朗普在白宫椭圆形办公室表示,在关税谈判期间他不会对中国采取 “强硬手段”,并“乐观”认为能够“相当迅速地”与之达成一项协议,“大幅下调”对中国进口商品加征的145%巨额关税。在被问到是否会对中国采取“强硬态度”时,特朗普否认说:“不,我不会说‘我要对中方强硬’。我们会以非常友好的态度对待他们,他们也会友好相待,然后我们拭目以待会发生什么。”与此同时,鸽派代表的美国财政部长贝森特也在当...

    2025-04-24 14:08:08
  • 打都不怕,怕和你谈?
    打都不怕,怕和你谈?

    作者:叶立华来源:求实处(ID:gh_a2f5eb6a8f0c)美国总统特朗普对记者称,对华145%关税确实很高,协议达成后美对华关税将大幅下降,但不会降至零。 美财长贝森特表示,当前局势本质上是贸易禁运。美国目标并非与中国脱钩,两国可能在两到三年内达成一项全面协议。 关税加了这么久,特朗普现在觉得有点高了,想要降低关税,但是说不会降低到零,贝森特也说不想和中国脱钩,前倨后恭的样子实在是给美国这个超级大国丢人,大有把美国信誉当非洲国家来玩的态度。 但是我们不能被这两人虚情假意的表态蒙蔽,他们所谓可以谈,一...

    2025-04-24 14:08:07