![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() | |
翻墙 | 三退 | 诉江 | 中共卖国 | 贪腐淫乱 | 窜改历史 | 党魁画皮 | 中共间谍 | 破坏传统 | 恶贯满盈 | 人权 | 迫害 | 期刊 | 伪火 社论 | 问答 | 剖析 | 两岸比对 | 各国褒奖 | 民众声援 | 难忘记忆 | 海外弘传 | 万人上访 | 平台首页 | 支持 | 真相 | 圣缘 | 神韵 | |
2025年1月28日,在中国香港,一部手机屏幕上显示DeepSeek标志与ChatGPT标志并列的图像。中国人工智能初创公司“深度探索”(DeepSeek)推出低成本竞争性模型,一度引发全球科技股大幅下跌,但在美国持续实施芯片(晶片)技术出口限制之际,DeepSeek并没有从根本上解决中共人工智能发展困境。(Anthony Kwan/Getty Images)【大纪元2025年02月01日讯】(大纪元记者宋唐、易如采访报导)最近,中国人工智能公司DeepSeek推出一款新的AI推理模型,冲击了美国科技、金融及政策等多个领域,成为推动美中AI大战的一个导火索。 1月20日,就在川普总统上任首日,中国人工智能公司DeepSeek发布了一款AI推理模型DeepSeek-R1,称其功能媲美OpenAI,还使用更少算力更低成本。 同日,DeepSeek创始人梁文锋成为唯一一位与李强会面的AI界领袖,中共央视《新闻联播》给了他清晰的近景画面。 去年在接受媒体的访问时,梁文锋称他的核心团队“没有海归人士,都是本地人才”,他还强调,中国的AI产业“不能永远做跟随者”。这种说法类似于官方宣传的独立自主叙事。 让人们意想不到的是,在中国黄历新年期间,两年前还默默无闻的DeepSeek,突然成为一股搅动世界的力量,并登上了海内外的新闻头条。 1月26日,该模型已经超越ChatGPT,成为苹果应用商店排名第一的应用。同日,亿万富翁投资者马克·安德森(Marc Andreessen)称,R1模型为“人工智能的斯普特尼克时刻”。 1月27日周一开盘,美国人工智能领军企业遭遇惨重损失,微软下跌4%,特斯拉下跌2%,英伟达跌近17%,市值蒸发近6000亿美元,成为历史上市值最大的单日跌幅。 目前,对于DeepSeek声称的一些说法,有不同的观点。但DeepSeek不同之处在于,其背后有中共国家力量的推动。 台湾人工智慧实验室(Taiwan AI Labs)创办人杜奕瑾对大纪元表示,在AI领域不管是开源或闭源,过去这几年来,每几个月都有很大的更新。但DeepSeek特别之处在于,它不单单推出DeepSeek开源模型讯息。 杜奕瑾指出,DeepSeek很多讯息操作,(中共)官媒主导的成分非常高,在微博和脸书上,可以看到很多不是真正使用者的账号非常活跃,内容主要是:DeepSeek模型推出后美国科技股大跌,美国AI的优势没有了。 “这种讯息非常多,而且是在美国股市盘前交易(Pre-Market)时操作的,造成盘前交易市场下跌,实际真的造成正常交易股票的下跌。” 杜奕瑾认为,如果说DeepSeek推出造成美国股票大跌,有点倒果为因。因为是大量讯息操作造成盘前交易下跌后,大家才去注意到DeepSeek,而不是相反。 杜奕瑾表示,这些虚假讯息,在油管或脸书上大量的短影音在讲, DeepSeek模型的横空出世,造成中美科技竞争。 他说,DeepSeek模型的确有独到之处,但也不至于需要如此大肆渲染,这些短影音渲染账号,很多都是用AI生成的农场账号,平常也没什么订户。现在不断放大美股下跌的信息。 “从我的角度,有点像把一个很简单的开源成果,变成国家层级的科技竞争的讯息操作。”他说,这类似以前中国(中共)在国家主导的俄罗斯议题上面的炒作方式。网军账号配合官媒账号,不断地去做宣传。很难让人认为这不是一次有组织的宣传,这背后有国家力量在推动。 杜奕瑾表示,它藉由的操作,展现的就是中国(中共)并不需要靠最高算力的晶片,也可以把模型做得很好。 DeepSeek最让外界关注的一点,是其所声称的低成本和低算力。 DeepSeek的原始报告显示,DeepSeek-R1在预训练阶段,每兆个token上训练DeepSeek-V3仅需要180K H800 GPU小时。假设H800 GPU的租赁价格为每GPU小时2美元,我们的总训练成本仅为557.6万美元。 业界人士认为,DeepSeek使用一种名为“专家混合”(mixture of experts)的技术,类似于将问题交给特定领域的专家,从而减轻了芯片同时处理所有任务的压力。但这种技术本身并不新鲜。 杜奕瑾指出,传统商业公司也采用“多专家模式”以降低大模型的成本,这非常普遍,也不算什么创新,因为大部分AI新创公司比较没有GPU资源。DeepSeek v3创新之处在于多头、多精度的混合训练,可以把模型训练成本有效降低。 “但是DeepSeek并没有说,原本的训练资料是从哪里来的,以及原本训练的资料是用什么样方法去做训练,这部分其实不是非常清楚。” 杜奕瑾说,如果下载DeepSeek的原始码就可以看到,DeepSeek模型其实是利用OpenAI的all one模型的蒸馏技术,把大模型的知识提取出来之后,再交给小模型去做训练。 “早期DeepSeek在刚发布的时候,你问DeepSeek是一个什么样的模型,它会回答说ChatGPT,就可以知道,它原始资料跟蒸馏对象应该就是ChatGPT。” OpenAI在29日的一份声明表示,正在审查有关DeepSeek可能“不当”使用其模型的输出数据来开发其AI模型的报告,这种方法被称为“蒸馏”。“我们采取积极主动的对策来保护我们的技术,并将继续与美国政府密切合作,以保护在这里建造的最强大的模型。”OpenAI发言人说。 杜奕瑾表示,DeepSeek在使用OpenAI模型蒸馏方式的时候,提取很多相关资料做训练。OpenAI的授权原本是不允许的,就把它的账号关闭了。 杜奕瑾表示, OpenAI提供的模型蒸馏技术,也不是一个新的技术,大概是2015年就提出来了。OpenAI原本用意是all one模型跑起来成本非常高,提供模型蒸馏是为了让小的模型跟大的模型去学习,跑起来成本会有效降低,而且近似于大模型某个特殊领域的跑分结果。 他举例说,这有点类似以前要请一个非常有经验、非常昂贵的作业员,现在作业员只要把标准的工作经验写下来,就可以找一个比较廉价的工读生来取代。 杜奕瑾指出,是不是未来就不需要比较有经验、比较高阶的作业员,其实不尽然。实际上透过蒸馏的方式,去做到近似复杂模型的结果,并不代表这种训练出来的模型,会比原本复杂的模型做得好。 “因为它的模型参数没有那么多,没有那么聪明、那么有经验,成果就会下降很多,这也非常常见。” 台湾工研院政策与区域研究组组长李冠桦对大纪元表示,DeepSeek的低成本模式,事实上是因为利用了别人已经训练好的模型,进行进一步的优化。这种低成本严格来说,其实是别人帮它分摊的。 “它事实上是站在别人的肩膀上再往上走,不应该把它跟OpenAI等同看待。它更像是在OpenAI基础模型上面,做了一些更有针对性的优化。” DeepSeek不断激起了华尔街及科技界的震荡,也延及了新上任的川普政府。白宫是否会因此加码,制定更严格的对华科技限制政策,成为一个焦点。 1月27日,川普总统表示,“中国公司发布DeepSeek人工智能, 应该给我们的行业敲响警钟,我们需要集中精力进行竞争。” 川普表示,他认为低成本模式对人工智能整体而言是“非常积极的发展”,因为“你不必花费数十亿美元,而是花费更少,但希望能找到相同的解决方案。” 同日,众议院中共特别委员会呼吁加强对DeepSeek人工智能基础设施所依赖技术的出口管制。 1月28日,白宫新闻秘书卡罗琳·莱维特表示,美国官员正在调查中国人工智能应用程序DeepSeek对国家安全的影响。 1月29日,两名美国国会议员呼吁川普政府考虑限制英伟达生产的H20人工智能芯片出口,因为中国人工智能公司DeepSeek依赖这些芯片。 同日,川普提名的商务部长卢特尼克(Howard Lutnick)在确认听证会上对DeepSeek进行了猛烈抨击,他说:“他们购买了大量Nvidia的芯片,并找到了绕过这些芯片的方法,从而推动了他们的DeepSeek模型。这种做法必须结束。” 据彭博社援引匿名消息人士称,川普正考虑对英伟达向中国销售半导体芯片,施加比拜登政府更严格的限制,以限制中国在人工智能方面的发展。 李冠桦表示,2023年华为释放了7奈米的手机晶片,反而让美国更了解原先的围堵网中的一些漏洞,进一步把它围堵起来。从这个角度来看,其实对他们一点好处都没有。 “DeepSeek展现以后,美国也开始对它进行更进一步的检视,对一家公司来讲,都不是一个好事情。事情走到这一步,可能已经不是他们能够控制的了。” 李冠桦表示,从硬体或算力的角度来看,美国绝对还是会持续地卡住中国获得算力,包含调查DeepSeek是不是从非法管道获得Nvidia晶片,国家力量是不是在后面帮助获得一些算力。 “从另外一个角度来看,川普的警钟,也包含对美国AI发展的警告,是不是太着重硬体或资本的投入,而忽略了应用商业应用的实现。” 有种说法认为,DeepSeek带来的冲击证明美国芯片管制的失败。 但李冠桦认为,这不代表晶片禁令失效 ,而代表晶片禁令的确有它的效果。导致中共在AI的模型的训练上面,必须要找很多的方法,去达到一样的效果。 杜奕瑾表示,晶片禁令的确在AI训练上面,会造成一些不方便。今天的禁令是有效的,但并不能完全阻止AI的发展。 “我感觉很多反应有点过头了,造成很多不是资讯专业的评语参与其中,让原本简单的科技就变得很复杂。”他说。 “DeepSeek发布的技术,包含怎么用强化学习去把模型做好,怎么减少对晶片的依赖,同样的方式美国公司实际上也可以利用。并不是说,因为有了比较不依赖晶片的DeepSeek模型,美国公司就没有竞争力,也不会(造成)哪个美国公司成果受到威胁。” 李冠桦表示,在最领先的一些AI技术的发展上,甚至军事的AI,美中差距会拉大。但涉及到怎么运用到商业,中方可能会有一些成果。 杜奕瑾表示,现在人工智能已经慢慢变成各个国家的国家级战略,谁掌握到超强的人工智能,对一个国家跟整个产业,都是会有革命性的影响。 “美国过去在科技发展胜出,并不是纯粹因为掌握晶片或掌握算力,主要还是掌握创新环境、人才环境、资本环境及软体生态,让好的人才愿意加入,做出贡献有该有的回报,才会让美国人工智慧不断在成长。” 他指出,现在的关税壁垒、晶片壁垒、算力壁垒,未来如果竞争越高的话,就很有可能各国会趋于脱钩。 “从2019年开始,就慢慢开始有分队状态,走美国供应链就不好走中国(中共)的,走中国(中共)就不好走美国的。往下来看的话,未来大国因为争夺AI科技而造成的脱钩,也是显而易见的。在这种潮流之下,相关的立法会出台,造成彼此之间的压力,慢慢形成分队的状况。” 责任编辑:林妍# 相关新闻: 下载翻墙软件浏览原文:美中AI大战因DeepSeek升温 专家解读 手机上长按并复制下面二维码分享本文章: | ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |