Skip to content

Latest commit

 

History

History
64 lines (63 loc) · 22 KB

n14426770.md

File metadata and controls

64 lines (63 loc) · 22 KB

大纪元首页国际新闻大陆新闻大纪元评论传统文化生活消费娱乐休闲健康独家头条要闻
翻墙 | 三退 | 诉江 | 中共卖国 | 贪腐淫乱 | 窜改历史 | 党魁画皮 | 中共间谍 | 破坏传统 | 恶贯满盈 | 人权 | 迫害 | 期刊 | 伪火

社论 | 问答 | 剖析 | 两岸比对 | 各国褒奖 | 民众声援 | 难忘记忆 | 海外弘传 | 万人上访 | 平台首页 | 支持 | 真相 | 圣缘 | 神韵

袁斌:牛皮吹破?DeepSeek身陷四大质疑

两名美国国会议员呼吁川普(特朗普)政府考虑限制英伟达(Nvidia)生产的H20人工智能芯片出口,称中国人工智能公司DeepSeek(深度求索)依赖这些芯片。(Lionel Bonaventure/AFP)

【大纪元2025年02月01日讯】前几天,DeepSeek的消息引发了美国金融市场的风波。大陆媒体和小粉红更是兴奋地将DeepSeek吹捧为所谓的“中国AI崛起的象征”。

然而,在一片喧嚣之中,DeepSeek 也身陷诸多质疑和批评——其技术突破是否真正具有创新性?团队的透明度是否足够?市场营销是否存在夸大成分?

技术突破来自对美国技术的“盗用”?

中方高调宣称DeepSeek的技术突破来自于中国的自主创新,但据海外媒体报导,ChatGPT的所有者微软和OpenAI认为,DeepSeek不当获取了自己的核心数据和模型。

OpenAI1月29日表示,它们已掌握证据,显示DeepSeek盗用其模型进行开发。

白宫人工智慧与加密特使大卫·O·萨克斯(David Sacks)也表示,有大量证据表明DeepSeek利用OpenAI的模型输出数据,建立了自己的训练集,而这种方法在业界被称为“蒸馏”或“模型复现”。

从当前公开信息来看,DeepSeek的核心技术框架,如大规模预训练、Transformer架构和优化算法,确实与OpenAI、Google DeepMind等公司的研究成果有相似之处。

据新唐人报导,一名AI专业人员透露:DeepSeek确实有一些原创技术,包括减少了对GPU的使用,但在数据上主要是用了60万长链条数据集,其中大部分是蒸馏获得的,然后结合了多轮投票增强学习,变成了自己的东西。—-什么意思呢?就是说,这是一个比较聪明的小偷或抄作业的,但还是做了。

实际上,DeepSeek自己也招了。很多人在问它是谁的时候,它有时回答自己是ChatGPT,有时说是GPT-4,还老老实实的交代自己使用了OpenAI的哪些工具。

据悉,目前微软和OpenAI正在进行深入调查,同时已经封禁了与DeepSeek相关的可疑账户。如果证据确凿,这可能是近年来AI领域最大的数据盗窃案之一。

DeepSeek的真实实力究竟如何?

DeepSeek 号称是国内少数能够“对标 GPT-4” 的模型之一,但实际体验后,许多用户发现其表现仍然存在较大的差距。尽管官方在多个平台展示了测试结果,但这些结果往往是经过精挑细选的最佳案例,而非随机样本的真实评测。一些用户反馈,DeepSeek 在长文本理解、逻辑推理以及代码生成等核心能力上仍有明显短板,甚至在某些任务上表现不如早期版本的 ChatGPT 3.5。

此外,DeepSeek 的论文与技术文档相对较少,缺乏详实的技术细节披露。与 OpenAI、Anthropic 等国际领先团队相比,DeepSeek 在学术透明度方面仍存在很大欠缺。

DeepSeek “高调宣传+低调研究”的模式,也是让人怀疑其是否真正具备自主创新能力,抑或只是借助现有开源技术,进行包装和二次开发的一个重要原因。

DeepSeek的成本真的挑战美国最强AI?

DeepSeek声称其大模型是在“低算力条件”下训练完成的,V3模型训练成本仅为560万美元,这比OpenAI、Meta等用于预训练大型语言模型动辄数亿美元的成本要低得多。这一说法虽然吸引眼球,但从技术角度来看,仍然存在诸多疑点。许多专家,包括马斯克和 Scale AI的执行长Alexandr Wang,都不相信。

首先,大模型训练的核心成本来自于算力。现阶段,主流大模型(如 GPT-4 级别)通常需要数万个高性能 GPU(如 A100、H100)连续训练数月。而根据市场价格,单张 H100 的售价高达 2 万美元,即便是云租赁,长期大规模使用的成本也十分昂贵。在如此高昂的算力消耗下,DeepSeek 如何以 560 万美元的预算完成训练,值得深究。

其次,训练成本不仅包括算力消耗,还涉及数据采购、存储、工程优化、人力成本等多个方面。高质量的训练数据需要清洗、标注,并经过多轮优化,而这本身就是一笔巨大开销。此外,大模型的训练往往需要反复迭代调整,以提升最终性能,而非一次性完成。DeepSeek 是否通过某种特殊技术或极端优化手段大幅降低成本?如果是,其方法为何未在业界广泛应用?

此外,DeepSeek 作为一家中国公司,其 GPU 采购渠道是否受限也是一个需要考量的问题。由于全球芯片供应链的限制,中国市场上的高端 GPU 价格通常高于海外,且获取难度较大。在这种情况下,其低成本训练的实现路径更显得扑朔迷离。

DeepSeek 是真开源还是“半开源”?

DeepSeek 宣布开源模型,初看似乎是一项重大利好,但仔细审视后,人们发现所谓的“开源”并不彻底。真正的训练细节、优化策略、数据来源等核心信息仍然没有完全公开,导致业界难以对其技术路线进行严肃的学术分析。真正的开源应该像Meta 旗下的? Llama 或 Mistral 那样,将关键代码和方法论彻底公开,而不是“半遮半掩”。相较于Llama 系列、Mistral AI 等更开放的做法,DeepSeek 的开源行为更像是一种“半开源”,目的可能更多是为了博取关注和市场认可,而非推动整个 AI 生态的发展。

更值得注意的是,DeepSeek 也可能受到中共官方政策与监管压力的影响,导致其开源策略受到掣肘。如果一个模型在技术上宣称要与国际一流对标,却在透明度上选择性“封闭”,那么这种开源行为是否只是营销手段,而非真正的技术贡献?

面对众多质疑的DeepSeek ,可以说现在正站在一个关键的十字路口:如果真的要“深度求索”,那么必须拿出扎实的技术和真正的突破,而不是靠一轮又一轮的营销造势来维持热度。否则,它最终可能沦为又一个 AI 泡沫,被市场无情淘汰。

责任编辑:金岳

相关新闻:

  • DeepSeek使用H20芯片 议员促川普限制出口
  • 【唐青看时事】DeepSeek风暴之谜 美紧急出手
  • DeepSeek刚爆红就负面消息不断 李强看走眼?
  • 澳网安公司:DeepSeek受控于中共 政府设备需封禁
  • 编辑推荐:
  • 人心向善 大陆当初盛况
  • 如初:再回顾民国学人批苏俄
  • 儿子长出新脾脏 医生惊呼不可能
  • 热门新闻:
  • 整个时代映现于她一身:无名女子们的肖像
  • 围炉过年:从除夕到元日的民俗守护人心中的善
  • 古代的中国人是如何过年的?
  • 【未解之谜】2025预言盘点——加州大火深度解析
  • 【未解之谜】皮行者牧场(二):神秘的隐形人
  • 【百年真相】揭秘:云南头号恶霸死刑不死
  • 【菁英论坛】政府预算呈自杀式删减 台湾动荡
  • 【唐青看时事】习本命年变局 2025川习对决前瞻
  • 央视春晚机器人表演“失误” 引发网民嘲讽
  • 湖南卫视跨年晚会魔术表演现“尴尬一幕”
  • 返乡机票车票现“骨折价” 分析:百姓没钱
  • 机器人春晚扭秧歌“露馅” 退场时脚步直哆嗦
  • 央视春晚主持人妆容大翻车 撒贝宁浓眉遭吐槽
  • 春晚后台与机器人互动 魔术师刘谦被“碰瓷”
  • 小三通重开 小红书网民相约赴台看大陆禁片
  • 周润发新年宣传新电影 新发型获赞年轻又帅气
  • 情境意识:你意想不到的重要生活技能
  • 美国房价与房贷利率何时回落?
  • 冻龄抗癌抗抑郁 跳舞让人彻底摆脱抗癫痫药
  • 世界最贵的街道在意大利 超越纽约第五大道
  • 按摩三个膝关节穴位 有助于解决膝盖的疼痛
  • 本文转自大纪元(国内需用翻墙软件才能访问)

    下载翻墙软件浏览原文:袁斌:牛皮吹破?DeepSeek身陷四大质疑


    手机上长按并复制下面二维码分享本文章:

    中共的伪火骗局
    永恒的见证
    善良女子被中共投男牢
    警卫目击活摘器官
    证人描述活摘恐怖
    揭开活摘器官黑幕
    马克思的成魔之路
    藏字石 蕴天机
    关注三亿人三退
    解体中共复兴中华
    中共迫害良心律师
    三百多万人举报江泽民
    这些官员为何起诉江泽民
    海峡两岸的强烈对比
    加拿大总理的贺信
    探寻真相兼听则明
    印度媒体报道东方
    不一样的海外校园
    从大师到徒弟的传奇
    亿万人与东方一本奇书
    大陆见不到的震撼场面
    人心向善 大陆当初盛况
    追寻真理 这书讲什么
    下载免费翻墙软件