袁斌：牛皮吹破？DeepSeek身陷四大质疑

两名美国国会议员呼吁川普（特朗普）政府考虑限制英伟达（Nvidia）生产的H20人工智能芯片出口，称中国人工智能公司DeepSeek（深度求索）依赖这些芯片。(Lionel Bonaventure/AFP)

【大纪元2025年02月01日讯】前几天，DeepSeek的消息引发了美国金融市场的风波。大陆媒体和小粉红更是兴奋地将DeepSeek吹捧为所谓的“中国AI崛起的象征”。

然而，在一片喧嚣之中，DeepSeek 也身陷诸多质疑和批评——其技术突破是否真正具有创新性？团队的透明度是否足够？市场营销是否存在夸大成分？

技术突破来自对美国技术的“盗用”？

中方高调宣称DeepSeek的技术突破来自于中国的自主创新，但据海外媒体报导，ChatGPT的所有者微软和OpenAI认为，DeepSeek不当获取了自己的核心数据和模型。

OpenAI1月29日表示，它们已掌握证据，显示DeepSeek盗用其模型进行开发。

白宫人工智慧与加密特使大卫·O·萨克斯（David Sacks）也表示，有大量证据表明DeepSeek利用OpenAI的模型输出数据，建立了自己的训练集，而这种方法在业界被称为“蒸馏”或“模型复现”。

从当前公开信息来看，DeepSeek的核心技术框架，如大规模预训练、Transformer架构和优化算法，确实与OpenAI、Google DeepMind等公司的研究成果有相似之处。

据新唐人报导，一名AI专业人员透露：DeepSeek确实有一些原创技术，包括减少了对GPU的使用，但在数据上主要是用了60万长链条数据集，其中大部分是蒸馏获得的，然后结合了多轮投票增强学习，变成了自己的东西。—-什么意思呢？就是说，这是一个比较聪明的小偷或抄作业的，但还是做了。

实际上，DeepSeek自己也招了。很多人在问它是谁的时候，它有时回答自己是ChatGPT，有时说是GPT-4，还老老实实的交代自己使用了OpenAI的哪些工具。

据悉，目前微软和OpenAI正在进行深入调查，同时已经封禁了与DeepSeek相关的可疑账户。如果证据确凿，这可能是近年来AI领域最大的数据盗窃案之一。

DeepSeek的真实实力究竟如何？

DeepSeek 号称是国内少数能够“对标 GPT-4” 的模型之一，但实际体验后，许多用户发现其表现仍然存在较大的差距。尽管官方在多个平台展示了测试结果，但这些结果往往是经过精挑细选的最佳案例，而非随机样本的真实评测。一些用户反馈，DeepSeek 在长文本理解、逻辑推理以及代码生成等核心能力上仍有明显短板，甚至在某些任务上表现不如早期版本的 ChatGPT 3.5。

此外，DeepSeek 的论文与技术文档相对较少，缺乏详实的技术细节披露。与 OpenAI、Anthropic 等国际领先团队相比，DeepSeek 在学术透明度方面仍存在很大欠缺。

DeepSeek “高调宣传+低调研究”的模式，也是让人怀疑其是否真正具备自主创新能力，抑或只是借助现有开源技术，进行包装和二次开发的一个重要原因。

DeepSeek的成本真的挑战美国最强AI？

DeepSeek声称其大模型是在“低算力条件”下训练完成的，V3模型训练成本仅为560万美元，这比OpenAI、Meta等用于预训练大型语言模型动辄数亿美元的成本要低得多。这一说法虽然吸引眼球，但从技术角度来看，仍然存在诸多疑点。许多专家，包括马斯克和 Scale AI的执行长Alexandr Wang，都不相信。

首先，大模型训练的核心成本来自于算力。现阶段，主流大模型（如 GPT-4 级别）通常需要数万个高性能 GPU（如 A100、H100）连续训练数月。而根据市场价格，单张 H100 的售价高达 2 万美元，即便是云租赁，长期大规模使用的成本也十分昂贵。在如此高昂的算力消耗下，DeepSeek 如何以 560 万美元的预算完成训练，值得深究。

其次，训练成本不仅包括算力消耗，还涉及数据采购、存储、工程优化、人力成本等多个方面。高质量的训练数据需要清洗、标注，并经过多轮优化，而这本身就是一笔巨大开销。此外，大模型的训练往往需要反复迭代调整，以提升最终性能，而非一次性完成。DeepSeek 是否通过某种特殊技术或极端优化手段大幅降低成本？如果是，其方法为何未在业界广泛应用？

此外，DeepSeek 作为一家中国公司，其 GPU 采购渠道是否受限也是一个需要考量的问题。由于全球芯片供应链的限制，中国市场上的高端 GPU 价格通常高于海外，且获取难度较大。在这种情况下，其低成本训练的实现路径更显得扑朔迷离。

DeepSeek 是真开源还是“半开源”？

DeepSeek 宣布开源模型，初看似乎是一项重大利好，但仔细审视后，人们发现所谓的“开源”并不彻底。真正的训练细节、优化策略、数据来源等核心信息仍然没有完全公开，导致业界难以对其技术路线进行严肃的学术分析。真正的开源应该像Meta 旗下的? Llama 或 Mistral 那样，将关键代码和方法论彻底公开，而不是“半遮半掩”。相较于Llama 系列、Mistral AI 等更开放的做法，DeepSeek 的开源行为更像是一种“半开源”，目的可能更多是为了博取关注和市场认可，而非推动整个 AI 生态的发展。