聪明有什么坏处 https://www.zhihu.com/question/29312685

人工智能在工业界用到的模型都是最前沿的吗 https://www.zhihu.com/question/304599202

目标检测领域还有什么可以做的 https://www.zhihu.com/question/280703314 2019.1.2 有篇总结的很全

人工智能从业者应该从哪里去寻找和阅读顶级论文 https://www.zhihu.com/question/303022763 关注该领域国外著名教授的twitter，定期刷reddit

有哪些句子是真正写到你的心里去了 https://www.zhihu.com/question/281637180

人们常犯的逻辑错误有哪些 https://www.zhihu.com/question/19864656

如何克服严重的拖延症 https://www.zhihu.com/question/20357585

如何深入理解「比你优秀的人不可怕，可怕的是比你优秀的人比你更努力」这句话 https://www.zhihu.com/question/31971136

人这一生为什么要努力 https://www.zhihu.com/question/22913650

有哪些年轻人必读的书，或对未来特别有好处的书 https://www.zhihu.com/question/275351176

如何保持长期、持续、稳定的努力 https://www.zhihu.com/question/27484486

英文原版阅读有哪些入门书籍推荐 https://www.zhihu.com/question/20291266

科研搞不出来的时候，大家一般都会干什么 https://www.zhihu.com/question/62269624

有哪些数学上的事实，没有一定数学知识的人不会相信？ - 知乎 https://www.zhihu.com/question/288093713

如何保持长期、持续、稳定的努力？ - 知乎 https://www.zhihu.com/question/27484486

怎样理解和区分中心极限定理与大数定律？ - 知乎 https://www.zhihu.com/question/22913867

科研大牛们怎么读文献？ - 知乎 https://www.zhihu.com/question/21278186

不想学习的时候如何逼迫自己去学习？ - 知乎 https://www.zhihu.com/question/20773513

你是怎么变自律的？ - 知乎 https://www.zhihu.com/question/284206141

了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构 https://www.zhihu.com/question/315611053/answer/676815240?utm_source=weibo&utm_medium=social&utm_oi=28266941382656

如何学习数据结构？ - 知乎 https://www.zhihu.com/question/21318658

有哪些让你相见恨晚的思维方式？ - 知乎 https://www.zhihu.com/question/323459753

如何找到自己真正想做的事情？ - 知乎 https://www.zhihu.com/question/19750624

碎片化时代，有哪些高效的学习方法？ - 知乎 https://www.zhihu.com/question/301990435

有哪些越早知道越好的人生经验？ - 知乎 https://www.zhihu.com/question/266090769

傅立叶变换、拉普拉斯变换、Z 变换的联系是什么？为什么要进行这些变换？ - 知乎 https://www.zhihu.com/question/22085329

有哪些格局比较大的书籍值得推荐？ - 知乎 https://www.zhihu.com/question/52815813

论文成功发表的科研人员，应该拥有哪些良好写作习惯？ - 知乎 https://www.zhihu.com/question/38059861

你见过哪些厉害的商业思维？ https://wx4.sinaimg.cn/mw690/6df5b9ddly1g6nl2vpdgrj20j68qi4qp.jpg

有哪些让你极力想推荐，庆幸读到的好书？ - 知乎 https://www.zhihu.com/question/39474276

对于神经网络，硕士博士不需要弄明白原理，只需要应用，是这样吗？ https://www.zhihu.com/question/433274875

在CV界，传统卷积已经彻底输给Transformer了吗？ https://www.zhihu.com/question/531529633

【经典简读】知识蒸馏(Knowledge Distillation) 经典之作 https://zhuanlan.zhihu.com/p/102038521

在CV/NLP/DL领域中，有哪些修改一行代码或者几行代码提升性能的算法？ https://www.zhihu.com/question/427088601

人脑是怎么防止梯度消失和梯度爆炸的? https://www.zhihu.com/question/380335971

读了14篇论文，终于会拿捏Diffusion了 https://zhuanlan.zhihu.com/p/587727367

finetune后的模型参数，还可以继续怎么玩？ https://zhuanlan.zhihu.com/p/591775846

工业软件很难做出来吗？ https://www.zhihu.com/question/282597028

程序员把工作完全自动化了是什么体验？ https://www.zhihu.com/question/486386099

你写论文时发现了哪些非常神的网站？ https://www.zhihu.com/question/35931336

一个完整的Pytorch深度学习项目代码，项目结构是怎样的？ https://www.zhihu.com/question/406133826

【OpenFE】全自动特征生成器 - 助力Kaggle竞赛取得更好成绩 https://zhuanlan.zhihu.com/p/587075465

什么是顶级的思维？ https://www.zhihu.com/question/525200257

那些编程水平很高的程序员是怎么训练出来的? https://www.zhihu.com/question/351504112

你所读的统计学方向，有哪些不错的讲义（Notes）？ https://www.zhihu.com/question/275938752

科研大牛们怎么读文献？ https://www.zhihu.com/question/21278186

阻碍国内团队研究 ChatGPT 这样产品的障碍有哪些，技术，钱，还是领导力？ https://www.zhihu.com/question/570782945

loss问题汇总（不收敛、震荡、nan） https://zhuanlan.zhihu.com/p/420053831

新手炼丹经验总结 https://zhuanlan.zhihu.com/p/367004782

如何理解神经网络中通过add的方式融合特征？ https://www.zhihu.com/question/306213462

如何通俗理解扩散模型？ https://zhuanlan.zhihu.com/p/563543020

你在读博士期间明白的最深刻的道理是什么？ https://www.zhihu.com/question/33336270

哪些数学书让你相见恨晚？ https://www.zhihu.com/question/366915371

作为一个算法工程师，开发算法的痛点是什么？ https://www.zhihu.com/question/559123047

有什么理论复杂但是实现简单的算法？ https://www.zhihu.com/question/27940474

为什么做机器学习的很少使用假设检验？ https://www.zhihu.com/question/55420602

「科研狗」们，你们的 idea 是怎么来的？ https://www.zhihu.com/question/436048717

超强总结！50种视觉注意力机制深度研究！199篇参考文献！ https://zhuanlan.zhihu.com/p/505470134

国内 top2 高校研一在读，为什么感觉深度学习越学越懵? https://www.zhihu.com/question/429256719

“图形学小白”友好的NeRF原理透彻讲解 https://zhuanlan.zhihu.com/p/574351707

有哪些东西是你读博士以后才懂的？ https://www.zhihu.com/question/49608607

有哪些是你到了低谷才明白的道理？ https://www.zhihu.com/question/558468475

大家都是如何刷 LeetCode 的？ https://www.zhihu.com/question/280279208

人是怎么废掉的？ https://www.zhihu.com/question/43607087

深度学习attention机制中的Q,K,V分别是从哪来的？ https://www.zhihu.com/question/325839123

Attention注意力机制与self-attention自注意力机制 https://zhuanlan.zhihu.com/p/265108616

Self-Supervised Learning 超详细解读 https://zhuanlan.zhihu.com/p/381354026

2023 年，哪些 AI/CV/NLP 问题值得博士新生研究？ https://www.zhihu.com/question/549419026

一文看懂 Attention（本质原理+3大优点+5大类型） https://zhuanlan.zhihu.com/p/91839581

你有哪些deep learning（rnn、cnn）调参的经验？ https://www.zhihu.com/question/41631631

如何写学术论文的rebuttal？ https://www.zhihu.com/question/32055996

交叉熵、相对熵（KL散度）、JS散度和Wasserstein距离（推土机距离） https://zhuanlan.zhihu.com/p/74075915

图神经网络（GNN）现在可以研究的方向有哪些呢？ https://www.zhihu.com/question/451150068

Domain Generalization | 域适应、域泛化、OOD、开放集问题定义 https://zhuanlan.zhihu.com/p/481537410

类别增量学习(Class-Incremental Learning)的前世今生、开源工具包 https://zhuanlan.zhihu.com/p/490308909

大家写深度学习代码的时候，都是怎么检查代码错没错的？ https://www.zhihu.com/question/545109120

如何从频域的角度解释CNN（卷积神经网络）？ https://www.zhihu.com/question/59532432

为什么 larger batch size 对对比学习的影响比对监督学习的影响要大？ https://www.zhihu.com/question/483524293

普通人CV领域论文创新常见思路与方向总结 https://zhuanlan.zhihu.com/p/423273070

vscode 有哪些让人眼前一亮的插件? https://www.zhihu.com/question/311803609

有没有比 Grammarly 更先进的英语作文修改润色软件？ https://www.zhihu.com/question/310372138

人是怎么变强的？ https://www.zhihu.com/question/267653585

自动驾驶领域有哪些 CornerCase 及解决方法？ https://www.zhihu.com/question/531615577

EM算法存在的意义是什么？ https://www.zhihu.com/question/40797593

类别不均衡问题之loss大集合 https://zhuanlan.zhihu.com/p/484257528

【机器学习】《白板推导》全系列笔记（手写） https://zhuanlan.zhihu.com/p/540550307

实例：手写 CUDA 算子，让 Pytorch 提速 20 倍（某特殊算子） https://zhuanlan.zhihu.com/p/476297195

如何准备google/facebook等公司research scientist职位的面试？ https://www.zhihu.com/question/54116373

你最近悟出了什么道理？ https://www.zhihu.com/question/538335062

如何对科研保持新鲜感? https://www.zhihu.com/question/470047139

深度学习中有什么非常惊艳或者轻量级的Attention操作？ https://www.zhihu.com/question/445180808

学术上的讲故事是怎样一个过程？ https://www.zhihu.com/question/35277905

想问问读博的家人们，怎么平衡科研和生活的？ https://www.zhihu.com/question/516783921

国外发达国家码农是真混得好么? https://www.zhihu.com/question/38972340

你会主动找导师汇报科研进展吗？ https://www.zhihu.com/question/561307967

你最近想通了什么事情？ https://www.zhihu.com/question/411884641

NLP 任务中有哪些巧妙的 idea？ https://www.zhihu.com/question/356132676

熬了几个通宵，我写了份CUDA新手入门代码 https://zhuanlan.zhihu.com/p/360441891

训练CV模型常用的Tips & Tricks https://zhuanlan.zhihu.com/p/592531559

一篇文章讲清楚交叉熵和KL散度 https://zhuanlan.zhihu.com/p/573385147

梯度下降法的神经网络容易收敛到局部最优，为什么应用广泛？ https://www.zhihu.com/question/68109802

深度学习有哪些trick？ https://www.zhihu.com/question/30712664

算法工程师的核心竞争力是什么？ https://www.zhihu.com/question/527696166

如何了解这个世界(社会)运行的本质？ https://www.zhihu.com/question/294801407

想学的东西太多，而自己能力有限，为此非常焦虑，该怎么办？ https://www.zhihu.com/question/20667527

深度学习中创新点比较小，但是有效果，可以发（水）论文吗? https://www.zhihu.com/question/528654768

深度学习科研，如何高效进行代码和实验管理？

https://www.zhihu.com/question/269707221

AI，ML 方向的博士新生如何针对性地复习(或重新学习)一遍数学？ https://www.zhihu.com/question/515461806

我是如何从头开始写一篇顶级论文的 https://zhuanlan.zhihu.com/p/538681254

Transformer in RL https://zhuanlan.zhihu.com/p/549289412

Vision Transformer在CV任务中的速度如何保证

https://zhuanlan.zhihu.com/p/569482746

作为审稿人，如何评价一篇论文的novelty？ https://www.zhihu.com/question/542598526

有没有可能在大规模预训练模型中，设计一个记忆区，让大规模预训练模型有查询、调用、存储知识的能力？ https://www.zhihu.com/question/551333752

怎么样保持每天看文献？ https://www.zhihu.com/question/549016289

大道至简：算法工程师炼丹Trick手册 https://zhuanlan.zhihu.com/p/352971645

黑箱优化：大规模语言模型的一种落地方式 https://zhuanlan.zhihu.com/p/455915295

决策树（下）——XGBoost、LightGBM（非常详细） https://zhuanlan.zhihu.com/p/87885678

全连接层的作用是什么？ https://www.zhihu.com/question/41037974

Sentence Embedding 现在的 sota 方法是什么？ https://www.zhihu.com/question/510987022

可以给刚直博的计算机视觉博士生一些建议吗？ https://www.zhihu.com/question/492084575

原理+代码：Diffusion Model 直观理解 https://zhuanlan.zhihu.com/p/572161541

[深度学习框架]PyTorch常用代码段 https://zhuanlan.zhihu.com/p/104019160

一个框架看懂优化算法之异同 SGD/AdaGrad/Adam https://zhuanlan.zhihu.com/p/32230623

在计算机领域的科研中，最初的创新点从何而来？ https://www.zhihu.com/question/534444001

深度学习里面，请问有写train函数的模板吗？ https://www.zhihu.com/question/523869554

Transformer & GNN https://zhuanlan.zhihu.com/p/536433171

有没有突然暗暗悟到的一个道理？ https://www.zhihu.com/question/513182850

你读过的最有力量的一段文字是什么？ https://www.zhihu.com/question/47436256

如何提升自己科研论文中「讲故事」的能力？ https://www.zhihu.com/question/28900131

计算机视觉是否已经进入瓶颈期？ https://www.zhihu.com/question/51863955

Bert/Transformer 被忽视的细节

https://zhuanlan.zhihu.com/p/559495068

NLP新宠——浅谈Prompt的前世今生 https://zhuanlan.zhihu.com/p/399295895

有哪些算法惊艳到了你？ https://www.zhihu.com/question/26934313

一个博士生接受怎样的训练是完整、全面的科研训练？ https://www.zhihu.com/question/384512106

从入门深度学习到能发顶会，你用了多久? https://www.zhihu.com/question/515738007

神经网络加上注意力机制，精度反而下降，为什么会这样呢？ https://www.zhihu.com/question/478301531

CNN是不是一种局部self-attention？ zhihu.com/question/448924025

2023年 AI 系统方向会有哪些新的进展？ https://www.zhihu.com/question/576114739

einsum is all you needed https://zhuanlan.zhihu.com/p/542625230

为什么现在越来越多搞科研的人都说自己产出的是「学术垃圾」？是否会有那么一刻觉得自己的研究有价值？ https://www.zhihu.com/question/558204287

怎样使自己处于高能量状态？ https://www.zhihu.com/question/331006661

基于深度学习的时间序列预测这个方向怎么样？ https://www.zhihu.com/question/497416867

多模态学习有什么好的研究方向？ https://www.zhihu.com/question/332876504

【机器学习】朴素贝叶斯 -> 半朴素贝叶斯 -> 贝叶斯网络 -> 贝叶斯优化，看这一篇就够了！ https://zhuanlan.zhihu.com/p/518617685

Fisher Information matrix(FIM)的性质，与Hessian, KL divergence的关联 https://zhuanlan.zhihu.com/p/563212799

如何辨别一个程序员水平的高低？ https://www.zhihu.com/question/35194924

如何形象的解释为什么神经网络层数越多效果越好？ https://www.zhihu.com/question/65403482

因果推断会是下一个AI热潮吗？ https://www.zhihu.com/question/479067450

pytorch_lightning 全程笔记 https://zhuanlan.zhihu.com/p/319810661

[深度学习框架] PyTorch 常用代码段总结 https://zhuanlan.zhihu.com/p/419063125

科研入门，在导师完全散养不管的状态下，怎么提升自己的科研能力？ https://www.zhihu.com/question/385466539

刚开始接触科研的人常见的错误有哪些？ https://www.zhihu.com/question/60075095

科研有很水的idea应该发表出来吗？ https://www.zhihu.com/question/372648294

20行代码入门PyTorch自定义CUDA/C++ https://zhuanlan.zhihu.com/p/579395211

如何应对TOP期刊审稿人的各种刁钻问题？ https://zhuanlan.zhihu.com/p/158772450

Pytorch实验代码的亿些小细节 https://zhuanlan.zhihu.com/p/409662511

AI发展感觉对绘圈冲击太大了怎么办? https://www.zhihu.com/question/557600073

人一旦开窍后，会产生哪些改变？ https://www.zhihu.com/question/507160188

什么叫降维打击？ https://www.zhihu.com/question/358755951

深度学习领域有哪些瓶颈？ https://www.zhihu.com/question/40577663

神经网络中，设计loss function有哪些技巧? https://www.zhihu.com/question/268105631

Neural ODE，这个世界终究是连续的 https://zhuanlan.zhihu.com/p/554790455

chatGPT拯救了我的期末考 https://zhuanlan.zhihu.com/p/592706418

关于AI大模型的一点思考和讨论 https://zhuanlan.zhihu.com/p/580745171

你的导师对你说过什么让你至今难以忘怀的话？ https://www.zhihu.com/question/359740428

《Instructions for PhD Students》：Dimitris给PhD学生的忠告 https://zhuanlan.zhihu.com/p/400248999

掌握什么思想会让你的数学水平有质的飞跃? https://www.zhihu.com/question/569024071

为什么有些学数学的看不惯甚至鄙视 Deep Learning？ https://www.zhihu.com/question/58992444

国内有类似 ChatGPT 能力的模型吗？ https://www.zhihu.com/question/570713548

入门深度学习，怎样快速提升深度学习方向的coding能力（看、写）？ https://www.zhihu.com/question/479601426

为什么要压缩模型，而不是直接训练一个小的CNN？ https://www.zhihu.com/question/303922732

研一，在学机器学习和深度学习，为什么感觉越学越不会，怎么解决这个问题？ https://www.zhihu.com/question/371622741

三年计算机视觉算法工程师经验吐血总结 https://zhuanlan.zhihu.com/p/560604957

常用预训练语言模型（PTMs）总结 https://zhuanlan.zhihu.com/p/406512290

Multimodality in Medical Domain：一文速览医学多模态进展 https://zhuanlan.zhihu.com/p/589018863

真正的科研应该是什么样的？ https://www.zhihu.com/question/264668384

你认为下一个 AI 风口在何时？ https://www.zhihu.com/question/557939817

AI深度学习编译器工程师需要哪些技术栈？ https://www.zhihu.com/question/532768471

联邦学习是一个伪需求吗？ https://www.zhihu.com/question/497705225

了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构？ https://www.zhihu.com/question/315611053

另辟蹊径—Denoising Diffusion Probabilistic 一种从噪音中剥离出图像/音频的模型 https://zhuanlan.zhihu.com/p/366004028

ChatGPT/InstructGPT详解 https://zhuanlan.zhihu.com/p/590311003

为什么人一旦开窍了就变的特别厉害？ https://www.zhihu.com/question/481302924

哪些 Python 库让你相见恨晚？ https://www.zhihu.com/question/24590883

注意力机制中生成的类似热力图或者柱状图是如何生成的？

https://www.zhihu.com/question/274926848

美国计算机名校例如MIT ，CMU ，有哪些公认的好课并且有课程讲义的，适合国内学生自学的？ https://www.zhihu.com/question/57532048

训练好的深度学习模型是怎么部署的？ https://www.zhihu.com/question/329372124

Response to Reviewers 回审稿信 https://zhuanlan.zhihu.com/p/269666469

语义分割综述：截止2022，语义分割总结与展望 https://zhuanlan.zhihu.com/p/538050231

你见过高校引进博士的哪些坑？ https://www.zhihu.com/question/538969178

为什么我会感觉中国大学教材很烂？ https://www.zhihu.com/question/28987052

简单的label smoothing为什么能够涨点呢 https://zhuanlan.zhihu.com/p/343807710

目前主流的attention方法都有哪些？ https://www.zhihu.com/question/68482809

为什么我用lstm，svm，ann来预测股价，效果都非常好？ https://www.zhihu.com/question/524724513

在明白什么道理后，你不再焦虑了？ https://www.zhihu.com/question/511311505

算法岗位真的需要顶会才能入场吗？ https://www.zhihu.com/question/456114288

为什么计算机学术界认可顶级会议论文，而其他领域几乎都是只认可顶级期刊？ https://www.zhihu.com/question/54142181

如何培养在计算机系统领域的研究品味（Research Taste）? https://www.zhihu.com/question/317077307

如果你是一个C++面试官，你会问哪些问题？ https://www.zhihu.com/question/451327108

正在做的idea被大佬撞车是一种怎样的体验？ https://www.zhihu.com/question/385229505

科研论文如何想到不错的 idea？ https://www.zhihu.com/question/300967426

一文了解prompt learning在计算机视觉领域进展 https://zhuanlan.zhihu.com/p/581609468

机器学习科研的十年 https://zhuanlan.zhihu.com/p/74249758

Pytorch有什么节省显存的小技巧？ https://www.zhihu.com/question/274635237

国内那么多 AI 专业，为什么国内没有 ChatGPT？ https://www.zhihu.com/question/571387160

深度学习和随机过程结合有什么有前景的研究方向？ https://www.zhihu.com/question/459256426

Prompt Learning 超强入门教程 https://zhuanlan.zhihu.com/p/442486331

视觉神经网络模型优秀开源工作：timm 库使用方法和代码解读 https://zhuanlan.zhihu.com/p/404107277

TensorRT详细入门指北，如果你还不了解TensorRT，过来看看吧！ https://zhuanlan.zhihu.com/p/371239130

科研时，想到一个idea，其实现的结果一定要比前人的评估指标高才能发表吗？ https://www.zhihu.com/question/341554948

深度学习论文中那么高的准确率都是大力出奇迹吗？ https://www.zhihu.com/question/384208793

神经网络为什么可以（理论上）拟合任何函数？ https://www.zhihu.com/question/268384579

双非人工智能研一，听说算法岗很卷，今后应该怎么学习？ https://www.zhihu.com/question/486853850

计算机专业想好好搞科研读博士，建议平时刷 leetcode 吗，会不会浪费时间？ https://www.zhihu.com/question/501818272

长远看算法岗真的比开发岗香吗？ https://www.zhihu.com/question/409815271

怎么样才叫科研能力强？ https://www.zhihu.com/question/431699092

如何从底层杀出？ https://www.zhihu.com/question/487990120

投期刊返修写Response的时候，应该写详细一些还是简要点？ https://www.zhihu.com/question/512498367

如何写好一篇高质量的IEEE/ACM Transaction级别的计算机科学论文? https://www.zhihu.com/question/22790506

近两年有哪些ViT(Vision Transformer)的改进算法？ https://www.zhihu.com/question/538049269

Multi-headed Self-attention（多头自注意力）机制介绍 https://zhuanlan.zhihu.com/p/365386753

对比学习损失（InfoNCE loss）与交叉熵损失的联系，以及温度系数的作用 https://zhuanlan.zhihu.com/p/506544456

你在做研究的时候走过哪些弯路，收获和经验是什么？ https://www.zhihu.com/question/26428572

通俗理解生成对抗网络GAN https://zhuanlan.zhihu.com/p/33752313

ChatGPT 有哪些神奇的使用方式？ https://www.zhihu.com/question/570729170

为何似乎很多博士生对教职的执念这么强？教职真有那么香？ https://www.zhihu.com/question/463848873

一文网尽CV/Robotics顶会论文常用高级词汇/句式！ https://zhuanlan.zhihu.com/p/415926905

如何直观地理解「协方差矩阵」？ https://zhuanlan.zhihu.com/p/37609917

神经网络高斯过程(Neural Network Gaussian Process) https://zhuanlan.zhihu.com/p/578745307

顶会论文写作建议（上）：宏观布局，避免“hard to follow” https://zhuanlan.zhihu.com/p/593195527

Domain Adaptation学术上有哪些方向，还有哪些可做的地方？ https://www.zhihu.com/question/337731079

GAN 和 VAE 的本质区别是什么？为什么两者总是同时被提起？ https://www.zhihu.com/question/317623081

有哪些轻量级适合阅读的优秀 C++ 开源项目？ https://www.zhihu.com/question/40131963

作为一个研究生，有哪些你直呼好用的科研神器？ https://www.zhihu.com/question/484596211

每年AI顶会几千篇，有多少真正有创新，感觉各种算法改进都是在自己的设置下才有效，公平比较基本就拉倒了? https://www.zhihu.com/question/541994477

为什么回归问题用MSE？ https://zhuanlan.zhihu.com/p/463812174

通俗形象地分析比较生成模型（GAN/VAE/Flow/Diffusion/AR） https://zhuanlan.zhihu.com/p/591881660

自己拥有一台服务器可以做哪些很酷的事情？ https://www.zhihu.com/question/40854395

在领悟到什么道理后，你的人生从此轻松了起来？ https://www.zhihu.com/question/467881890

pytorch dataloader数据加载占用了大部分时间，各位大佬都是怎么解决的？ https://www.zhihu.com/question/307282137

读硕/博期间你积累了哪些重要的科研经验？ https://www.zhihu.com/question/34686026

计算机视觉方向，现有方法已经能在课题上有很好的效果，没有提升的空间怎么办？ https://www.zhihu.com/question/501510462

研究生哪些行为可以在导师那超加分？ https://www.zhihu.com/question/443960725

Visualizer！简化你的Vision Transformer可视化！

https://zhuanlan.zhihu.com/p/398408338

超详细图解Self-Attention https://zhuanlan.zhihu.com/p/410776234

贝叶斯深度学习是什么，和传统神经网络有何不同？ https://www.zhihu.com/question/352295592

强化学习领域目前遇到的瓶颈是什么? https://www.zhihu.com/question/449478247

一篇文章搞定GBDT、Xgboost和LightGBM的面试 https://zhuanlan.zhihu.com/p/148050748

pytorch 提速指南 https://zhuanlan.zhihu.com/p/119364172

CUDA 的包比自己写的 Kernel 快 10~20 倍，有什么内在机制呢？ https://www.zhihu.com/question/356661099

如何系统学习机器学习？ https://www.zhihu.com/question/266291909

那些漂亮的sci论文图一般用什么软件制作的？ https://www.zhihu.com/question/27474094

我们穷极一生，究竟追寻的是什么？ https://www.zhihu.com/question/384441334

用随机梯度下降来优化人生 https://zhuanlan.zhihu.com/p/414009313

为什么中国诞生不了 Hugging Face 这样的公司？ https://www.zhihu.com/question/487319180

为什么AI算法工程师要求C++? https://www.zhihu.com/question/373811828

有哪些令你印象深刻的魔改transformer？ https://www.zhihu.com/question/349958732

Huggingface 超详细介绍 https://zhuanlan.zhihu.com/p/535100411

特征可视化技术(CAM)

https://zhuanlan.zhihu.com/p/269702192

This post is all you need（上卷）——层层剥开Transformer https://zhuanlan.zhihu.com/p/420820453

科研工作者的你，每天有多努力？ https://www.zhihu.com/question/432181844

算法工程师的「天地之间」 https://zhuanlan.zhihu.com/p/495479206

现在投身于计算机视觉是否明智？ https://www.zhihu.com/question/317440183

Pytorch Lightning 和 HuggingFace 的 Trainer 哪个好用？ https://www.zhihu.com/question/521501258

什么是人生的最顶级享受？ https://www.zhihu.com/question/538449801

深度学习中 Batch Normalization为什么效果好？ https://www.zhihu.com/question/38102762

科研搞不出来的时候，大家一般都会干什么？ https://www.zhihu.com/question/62269624

有哪些道理你后悔没有早点知道？ https://www.zhihu.com/question/23819007

机器学习、深度学习领域有哪些被广泛提及但你不认同的结论或观点？ https://www.zhihu.com/question/292134377

创世游戏：Diffusion Model 的非数学解释 https://zhuanlan.zhihu.com/p/580010670

动手实现 MAE(Masked Autoencoders Are Scalable Vision Learners) https://zhuanlan.zhihu.com/p/439554945

如果让你重新开始学计算机，你的学习路线会怎么选择? https://www.zhihu.com/question/492545174

为什么神经网络走向了“深度”，而不是“广度”的方向，深度网络相比于广度网络的优势在哪里？ https://www.zhihu.com/question/528184564

强化学习怎么入门好？ https://www.zhihu.com/question/277325426

浅谈学术论文rebuttal https://zhuanlan.zhihu.com/p/104298923

Pytorch Lightning 完全攻略 https://zhuanlan.zhihu.com/p/353985363

何时能懂你的心——图卷积神经网络（GCN） https://zhuanlan.zhihu.com/p/71200936

你的编程能力从什么时候开始突飞猛进？ https://www.zhihu.com/question/356351510

多任务学习中各loss权重应该如何设计呢？ https://www.zhihu.com/question/359962155

面试官如何判断面试者的机器学习水平？ https://www.zhihu.com/question/62482926

多模态融合fusion的各种操作 https://zhuanlan.zhihu.com/p/152234745

多模态学习综述及最新方向 https://zhuanlan.zhihu.com/p/389287751

为什么东亚学生上课时通常不甚活跃，不爱发言？ https://www.zhihu.com/question/19769575

从可解释性看人工智能——一个缺少大问题的时代 https://zhuanlan.zhihu.com/p/533974367

GPU内存(显存)的理解与基本使用 https://zhuanlan.zhihu.com/p/462191421

如何拥有旺盛精力？ https://www.zhihu.com/question/21671881

如果每天在 LeetCode 上刷一道题，一年之后会有什么变化？ https://www.zhihu.com/question/317046234

作为审稿人，你什么情况下会选择拒稿？ https://www.zhihu.com/question/529489400

transformer 为什么使用 layer normalization，而不是其他的归一化方法？ https://www.zhihu.com/question/395811291

深度学习的基础理论研究为什么难 https://zhuanlan.zhihu.com/p/576869905

图神经网络（Graph Neural Networks，GNN）综述 https://zhuanlan.zhihu.com/p/75307407

人工智能是不是走错了方向？ https://www.zhihu.com/question/445383290

对神经网络某一层做了小改进，效果却提升显著，可以发论文吗？ https://www.zhihu.com/question/426235983

扩散模型与能量模型，Score-Matching和SDE，ODE的关系 https://zhuanlan.zhihu.com/p/576779879

科研作图的一些个人想法 https://zhuanlan.zhihu.com/p/603088040

不同领域的圣经级书籍有哪些？ https://www.zhihu.com/question/28438145

怎样克服神经网络训练中argmax的不可导性？ https://www.zhihu.com/question/422373907

深度学习的学习历程 https://zhuanlan.zhihu.com/p/34524772

纯量产经验：谈谈目标检测中正负样本的问题 https://zhuanlan.zhihu.com/p/563196861

科研上最忌讳的事情有哪些？ https://www.zhihu.com/question/464787797

现在的计算机专业（比如机器学习）已经沦为调包专业了吗？ https://www.zhihu.com/question/327494084

人工智能领域有哪些精妙的数学原理？ https://www.zhihu.com/question/508649281

顶会rebuttal技术浅谈：站着，还把论文中了 https://zhuanlan.zhihu.com/p/602024489

刚进算法团队，大牛们讨论高深的 cv 术语和算法，如何才能听懂？ https://www.zhihu.com/question/469612040

如何解决「小样本」+「多分类」问题？ https://www.zhihu.com/question/389155523

ChatGPT发展历程、原理、技术架构详解和产业未来 https://zhuanlan.zhihu.com/p/590655677

Transformer结构及其应用详解--GPT、BERT、MT-DNN、GPT-2 https://zhuanlan.zhihu.com/p/69290203

思维链（Chain-of-thoughts）作为提示 https://zhuanlan.zhihu.com/p/493533589

哪一刻让你觉得世人皆苦? https://www.zhihu.com/question/281271203

如何激怒一位人工智能（机器学习、深度学习、强化学习等）爱好者？ https://www.zhihu.com/question/339602806

一个算法工程师的日常是怎样的？ https://www.zhihu.com/question/29692814

特征工程到底是什么？ https://www.zhihu.com/question/29316149

贝叶斯学派与频率学派有何不同？ https://www.zhihu.com/question/20587681

学习深度学习是否要先学习机器学习？ https://www.zhihu.com/question/382278216

解读 ChatGPT 背后的技术重点：RLHF、IFT、CoT、红蓝对抗 https://zhuanlan.zhihu.com/p/602458131

超细节的对比学习和SimCSE知识点 https://zhuanlan.zhihu.com/p/378340148

一个人该怎样找到自己真正热爱和擅长的事，并以此规划自己的人生？ https://www.zhihu.com/question/399452902

要研究深度学习的可解释性（Interpretability），应从哪几个方面着手？

https://www.zhihu.com/question/320688440

如何通俗易懂地解释卷积？ https://www.zhihu.com/question/22298352

学术界科研（research）与工业界研发（R&D）有什么区别？ https://www.zhihu.com/question/366503145

PyTorch分布式训练简明教程(2022更新版) https://zhuanlan.zhihu.com/p/113694038

一文掌握多模态领域的可控文本生成 https://zhuanlan.zhihu.com/p/586914091

有哪些你看了以后大呼过瘾的编程书？ https://www.zhihu.com/question/50408698

如何开始在 github 上学习东西？ https://www.zhihu.com/question/30119197

在做算法工程师的道路上，你掌握了什么概念或技术使你感觉自我提升突飞猛进？ https://www.zhihu.com/question/436874654

机器学习如何才能避免「只是调参数」？ https://www.zhihu.com/question/264528062

ChatGPT 有多高的技术壁垒？国内外除了 OpenAI 还有谁可以做到类似程度？ https://www.zhihu.com/question/581806122

ChatGPT 这个风口，普通人怎么抓住？ https://www.zhihu.com/question/582326598

通俗易懂的YOLO系列(从v1到v5)模型解读 https://zhuanlan.zhihu.com/p/183261974 https://zhuanlan.zhihu.com/p/183781646 https://zhuanlan.zhihu.com/p/186014243

Multi-task Learning and Beyond: 过去，现在与未来 https://zhuanlan.zhihu.com/p/138597214

Nature亲自示范：如何提升论文「讲故事」的能力？ https://zhuanlan.zhihu.com/p/593041037

有哪本书，你恨不得把它全部内容都背诵下来？ https://www.zhihu.com/question/485142113

你遇到过的科研大牛们都有什么样的优秀的习惯或品质？ https://www.zhihu.com/question/329940758

Python如何快速定位最慢的代码？ https://www.zhihu.com/question/485980118

神经网络的万能逼近定理已经发展到什么地步了？ https://www.zhihu.com/question/347654789

为什么说深度学习没有理论基础? https://www.zhihu.com/question/450835283

抱抱脸：ChatGPT背后的算法——RLHF https://zhuanlan.zhihu.com/p/592671478

PyTorch 学习笔记汇总 https://zhuanlan.zhihu.com/p/265394674

面对“大模型+大规模预训练+重视SOTA的审稿人”，AI科研除了轻量化还有什么出路？ https://www.zhihu.com/question/535292924

如何看待计算机视觉未来的走向? https://www.zhihu.com/question/436846337

机器学习“判定模型”和“生成模型”有什么区别？ https://www.zhihu.com/question/20446337

从零实现ChatGPT——RLHF技术笔记 https://zhuanlan.zhihu.com/p/591474085

关于利用 information bottleneck 来解释深度学习 https://zhuanlan.zhihu.com/p/29723280

分分钟带你杀入Kaggle Top 1% https://zhuanlan.zhihu.com/p/27424282

为什么国内 IT 公司 leader 以上就不怎么写代码，而据说 Google 的 Jeff Dean 还写代码？到底哪种情况好呢？ https://www.zhihu.com/question/23321862

大白话谈因果系列文章（一）：因果推断简介及论文介绍 https://zhuanlan.zhihu.com/p/397796913

有什么事是你过了很多年突然明白的？ https://www.zhihu.com/question/285382931

同组博士师兄的结果复现不出来，我应该怎么办？ https://www.zhihu.com/question/502804990

世界上有哪些代码量很少，但很牛逼很经典的算法或项目案例？ https://www.zhihu.com/question/358255792

有哪些「魔改」loss函数，曾经拯救了你的深度学习模型？ https://www.zhihu.com/question/294635686

以 ChatGPT 为代表的「大模型」会是多大的技术革命？如果要发生技术革命需要具备哪些条件？ https://www.zhihu.com/question/581311491

如何高效地学习pytorch？ https://www.zhihu.com/question/310782630

论文要怎么读？研究院院长孙剑的最新体会都在这里了 https://zhuanlan.zhihu.com/p/439024970

transformer问题整理 https://zhuanlan.zhihu.com/p/266695736

为什么chatgpt的上下文连续对话能力得到了大幅度提升？ https://www.zhihu.com/question/575481512

PyTorch 有哪些坑/bug？ https://www.zhihu.com/question/67209417

ChatGPT 这个项目会开源吗？ https://www.zhihu.com/question/571390218

机器学习中有哪些形式简单却很巧妙的idea？ https://www.zhihu.com/question/347847220

你实践中学到的最重要的机器学习经验是什么？ https://www.zhihu.com/question/46301335

浅谈弱监督学习（Weakly Supervised Learning） https://zhuanlan.zhihu.com/p/81404885

Visual grounding系列--领域初探 https://zhuanlan.zhihu.com/p/388504127

工业界和学术界最大区别是什么？ https://www.zhihu.com/question/332602866

为什么有些算法工程师从来不谈业务，不谈解决问题，不谈价值挖掘，开口闭口就是算法模型，炼丹调参工程化？ https://www.zhihu.com/question/454718449

你遇见过什么当时很有潜力但是最终没有流行的深度学习算法? https://www.zhihu.com/question/490517834

学术论文投稿与返修（Rebuttal）分享 https://zhuanlan.zhihu.com/p/344008879

图像中的无监督学习（Moco、Simclr、BYOL、SimSiam、SwAV、MAE、IPT） https://zhuanlan.zhihu.com/p/537647617

为什么交叉熵（cross-entropy）可以用于计算代价？ https://www.zhihu.com/question/65288314

为什么Transformer要用LayerNorm？ https://www.zhihu.com/question/487766088

怎么知道一名研究生有没有科研潜力？ https://www.zhihu.com/question/367370829

没有顶会的CV/NLP方向的博士生毕业出路在哪里？ https://www.zhihu.com/question/415698167

一般来说，三层神经网络可以逼近任何一个非线性函数，为什么还需要深度神经网络? https://www.zhihu.com/question/344962955

存在错误标注的伪标签为什么会帮助训练出更好的模型? https://www.zhihu.com/question/563144316

如何理解attention中的Q,K,V？ https://www.zhihu.com/question/298810062

如何直观理解PPO算法?[理论篇] https://zhuanlan.zhihu.com/p/111049450

一文搞懂熵(Entropy),交叉熵(Cross-Entropy) https://zhuanlan.zhihu.com/p/149186719

如何评价近几年顶会的超分，去噪，去模糊等图像复原文章？ https://www.zhihu.com/question/324809101

能否使用神经网络来判断奇偶数？ https://www.zhihu.com/question/364113452

关于ChatGPT八个技术问题的猜想 https://zhuanlan.zhihu.com/p/606478660

backbone、head、neck等深度学习中的术语解释 https://zhuanlan.zhihu.com/p/348800083

人在什么情况下成长最快？ https://www.zhihu.com/question/490344475

有什么高质量的现代 C++ 风格的开源代码? https://www.zhihu.com/question/23153437

信息论与机器学习有着怎样的关系? https://www.zhihu.com/question/37349649

如何做到史上最快的基于CPU的通用强化学习环境并行模拟器？ https://zhuanlan.zhihu.com/p/431543858

自监督对比学习（Contrastive Learning）综述+代码 https://zhuanlan.zhihu.com/p/334732028

预训练模型高效Finetune工作总结 https://zhuanlan.zhihu.com/p/485221818

矩阵求导的本质与分子布局、分母布局的本质（矩阵求导——本质篇） https://zhuanlan.zhihu.com/p/263777564

作为博士生，你们有没有遇到过一个科研问题几个月解决不了的情况？ https://www.zhihu.com/question/399266921

为什么都说神经网络是个黑箱？ https://www.zhihu.com/question/263672028

怎么形象理解embedding这个概念？ https://www.zhihu.com/question/38002635

博士生在没有导师指导的情况下，该如何自己选题发 CVPR ？ https://www.zhihu.com/question/64566768

你们都从导师身上学会了什么？ https://www.zhihu.com/question/583133150

如果百年后深度学习最终有了公认的数学理论作为基础，能解释实验中的各类玄学，那这个理论会长什么样子？ https://www.zhihu.com/question/507836671

深度学习的可解释性方向的研究是不是巨坑？ https://www.zhihu.com/question/341190239

深度学习科研，如何高效进行代码和实验管理？ https://www.zhihu.com/question/269707221

为什么样本方差（sample variance）的分母是 n-1？ https://www.zhihu.com/question/20099757

深度学习中Attention与全连接层的区别何在？ https://www.zhihu.com/question/320174043

如果互联网逐渐充斥 AI 生成的有瑕疵的内容，将来基于这些信息训练的 AI 会不会更加离谱？ https://www.zhihu.com/question/583368022

Instruction Tuning｜谷歌Quoc V.Le团队提出又一精调范式 https://zhuanlan.zhihu.com/p/408166011

谈CV领域审稿 https://zhuanlan.zhihu.com/p/429188796

一文梳理多任务学习(MMoE/PLE/DUPN/ESSM等) https://zhuanlan.zhihu.com/p/363059498

一文搞懂激活函数(Sigmoid/ReLU/LeakyReLU/PReLU/ELU) https://zhuanlan.zhihu.com/p/172254089

常见的损失函数(loss function)总结 https://zhuanlan.zhihu.com/p/58883095

一文带你浏览Graph Transformers https://zhuanlan.zhihu.com/p/536489997

学术界有什么潜规则吗？ https://www.zhihu.com/question/271530655

你人生中太晚明白的道理是什么？ https://www.zhihu.com/question/470076571

为什么Transformer 需要进行 Multi-head Attention？ https://www.zhihu.com/question/341222779

AI论文中的novelty如何评价？ https://www.zhihu.com/question/503131049

AI系统全栈技术思考与展望 https://zhuanlan.zhihu.com/p/462810001

异常检测（anomaly/ outlier detection）领域还有那些值得研究的问题？ https://www.zhihu.com/question/324999831

复现ChatGPT的难点与平替 https://zhuanlan.zhihu.com/p/607847588

写给未来或正在读PhD的同学们 https://zhuanlan.zhihu.com/p/607501744

一文入门元学习（Meta-Learning）） https://zhuanlan.zhihu.com/p/136975128

一图胜千言，超形象图解NumPy教程 https://zhuanlan.zhihu.com/p/504917890

懂深度学习算法，目前想往模型部署优化这个方向发展，请问学习路线是什么？ https://www.zhihu.com/question/411393222

傅里叶变换、拉普拉斯变换、Z 变换的联系是什么？为什么要进行这些变换？ https://www.zhihu.com/question/22085329

为什么在实际的kaggle比赛中，GBDT和Random Forest效果非常好？ https://www.zhihu.com/question/51818176

3W字长文带你轻松入门视觉transformer https://zhuanlan.zhihu.com/p/308301901

工作量大的人怎么做才能每天都精力充沛？ https://www.zhihu.com/question/20383485

在科研路上，大家有什么经验教训？ https://www.zhihu.com/question/65354878

为什么Transformer适合做多模态任务？ https://www.zhihu.com/question/441073210

如何将专家知识编码入神经网络，有哪些好的工作可以可以参考？ https://www.zhihu.com/question/529959915

如何通俗并尽可能详细地解释卡尔曼滤波？ https://www.zhihu.com/question/23971601

复现和使用GPT-3/ChatGPT，我们应该注意什么？ https://zhuanlan.zhihu.com/p/607744955

目前工业界常用的推荐系统模型有哪些？ https://www.zhihu.com/question/314773668

有了Transformer框架后是不是RNN完全可以废弃了？ https://www.zhihu.com/question/302392659

可以把科研压力转移给导师吗？ https://www.zhihu.com/question/557819220

大语言模型中的涌现现象是不是伪科学？ https://www.zhihu.com/question/587177332

图神经网络真的有意义吗？ https://www.zhihu.com/question/528852359

23.03.04 | 计算机视觉博士生存指南（一） https://zhuanlan.zhihu.com/p/610774199

关于Instruct GPT复现的一些细节与想法 https://zhuanlan.zhihu.com/p/609078527

这个ChatGPT真像某些人那样吹得神乎其神吗？ https://www.zhihu.com/question/584515782

OpenAI 发布 GPT-4，有哪些技术上的优化或突破？ https://www.zhihu.com/question/589639535

OpenAI 发布多模态 GPT-4 模型，会开创哪些新的研究方向？ https://www.zhihu.com/question/589640227

模型部署入门教程（一）：模型部署简介 https://zhuanlan.zhihu.com/p/477743341

目标检测正负样本区分策略和平衡策略总结(一) https://zhuanlan.zhihu.com/p/138824387

Kaggle冠军方案--使用Autoencoder MLP+XGBoost做金融市场预测 https://zhuanlan.zhihu.com/p/552237170

Adversarial Weight Perturbation，一文了解kaggle金牌方案都在用的AWP https://zhuanlan.zhihu.com/p/563641649

因果推断（causal inference）是回归（regression）问题的一种特例吗？ https://www.zhihu.com/question/266812683

矩阵的本质是什么？ https://www.zhihu.com/question/22047061

谷歌发布史上最大「通才」AI 模型，可让机器人更自主，具有哪些意义？应用前景如何？ https://www.zhihu.com/question/588318882

用 ChatGPT 开放的 API 接口可以做哪些自研工具？ https://www.zhihu.com/question/587168092

深度学习方面的科研工作中的实验代码有什么规范和写作技巧？如何妥善管理实验数据？ https://www.zhihu.com/question/268193800

如何评价 OpenAI 的超级对话模型 ChatGPT ？ https://www.zhihu.com/question/570189639

如何自然地演讲 PPT，而不是念 PPT？ https://www.zhihu.com/question/432657311

为什么现在的LLM都是Decoder only的架构？ https://www.zhihu.com/question/588325646

2023年后，AI 还有什么研究方向有前景？ https://www.zhihu.com/question/591140366

ChatGPT 为什么不用 Reward-Model 的数据直接 fine-tune，而用 RL？ https://www.zhihu.com/question/596230048

如何为GPT/LLM模型添加额外知识？ https://www.zhihu.com/question/591935281

MLC-LLM: 在任何设备上编译运行大语言模型 https://zhuanlan.zhihu.com/p/625959003

「走出新手村」十次 CV 论文会议投稿的经验总结 https://zhuanlan.zhihu.com/p/627032371

如何克服科研中不想写论文的心理? https://www.zhihu.com/question/442152051

搞科研的你一般在什么情况/条件下最容易产生灵感？ https://www.zhihu.com/question/457212453

世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能 https://zhuanlan.zhihu.com/p/632795115

为什么说大模型训练很难？ https://www.zhihu.com/question/498271491

如何才能快乐地做科研？ https://www.zhihu.com/question/452940941

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Zhihu.md

Zhihu.md

深度学习科研，如何高效进行代码和实验管理？

Vision Transformer在CV任务中的速度如何保证

Bert/Transformer 被忽视的细节

注意力机制中生成的类似热力图或者柱状图是如何生成的？

Visualizer！简化你的Vision Transformer可视化！

特征可视化技术(CAM)

要研究深度学习的可解释性（Interpretability），应从哪几个方面着手？

Files

Zhihu.md

Latest commit

History

Zhihu.md

File metadata and controls

深度学习科研，如何高效进行代码和实验管理？

Vision Transformer在CV任务中的速度如何保证

Bert/Transformer 被忽视的细节

注意力机制中生成的类似热力图或者柱状图是如何生成的？

Visualizer！简化你的Vision Transformer可视化！

特征可视化技术(CAM)

要研究深度学习的可解释性（Interpretability），应从哪几个方面着手？