聪明有什么坏处 https://www.zhihu.com/question/29312685
人工智能在工业界用到的模型都是最前沿的吗 https://www.zhihu.com/question/304599202
目标检测领域还有什么可以做的 https://www.zhihu.com/question/280703314 2019.1.2 有篇总结的很全
人工智能从业者应该从哪里去寻找和阅读顶级论文 https://www.zhihu.com/question/303022763 关注该领域国外著名教授的twitter,定期刷reddit
有哪些句子是真正写到你的心里去了 https://www.zhihu.com/question/281637180
人们常犯的逻辑错误有哪些 https://www.zhihu.com/question/19864656
如何克服严重的拖延症 https://www.zhihu.com/question/20357585
如何深入理解「比你优秀的人不可怕,可怕的是比你优秀的人比你更努力」这句话 https://www.zhihu.com/question/31971136
人这一生为什么要努力 https://www.zhihu.com/question/22913650
有哪些年轻人必读的书,或对未来特别有好处的书 https://www.zhihu.com/question/275351176
如何保持长期、持续、稳定的努力 https://www.zhihu.com/question/27484486
英文原版阅读有哪些入门书籍推荐 https://www.zhihu.com/question/20291266
科研搞不出来的时候,大家一般都会干什么 https://www.zhihu.com/question/62269624
有哪些数学上的事实,没有一定数学知识的人不会相信? - 知乎 https://www.zhihu.com/question/288093713
如何保持长期、持续、稳定的努力? - 知乎 https://www.zhihu.com/question/27484486
怎样理解和区分中心极限定理与大数定律? - 知乎 https://www.zhihu.com/question/22913867
科研大牛们怎么读文献? - 知乎 https://www.zhihu.com/question/21278186
不想学习的时候如何逼迫自己去学习? - 知乎 https://www.zhihu.com/question/20773513
你是怎么变自律的? - 知乎 https://www.zhihu.com/question/284206141
了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构 https://www.zhihu.com/question/315611053/answer/676815240?utm_source=weibo&utm_medium=social&utm_oi=28266941382656
如何学习数据结构? - 知乎 https://www.zhihu.com/question/21318658
有哪些让你相见恨晚的思维方式? - 知乎 https://www.zhihu.com/question/323459753
如何找到自己真正想做的事情? - 知乎 https://www.zhihu.com/question/19750624
碎片化时代,有哪些高效的学习方法? - 知乎 https://www.zhihu.com/question/301990435
有哪些越早知道越好的人生经验? - 知乎 https://www.zhihu.com/question/266090769
傅立叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换? - 知乎 https://www.zhihu.com/question/22085329
有哪些格局比较大的书籍值得推荐? - 知乎 https://www.zhihu.com/question/52815813
论文成功发表的科研人员,应该拥有哪些良好写作习惯? - 知乎 https://www.zhihu.com/question/38059861
你见过哪些厉害的商业思维? https://wx4.sinaimg.cn/mw690/6df5b9ddly1g6nl2vpdgrj20j68qi4qp.jpg
有哪些让你极力想推荐,庆幸读到的好书? - 知乎 https://www.zhihu.com/question/39474276
对于神经网络,硕士博士不需要弄明白原理,只需要应用,是这样吗? https://www.zhihu.com/question/433274875
在CV界,传统卷积已经彻底输给Transformer了吗? https://www.zhihu.com/question/531529633
【经典简读】知识蒸馏(Knowledge Distillation) 经典之作 https://zhuanlan.zhihu.com/p/102038521
在CV/NLP/DL领域中,有哪些修改一行代码或者几行代码提升性能的算法? https://www.zhihu.com/question/427088601
人脑是怎么防止梯度消失和梯度爆炸的? https://www.zhihu.com/question/380335971
读了14篇论文,终于会拿捏Diffusion了 https://zhuanlan.zhihu.com/p/587727367
finetune后的模型参数,还可以继续怎么玩? https://zhuanlan.zhihu.com/p/591775846
工业软件很难做出来吗? https://www.zhihu.com/question/282597028
程序员把工作完全自动化了是什么体验? https://www.zhihu.com/question/486386099
你写论文时发现了哪些非常神的网站? https://www.zhihu.com/question/35931336
一个完整的Pytorch深度学习项目代码,项目结构是怎样的? https://www.zhihu.com/question/406133826
【OpenFE】全自动特征生成器 - 助力Kaggle竞赛取得更好成绩 https://zhuanlan.zhihu.com/p/587075465
什么是顶级的思维? https://www.zhihu.com/question/525200257
那些编程水平很高的程序员是怎么训练出来的? https://www.zhihu.com/question/351504112
你所读的统计学方向,有哪些不错的讲义(Notes)? https://www.zhihu.com/question/275938752
科研大牛们怎么读文献? https://www.zhihu.com/question/21278186
阻碍国内团队研究 ChatGPT 这样产品的障碍有哪些,技术,钱,还是领导力? https://www.zhihu.com/question/570782945
loss问题汇总(不收敛、震荡、nan) https://zhuanlan.zhihu.com/p/420053831
新手炼丹经验总结 https://zhuanlan.zhihu.com/p/367004782
如何理解神经网络中通过add的方式融合特征? https://www.zhihu.com/question/306213462
如何通俗理解扩散模型? https://zhuanlan.zhihu.com/p/563543020
你在读博士期间明白的最深刻的道理是什么? https://www.zhihu.com/question/33336270
哪些数学书让你相见恨晚? https://www.zhihu.com/question/366915371
作为一个算法工程师,开发算法的痛点是什么? https://www.zhihu.com/question/559123047
有什么理论复杂但是实现简单的算法? https://www.zhihu.com/question/27940474
为什么做机器学习的很少使用假设检验? https://www.zhihu.com/question/55420602
「科研狗」们,你们的 idea 是怎么来的? https://www.zhihu.com/question/436048717
超强总结!50种视觉注意力机制深度研究!199篇参考文献! https://zhuanlan.zhihu.com/p/505470134
国内 top2 高校研一在读,为什么感觉深度学习越学越懵? https://www.zhihu.com/question/429256719
“图形学小白”友好的NeRF原理透彻讲解 https://zhuanlan.zhihu.com/p/574351707
有哪些东西是你读博士以后才懂的? https://www.zhihu.com/question/49608607
有哪些是你到了低谷才明白的道理? https://www.zhihu.com/question/558468475
大家都是如何刷 LeetCode 的? https://www.zhihu.com/question/280279208
人是怎么废掉的? https://www.zhihu.com/question/43607087
深度学习attention机制中的Q,K,V分别是从哪来的? https://www.zhihu.com/question/325839123
Attention注意力机制与self-attention自注意力机制 https://zhuanlan.zhihu.com/p/265108616
Self-Supervised Learning 超详细解读 https://zhuanlan.zhihu.com/p/381354026
2023 年,哪些 AI/CV/NLP 问题值得博士新生研究? https://www.zhihu.com/question/549419026
一文看懂 Attention(本质原理+3大优点+5大类型) https://zhuanlan.zhihu.com/p/91839581
你有哪些deep learning(rnn、cnn)调参的经验? https://www.zhihu.com/question/41631631
如何写学术论文的rebuttal? https://www.zhihu.com/question/32055996
交叉熵、相对熵(KL散度)、JS散度和Wasserstein距离(推土机距离) https://zhuanlan.zhihu.com/p/74075915
图神经网络(GNN)现在可以研究的方向有哪些呢? https://www.zhihu.com/question/451150068
Domain Generalization | 域适应、域泛化、OOD、开放集问题定义 https://zhuanlan.zhihu.com/p/481537410
类别增量学习(Class-Incremental Learning)的前世今生、开源工具包 https://zhuanlan.zhihu.com/p/490308909
大家写深度学习代码的时候,都是怎么检查代码错没错的? https://www.zhihu.com/question/545109120
如何从频域的角度解释CNN(卷积神经网络)? https://www.zhihu.com/question/59532432
为什么 larger batch size 对对比学习的影响比对监督学习的影响要大? https://www.zhihu.com/question/483524293
普通人CV领域论文创新常见思路与方向总结 https://zhuanlan.zhihu.com/p/423273070
vscode 有哪些让人眼前一亮的插件? https://www.zhihu.com/question/311803609
有没有比 Grammarly 更先进的英语作文修改润色软件? https://www.zhihu.com/question/310372138
人是怎么变强的? https://www.zhihu.com/question/267653585
自动驾驶领域有哪些 CornerCase 及解决方法? https://www.zhihu.com/question/531615577
EM算法存在的意义是什么? https://www.zhihu.com/question/40797593
类别不均衡问题之loss大集合 https://zhuanlan.zhihu.com/p/484257528
【机器学习】《白板推导》全系列笔记(手写) https://zhuanlan.zhihu.com/p/540550307
实例:手写 CUDA 算子,让 Pytorch 提速 20 倍(某特殊算子) https://zhuanlan.zhihu.com/p/476297195
如何准备google/facebook等公司research scientist职位的面试? https://www.zhihu.com/question/54116373
你最近悟出了什么道理? https://www.zhihu.com/question/538335062
如何对科研保持新鲜感? https://www.zhihu.com/question/470047139
深度学习中有什么非常惊艳或者轻量级的Attention操作? https://www.zhihu.com/question/445180808
学术上的讲故事是怎样一个过程? https://www.zhihu.com/question/35277905
想问问读博的家人们,怎么平衡科研和生活的? https://www.zhihu.com/question/516783921
国外发达国家码农是真混得好么? https://www.zhihu.com/question/38972340
你会主动找导师汇报科研进展吗? https://www.zhihu.com/question/561307967
你最近想通了什么事情? https://www.zhihu.com/question/411884641
NLP 任务中有哪些巧妙的 idea? https://www.zhihu.com/question/356132676
熬了几个通宵,我写了份CUDA新手入门代码 https://zhuanlan.zhihu.com/p/360441891
训练CV模型常用的Tips & Tricks https://zhuanlan.zhihu.com/p/592531559
一篇文章讲清楚交叉熵和KL散度 https://zhuanlan.zhihu.com/p/573385147
梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛? https://www.zhihu.com/question/68109802
深度学习有哪些trick? https://www.zhihu.com/question/30712664
算法工程师的核心竞争力是什么? https://www.zhihu.com/question/527696166
如何了解这个世界(社会)运行的本质? https://www.zhihu.com/question/294801407
想学的东西太多,而自己能力有限,为此非常焦虑,该怎么办? https://www.zhihu.com/question/20667527
深度学习中创新点比较小,但是有效果,可以发(水)论文吗? https://www.zhihu.com/question/528654768
https://www.zhihu.com/question/269707221
AI,ML 方向的博士新生如何针对性地复习(或重新学习)一遍数学? https://www.zhihu.com/question/515461806
我是如何从头开始写一篇顶级论文的 https://zhuanlan.zhihu.com/p/538681254
Transformer in RL https://zhuanlan.zhihu.com/p/549289412
https://zhuanlan.zhihu.com/p/569482746
作为审稿人,如何评价一篇论文的novelty? https://www.zhihu.com/question/542598526
有没有可能在大规模预训练模型中,设计一个记忆区,让大规模预训练模型有查询、调用、存储知识的能力? https://www.zhihu.com/question/551333752
怎么样保持每天看文献? https://www.zhihu.com/question/549016289
大道至简:算法工程师炼丹Trick手册 https://zhuanlan.zhihu.com/p/352971645
黑箱优化:大规模语言模型的一种落地方式 https://zhuanlan.zhihu.com/p/455915295
决策树(下)——XGBoost、LightGBM(非常详细) https://zhuanlan.zhihu.com/p/87885678
全连接层的作用是什么? https://www.zhihu.com/question/41037974
Sentence Embedding 现在的 sota 方法是什么? https://www.zhihu.com/question/510987022
可以给刚直博的计算机视觉博士生一些建议吗? https://www.zhihu.com/question/492084575
原理+代码:Diffusion Model 直观理解 https://zhuanlan.zhihu.com/p/572161541
[深度学习框架]PyTorch常用代码段 https://zhuanlan.zhihu.com/p/104019160
一个框架看懂优化算法之异同 SGD/AdaGrad/Adam https://zhuanlan.zhihu.com/p/32230623
在计算机领域的科研中,最初的创新点从何而来? https://www.zhihu.com/question/534444001
深度学习里面,请问有写train函数的模板吗? https://www.zhihu.com/question/523869554
Transformer & GNN https://zhuanlan.zhihu.com/p/536433171
有没有突然暗暗悟到的一个道理? https://www.zhihu.com/question/513182850
你读过的最有力量的一段文字是什么? https://www.zhihu.com/question/47436256
如何提升自己科研论文中「讲故事」的能力? https://www.zhihu.com/question/28900131
计算机视觉是否已经进入瓶颈期? https://www.zhihu.com/question/51863955
https://zhuanlan.zhihu.com/p/559495068
NLP新宠——浅谈Prompt的前世今生 https://zhuanlan.zhihu.com/p/399295895
有哪些算法惊艳到了你? https://www.zhihu.com/question/26934313
一个博士生接受怎样的训练是完整、全面的科研训练? https://www.zhihu.com/question/384512106
从入门深度学习到能发顶会,你用了多久? https://www.zhihu.com/question/515738007
神经网络加上注意力机制,精度反而下降,为什么会这样呢? https://www.zhihu.com/question/478301531
CNN是不是一种局部self-attention? zhihu.com/question/448924025
2023年 AI 系统方向会有哪些新的进展? https://www.zhihu.com/question/576114739
einsum is all you needed https://zhuanlan.zhihu.com/p/542625230
为什么现在越来越多搞科研的人都说自己产出的是「学术垃圾」?是否会有那么一刻觉得自己的研究有价值? https://www.zhihu.com/question/558204287
怎样使自己处于高能量状态? https://www.zhihu.com/question/331006661
基于深度学习的时间序列预测这个方向怎么样? https://www.zhihu.com/question/497416867
多模态学习有什么好的研究方向? https://www.zhihu.com/question/332876504
【机器学习】朴素贝叶斯 -> 半朴素贝叶斯 -> 贝叶斯网络 -> 贝叶斯优化,看这一篇就够了! https://zhuanlan.zhihu.com/p/518617685
Fisher Information matrix(FIM)的性质,与Hessian, KL divergence的关联 https://zhuanlan.zhihu.com/p/563212799
如何辨别一个程序员水平的高低? https://www.zhihu.com/question/35194924
如何形象的解释为什么神经网络层数越多效果越好? https://www.zhihu.com/question/65403482
因果推断会是下一个AI热潮吗? https://www.zhihu.com/question/479067450
pytorch_lightning 全程笔记 https://zhuanlan.zhihu.com/p/319810661
[深度学习框架] PyTorch 常用代码段总结 https://zhuanlan.zhihu.com/p/419063125
科研入门,在导师完全散养不管的状态下,怎么提升自己的科研能力? https://www.zhihu.com/question/385466539
刚开始接触科研的人常见的错误有哪些? https://www.zhihu.com/question/60075095
科研有很水的idea应该发表出来吗? https://www.zhihu.com/question/372648294
20行代码入门PyTorch自定义CUDA/C++ https://zhuanlan.zhihu.com/p/579395211
如何应对TOP期刊审稿人的各种刁钻问题? https://zhuanlan.zhihu.com/p/158772450
Pytorch实验代码的亿些小细节 https://zhuanlan.zhihu.com/p/409662511
AI发展感觉对绘圈冲击太大了怎么办? https://www.zhihu.com/question/557600073
人一旦开窍后,会产生哪些改变? https://www.zhihu.com/question/507160188
什么叫降维打击? https://www.zhihu.com/question/358755951
深度学习领域有哪些瓶颈? https://www.zhihu.com/question/40577663
神经网络中,设计loss function有哪些技巧? https://www.zhihu.com/question/268105631
Neural ODE,这个世界终究是连续的 https://zhuanlan.zhihu.com/p/554790455
chatGPT拯救了我的期末考 https://zhuanlan.zhihu.com/p/592706418
关于AI大模型的一点思考和讨论 https://zhuanlan.zhihu.com/p/580745171
你的导师对你说过什么让你至今难以忘怀的话? https://www.zhihu.com/question/359740428
《Instructions for PhD Students》:Dimitris给PhD学生的忠告 https://zhuanlan.zhihu.com/p/400248999
掌握什么思想会让你的数学水平有质的飞跃? https://www.zhihu.com/question/569024071
为什么有些学数学的看不惯甚至鄙视 Deep Learning? https://www.zhihu.com/question/58992444
国内有类似 ChatGPT 能力的模型吗? https://www.zhihu.com/question/570713548
入门深度学习,怎样快速提升深度学习方向的coding能力(看、写)? https://www.zhihu.com/question/479601426
为什么要压缩模型,而不是直接训练一个小的CNN? https://www.zhihu.com/question/303922732
研一,在学机器学习和深度学习,为什么感觉越学越不会,怎么解决这个问题? https://www.zhihu.com/question/371622741
三年计算机视觉算法工程师经验吐血总结 https://zhuanlan.zhihu.com/p/560604957
常用预训练语言模型(PTMs)总结 https://zhuanlan.zhihu.com/p/406512290
Multimodality in Medical Domain:一文速览医学多模态进展 https://zhuanlan.zhihu.com/p/589018863
真正的科研应该是什么样的? https://www.zhihu.com/question/264668384
你认为下一个 AI 风口在何时? https://www.zhihu.com/question/557939817
AI深度学习编译器工程师需要哪些技术栈? https://www.zhihu.com/question/532768471
联邦学习是一个伪需求吗? https://www.zhihu.com/question/497705225
了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构? https://www.zhihu.com/question/315611053
另辟蹊径—Denoising Diffusion Probabilistic 一种从噪音中剥离出图像/音频的模型 https://zhuanlan.zhihu.com/p/366004028
ChatGPT/InstructGPT详解 https://zhuanlan.zhihu.com/p/590311003
为什么人一旦开窍了就变的特别厉害? https://www.zhihu.com/question/481302924
哪些 Python 库让你相见恨晚? https://www.zhihu.com/question/24590883
https://www.zhihu.com/question/274926848
美国计算机名校例如MIT ,CMU ,有哪些公认的好课并且有课程讲义的,适合国内学生自学的? https://www.zhihu.com/question/57532048
训练好的深度学习模型是怎么部署的? https://www.zhihu.com/question/329372124
Response to Reviewers 回审稿信 https://zhuanlan.zhihu.com/p/269666469
语义分割综述:截止2022,语义分割总结与展望 https://zhuanlan.zhihu.com/p/538050231
你见过高校引进博士的哪些坑? https://www.zhihu.com/question/538969178
为什么我会感觉中国大学教材很烂? https://www.zhihu.com/question/28987052
简单的label smoothing为什么能够涨点呢 https://zhuanlan.zhihu.com/p/343807710
目前主流的attention方法都有哪些? https://www.zhihu.com/question/68482809
为什么我用lstm,svm,ann来预测股价,效果都非常好? https://www.zhihu.com/question/524724513
在明白什么道理后,你不再焦虑了? https://www.zhihu.com/question/511311505
算法岗位真的需要顶会才能入场吗? https://www.zhihu.com/question/456114288
为什么计算机学术界认可顶级会议论文,而其他领域几乎都是只认可顶级期刊? https://www.zhihu.com/question/54142181
如何培养在计算机系统领域的研究品味(Research Taste)? https://www.zhihu.com/question/317077307
如果你是一个C++面试官,你会问哪些问题? https://www.zhihu.com/question/451327108
正在做的idea被大佬撞车是一种怎样的体验? https://www.zhihu.com/question/385229505
科研论文如何想到不错的 idea? https://www.zhihu.com/question/300967426
一文了解prompt learning在计算机视觉领域进展 https://zhuanlan.zhihu.com/p/581609468
机器学习科研的十年 https://zhuanlan.zhihu.com/p/74249758
Pytorch有什么节省显存的小技巧? https://www.zhihu.com/question/274635237
国内那么多 AI 专业,为什么国内没有 ChatGPT? https://www.zhihu.com/question/571387160
深度学习和随机过程结合有什么有前景的研究方向? https://www.zhihu.com/question/459256426
Prompt Learning 超强入门教程 https://zhuanlan.zhihu.com/p/442486331
视觉神经网络模型优秀开源工作:timm 库使用方法和代码解读 https://zhuanlan.zhihu.com/p/404107277
TensorRT详细入门指北,如果你还不了解TensorRT,过来看看吧! https://zhuanlan.zhihu.com/p/371239130
科研时,想到一个idea,其实现的结果一定要比前人的评估指标高才能发表吗? https://www.zhihu.com/question/341554948
深度学习论文中那么高的准确率都是大力出奇迹吗? https://www.zhihu.com/question/384208793
神经网络为什么可以(理论上)拟合任何函数? https://www.zhihu.com/question/268384579
双非人工智能研一,听说算法岗很卷,今后应该怎么学习? https://www.zhihu.com/question/486853850
计算机专业想好好搞科研读博士,建议平时刷 leetcode 吗,会不会浪费时间? https://www.zhihu.com/question/501818272
长远看算法岗真的比开发岗香吗? https://www.zhihu.com/question/409815271
怎么样才叫科研能力强? https://www.zhihu.com/question/431699092
如何从底层杀出? https://www.zhihu.com/question/487990120
投期刊返修写Response的时候,应该写详细一些还是简要点? https://www.zhihu.com/question/512498367
如何写好一篇高质量的IEEE/ACM Transaction级别的计算机科学论文? https://www.zhihu.com/question/22790506
近两年有哪些ViT(Vision Transformer)的改进算法? https://www.zhihu.com/question/538049269
Multi-headed Self-attention(多头自注意力)机制介绍 https://zhuanlan.zhihu.com/p/365386753
对比学习损失(InfoNCE loss)与交叉熵损失的联系,以及温度系数的作用 https://zhuanlan.zhihu.com/p/506544456
你在做研究的时候走过哪些弯路,收获和经验是什么? https://www.zhihu.com/question/26428572
通俗理解生成对抗网络GAN https://zhuanlan.zhihu.com/p/33752313
ChatGPT 有哪些神奇的使用方式? https://www.zhihu.com/question/570729170
为何似乎很多博士生对教职的执念这么强?教职真有那么香? https://www.zhihu.com/question/463848873
一文网尽CV/Robotics顶会论文常用高级词汇/句式! https://zhuanlan.zhihu.com/p/415926905
如何直观地理解「协方差矩阵」? https://zhuanlan.zhihu.com/p/37609917
神经网络高斯过程(Neural Network Gaussian Process) https://zhuanlan.zhihu.com/p/578745307
顶会论文写作建议(上):宏观布局,避免“hard to follow” https://zhuanlan.zhihu.com/p/593195527
Domain Adaptation学术上有哪些方向,还有哪些可做的地方? https://www.zhihu.com/question/337731079
GAN 和 VAE 的本质区别是什么?为什么两者总是同时被提起? https://www.zhihu.com/question/317623081
有哪些轻量级适合阅读的优秀 C++ 开源项目? https://www.zhihu.com/question/40131963
作为一个研究生,有哪些你直呼好用的科研神器? https://www.zhihu.com/question/484596211
每年AI顶会几千篇,有多少真正有创新,感觉各种算法改进都是在自己的设置下才有效,公平比较基本就拉倒了? https://www.zhihu.com/question/541994477
为什么回归问题用MSE? https://zhuanlan.zhihu.com/p/463812174
通俗形象地分析比较生成模型(GAN/VAE/Flow/Diffusion/AR) https://zhuanlan.zhihu.com/p/591881660
自己拥有一台服务器可以做哪些很酷的事情? https://www.zhihu.com/question/40854395
在领悟到什么道理后,你的人生从此轻松了起来? https://www.zhihu.com/question/467881890
pytorch dataloader数据加载占用了大部分时间,各位大佬都是怎么解决的? https://www.zhihu.com/question/307282137
读硕/博期间你积累了哪些重要的科研经验? https://www.zhihu.com/question/34686026
计算机视觉方向,现有方法已经能在课题上有很好的效果,没有提升的空间怎么办? https://www.zhihu.com/question/501510462
研究生哪些行为可以在导师那超加分? https://www.zhihu.com/question/443960725
https://zhuanlan.zhihu.com/p/398408338
超详细图解Self-Attention https://zhuanlan.zhihu.com/p/410776234
贝叶斯深度学习是什么,和传统神经网络有何不同? https://www.zhihu.com/question/352295592
强化学习领域目前遇到的瓶颈是什么? https://www.zhihu.com/question/449478247
一篇文章搞定GBDT、Xgboost和LightGBM的面试 https://zhuanlan.zhihu.com/p/148050748
pytorch 提速指南 https://zhuanlan.zhihu.com/p/119364172
CUDA 的包比自己写的 Kernel 快 10~20 倍,有什么内在机制呢? https://www.zhihu.com/question/356661099
如何系统学习机器学习? https://www.zhihu.com/question/266291909
那些漂亮的sci论文图一般用什么软件制作的? https://www.zhihu.com/question/27474094
我们穷极一生,究竟追寻的是什么? https://www.zhihu.com/question/384441334
用随机梯度下降来优化人生 https://zhuanlan.zhihu.com/p/414009313
为什么中国诞生不了 Hugging Face 这样的公司? https://www.zhihu.com/question/487319180
为什么AI算法工程师要求C++? https://www.zhihu.com/question/373811828
有哪些令你印象深刻的魔改transformer? https://www.zhihu.com/question/349958732
Huggingface 超详细介绍 https://zhuanlan.zhihu.com/p/535100411
https://zhuanlan.zhihu.com/p/269702192
This post is all you need(上卷)——层层剥开Transformer https://zhuanlan.zhihu.com/p/420820453
科研工作者的你,每天有多努力? https://www.zhihu.com/question/432181844
算法工程师的「天地之间」 https://zhuanlan.zhihu.com/p/495479206
现在投身于计算机视觉是否明智? https://www.zhihu.com/question/317440183
Pytorch Lightning 和 HuggingFace 的 Trainer 哪个好用? https://www.zhihu.com/question/521501258
什么是人生的最顶级享受? https://www.zhihu.com/question/538449801
深度学习中 Batch Normalization为什么效果好? https://www.zhihu.com/question/38102762
科研搞不出来的时候,大家一般都会干什么? https://www.zhihu.com/question/62269624
有哪些道理你后悔没有早点知道? https://www.zhihu.com/question/23819007
机器学习、深度学习领域有哪些被广泛提及但你不认同的结论或观点? https://www.zhihu.com/question/292134377
创世游戏:Diffusion Model 的非数学解释 https://zhuanlan.zhihu.com/p/580010670
动手实现 MAE(Masked Autoencoders Are Scalable Vision Learners) https://zhuanlan.zhihu.com/p/439554945
如果让你重新开始学计算机,你的学习路线会怎么选择? https://www.zhihu.com/question/492545174
为什么神经网络走向了“深度”,而不是“广度”的方向,深度网络相比于广度网络的优势在哪里? https://www.zhihu.com/question/528184564
强化学习怎么入门好? https://www.zhihu.com/question/277325426
浅谈学术论文rebuttal https://zhuanlan.zhihu.com/p/104298923
Pytorch Lightning 完全攻略 https://zhuanlan.zhihu.com/p/353985363
何时能懂你的心——图卷积神经网络(GCN) https://zhuanlan.zhihu.com/p/71200936
你的编程能力从什么时候开始突飞猛进? https://www.zhihu.com/question/356351510
多任务学习中各loss权重应该如何设计呢? https://www.zhihu.com/question/359962155
面试官如何判断面试者的机器学习水平? https://www.zhihu.com/question/62482926
多模态融合fusion的各种操作 https://zhuanlan.zhihu.com/p/152234745
多模态学习综述及最新方向 https://zhuanlan.zhihu.com/p/389287751
为什么东亚学生上课时通常不甚活跃,不爱发言? https://www.zhihu.com/question/19769575
从可解释性看人工智能——一个缺少大问题的时代 https://zhuanlan.zhihu.com/p/533974367
GPU内存(显存)的理解与基本使用 https://zhuanlan.zhihu.com/p/462191421
如何拥有旺盛精力? https://www.zhihu.com/question/21671881
如果每天在 LeetCode 上刷一道题,一年之后会有什么变化? https://www.zhihu.com/question/317046234
作为审稿人,你什么情况下会选择拒稿? https://www.zhihu.com/question/529489400
transformer 为什么使用 layer normalization,而不是其他的归一化方法? https://www.zhihu.com/question/395811291
深度学习的基础理论研究为什么难 https://zhuanlan.zhihu.com/p/576869905
图神经网络(Graph Neural Networks,GNN)综述 https://zhuanlan.zhihu.com/p/75307407
人工智能是不是走错了方向? https://www.zhihu.com/question/445383290
对神经网络某一层做了小改进,效果却提升显著,可以发论文吗? https://www.zhihu.com/question/426235983
扩散模型与能量模型,Score-Matching和SDE,ODE的关系 https://zhuanlan.zhihu.com/p/576779879
科研作图的一些个人想法 https://zhuanlan.zhihu.com/p/603088040
不同领域的圣经级书籍有哪些? https://www.zhihu.com/question/28438145
怎样克服神经网络训练中argmax的不可导性? https://www.zhihu.com/question/422373907
深度学习的学习历程 https://zhuanlan.zhihu.com/p/34524772
纯量产经验:谈谈目标检测中正负样本的问题 https://zhuanlan.zhihu.com/p/563196861
科研上最忌讳的事情有哪些? https://www.zhihu.com/question/464787797
现在的计算机专业(比如机器学习)已经沦为调包专业了吗? https://www.zhihu.com/question/327494084
人工智能领域有哪些精妙的数学原理? https://www.zhihu.com/question/508649281
顶会rebuttal技术浅谈:站着,还把论文中了 https://zhuanlan.zhihu.com/p/602024489
刚进算法团队,大牛们讨论高深的 cv 术语和算法,如何才能听懂? https://www.zhihu.com/question/469612040
如何解决「小样本」+「多分类」问题? https://www.zhihu.com/question/389155523
ChatGPT发展历程、原理、技术架构详解和产业未来 https://zhuanlan.zhihu.com/p/590655677
Transformer结构及其应用详解--GPT、BERT、MT-DNN、GPT-2 https://zhuanlan.zhihu.com/p/69290203
思维链(Chain-of-thoughts)作为提示 https://zhuanlan.zhihu.com/p/493533589
哪一刻让你觉得世人皆苦? https://www.zhihu.com/question/281271203
如何激怒一位人工智能(机器学习、深度学习、强化学习等)爱好者? https://www.zhihu.com/question/339602806
一个算法工程师的日常是怎样的? https://www.zhihu.com/question/29692814
特征工程到底是什么? https://www.zhihu.com/question/29316149
贝叶斯学派与频率学派有何不同? https://www.zhihu.com/question/20587681
学习深度学习是否要先学习机器学习? https://www.zhihu.com/question/382278216
解读 ChatGPT 背后的技术重点:RLHF、IFT、CoT、红蓝对抗 https://zhuanlan.zhihu.com/p/602458131
超细节的对比学习和SimCSE知识点 https://zhuanlan.zhihu.com/p/378340148
一个人该怎样找到自己真正热爱和擅长的事,并以此规划自己的人生? https://www.zhihu.com/question/399452902
https://www.zhihu.com/question/320688440
如何通俗易懂地解释卷积? https://www.zhihu.com/question/22298352
学术界科研(research)与工业界研发(R&D)有什么区别? https://www.zhihu.com/question/366503145
PyTorch分布式训练简明教程(2022更新版) https://zhuanlan.zhihu.com/p/113694038
一文掌握多模态领域的可控文本生成 https://zhuanlan.zhihu.com/p/586914091
有哪些你看了以后大呼过瘾的编程书? https://www.zhihu.com/question/50408698
如何开始在 github 上学习东西? https://www.zhihu.com/question/30119197
在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进? https://www.zhihu.com/question/436874654
机器学习如何才能避免「只是调参数」? https://www.zhihu.com/question/264528062
ChatGPT 有多高的技术壁垒?国内外除了 OpenAI 还有谁可以做到类似程度? https://www.zhihu.com/question/581806122
ChatGPT 这个风口,普通人怎么抓住? https://www.zhihu.com/question/582326598
通俗易懂的YOLO系列(从v1到v5)模型解读 https://zhuanlan.zhihu.com/p/183261974 https://zhuanlan.zhihu.com/p/183781646 https://zhuanlan.zhihu.com/p/186014243
Multi-task Learning and Beyond: 过去,现在与未来 https://zhuanlan.zhihu.com/p/138597214
Nature亲自示范:如何提升论文「讲故事」的能力? https://zhuanlan.zhihu.com/p/593041037
有哪本书,你恨不得把它全部内容都背诵下来? https://www.zhihu.com/question/485142113
你遇到过的科研大牛们都有什么样的优秀的习惯或品质? https://www.zhihu.com/question/329940758
Python如何快速定位最慢的代码? https://www.zhihu.com/question/485980118
神经网络的万能逼近定理已经发展到什么地步了? https://www.zhihu.com/question/347654789
为什么说深度学习没有理论基础? https://www.zhihu.com/question/450835283
抱抱脸:ChatGPT背后的算法——RLHF https://zhuanlan.zhihu.com/p/592671478
PyTorch 学习笔记汇总 https://zhuanlan.zhihu.com/p/265394674
面对“大模型+大规模预训练+重视SOTA的审稿人”,AI科研除了轻量化还有什么出路? https://www.zhihu.com/question/535292924
如何看待计算机视觉未来的走向? https://www.zhihu.com/question/436846337
机器学习“判定模型”和“生成模型”有什么区别? https://www.zhihu.com/question/20446337
从零实现ChatGPT——RLHF技术笔记 https://zhuanlan.zhihu.com/p/591474085
关于利用 information bottleneck 来解释深度学习 https://zhuanlan.zhihu.com/p/29723280
分分钟带你杀入Kaggle Top 1% https://zhuanlan.zhihu.com/p/27424282
为什么国内 IT 公司 leader 以上就不怎么写代码,而据说 Google 的 Jeff Dean 还写代码?到底哪种情况好呢? https://www.zhihu.com/question/23321862
大白话谈因果系列文章(一):因果推断简介及论文介绍 https://zhuanlan.zhihu.com/p/397796913
有什么事是你过了很多年突然明白的? https://www.zhihu.com/question/285382931
同组博士师兄的结果复现不出来,我应该怎么办? https://www.zhihu.com/question/502804990
世界上有哪些代码量很少,但很牛逼很经典的算法或项目案例? https://www.zhihu.com/question/358255792
有哪些「魔改」loss函数,曾经拯救了你的深度学习模型? https://www.zhihu.com/question/294635686
以 ChatGPT 为代表的「大模型」会是多大的技术革命?如果要发生技术革命需要具备哪些条件? https://www.zhihu.com/question/581311491
如何高效地学习pytorch? https://www.zhihu.com/question/310782630
论文要怎么读?研究院院长孙剑的最新体会都在这里了 https://zhuanlan.zhihu.com/p/439024970
transformer问题整理 https://zhuanlan.zhihu.com/p/266695736
为什么chatgpt的上下文连续对话能力得到了大幅度提升? https://www.zhihu.com/question/575481512
PyTorch 有哪些坑/bug? https://www.zhihu.com/question/67209417
ChatGPT 这个项目会开源吗? https://www.zhihu.com/question/571390218
机器学习中有哪些形式简单却很巧妙的idea? https://www.zhihu.com/question/347847220
你实践中学到的最重要的机器学习经验是什么? https://www.zhihu.com/question/46301335
浅谈弱监督学习(Weakly Supervised Learning) https://zhuanlan.zhihu.com/p/81404885
Visual grounding系列--领域初探 https://zhuanlan.zhihu.com/p/388504127
工业界和学术界最大区别是什么? https://www.zhihu.com/question/332602866
为什么有些算法工程师从来不谈业务,不谈解决问题,不谈价值挖掘,开口闭口就是算法模型,炼丹调参工程化? https://www.zhihu.com/question/454718449
你遇见过什么当时很有潜力但是最终没有流行的深度学习算法? https://www.zhihu.com/question/490517834
学术论文投稿与返修(Rebuttal)分享 https://zhuanlan.zhihu.com/p/344008879
图像中的无监督学习(Moco、Simclr、BYOL、SimSiam、SwAV、MAE、IPT) https://zhuanlan.zhihu.com/p/537647617
为什么交叉熵(cross-entropy)可以用于计算代价? https://www.zhihu.com/question/65288314
为什么Transformer要用LayerNorm? https://www.zhihu.com/question/487766088
怎么知道一名研究生有没有科研潜力? https://www.zhihu.com/question/367370829
没有顶会的CV/NLP方向的博士生毕业出路在哪里? https://www.zhihu.com/question/415698167
一般来说,三层神经网络可以逼近任何一个非线性函数,为什么还需要深度神经网络? https://www.zhihu.com/question/344962955
存在错误标注的伪标签为什么会帮助训练出更好的模型? https://www.zhihu.com/question/563144316
如何理解attention中的Q,K,V? https://www.zhihu.com/question/298810062
如何直观理解PPO算法?[理论篇] https://zhuanlan.zhihu.com/p/111049450
一文搞懂熵(Entropy),交叉熵(Cross-Entropy) https://zhuanlan.zhihu.com/p/149186719
如何评价近几年顶会的超分,去噪,去模糊等图像复原文章? https://www.zhihu.com/question/324809101
能否使用神经网络来判断奇偶数? https://www.zhihu.com/question/364113452
关于ChatGPT八个技术问题的猜想 https://zhuanlan.zhihu.com/p/606478660
backbone、head、neck等深度学习中的术语解释 https://zhuanlan.zhihu.com/p/348800083
人在什么情况下成长最快? https://www.zhihu.com/question/490344475
有什么高质量的现代 C++ 风格的开源代码? https://www.zhihu.com/question/23153437
信息论与机器学习有着怎样的关系? https://www.zhihu.com/question/37349649
如何做到史上最快的基于CPU的通用强化学习环境并行模拟器? https://zhuanlan.zhihu.com/p/431543858
自监督对比学习(Contrastive Learning)综述+代码 https://zhuanlan.zhihu.com/p/334732028
预训练模型高效Finetune工作总结 https://zhuanlan.zhihu.com/p/485221818
矩阵求导的本质与分子布局、分母布局的本质(矩阵求导——本质篇) https://zhuanlan.zhihu.com/p/263777564
作为博士生,你们有没有遇到过一个科研问题几个月解决不了的情况? https://www.zhihu.com/question/399266921
为什么都说神经网络是个黑箱? https://www.zhihu.com/question/263672028
怎么形象理解embedding这个概念? https://www.zhihu.com/question/38002635
博士生在没有导师指导的情况下,该如何自己选题发 CVPR ? https://www.zhihu.com/question/64566768
你们都从导师身上学会了什么? https://www.zhihu.com/question/583133150
如果百年后深度学习最终有了公认的数学理论作为基础,能解释实验中的各类玄学,那这个理论会长什么样子? https://www.zhihu.com/question/507836671
深度学习的可解释性方向的研究是不是巨坑? https://www.zhihu.com/question/341190239
深度学习科研,如何高效进行代码和实验管理? https://www.zhihu.com/question/269707221
为什么样本方差(sample variance)的分母是 n-1? https://www.zhihu.com/question/20099757
深度学习中Attention与全连接层的区别何在? https://www.zhihu.com/question/320174043
如果互联网逐渐充斥 AI 生成的有瑕疵的内容,将来基于这些信息训练的 AI 会不会更加离谱? https://www.zhihu.com/question/583368022
Instruction Tuning|谷歌Quoc V.Le团队提出又一精调范式 https://zhuanlan.zhihu.com/p/408166011
谈CV领域审稿 https://zhuanlan.zhihu.com/p/429188796
一文梳理多任务学习(MMoE/PLE/DUPN/ESSM等) https://zhuanlan.zhihu.com/p/363059498
一文搞懂激活函数(Sigmoid/ReLU/LeakyReLU/PReLU/ELU) https://zhuanlan.zhihu.com/p/172254089
常见的损失函数(loss function)总结 https://zhuanlan.zhihu.com/p/58883095
一文带你浏览Graph Transformers https://zhuanlan.zhihu.com/p/536489997
学术界有什么潜规则吗? https://www.zhihu.com/question/271530655
你人生中太晚明白的道理是什么? https://www.zhihu.com/question/470076571
为什么Transformer 需要进行 Multi-head Attention? https://www.zhihu.com/question/341222779
AI论文中的novelty如何评价? https://www.zhihu.com/question/503131049
AI系统全栈技术思考与展望 https://zhuanlan.zhihu.com/p/462810001
异常检测(anomaly/ outlier detection)领域还有那些值得研究的问题? https://www.zhihu.com/question/324999831
复现ChatGPT的难点与平替 https://zhuanlan.zhihu.com/p/607847588
写给未来或正在读PhD的同学们 https://zhuanlan.zhihu.com/p/607501744
一文入门元学习(Meta-Learning)) https://zhuanlan.zhihu.com/p/136975128
一图胜千言,超形象图解NumPy教程 https://zhuanlan.zhihu.com/p/504917890
懂深度学习算法,目前想往模型部署优化这个方向发展,请问学习路线是什么? https://www.zhihu.com/question/411393222
傅里叶变换、拉普拉斯变换、Z 变换的联系是什么?为什么要进行这些变换? https://www.zhihu.com/question/22085329
为什么在实际的kaggle比赛中,GBDT和Random Forest效果非常好? https://www.zhihu.com/question/51818176
3W字长文带你轻松入门视觉transformer https://zhuanlan.zhihu.com/p/308301901
工作量大的人怎么做才能每天都精力充沛? https://www.zhihu.com/question/20383485
在科研路上,大家有什么经验教训? https://www.zhihu.com/question/65354878
为什么Transformer适合做多模态任务? https://www.zhihu.com/question/441073210
如何将专家知识编码入神经网络,有哪些好的工作可以可以参考? https://www.zhihu.com/question/529959915
如何通俗并尽可能详细地解释卡尔曼滤波? https://www.zhihu.com/question/23971601
复现和使用GPT-3/ChatGPT,我们应该注意什么? https://zhuanlan.zhihu.com/p/607744955
目前工业界常用的推荐系统模型有哪些? https://www.zhihu.com/question/314773668
有了Transformer框架后是不是RNN完全可以废弃了? https://www.zhihu.com/question/302392659
可以把科研压力转移给导师吗? https://www.zhihu.com/question/557819220
大语言模型中的涌现现象是不是伪科学? https://www.zhihu.com/question/587177332
图神经网络真的有意义吗? https://www.zhihu.com/question/528852359
23.03.04 | 计算机视觉博士生存指南(一) https://zhuanlan.zhihu.com/p/610774199
关于Instruct GPT复现的一些细节与想法 https://zhuanlan.zhihu.com/p/609078527
这个ChatGPT真像某些人那样吹得神乎其神吗? https://www.zhihu.com/question/584515782
OpenAI 发布 GPT-4,有哪些技术上的优化或突破? https://www.zhihu.com/question/589639535
OpenAI 发布多模态 GPT-4 模型,会开创哪些新的研究方向? https://www.zhihu.com/question/589640227
模型部署入门教程(一):模型部署简介 https://zhuanlan.zhihu.com/p/477743341
目标检测正负样本区分策略和平衡策略总结(一) https://zhuanlan.zhihu.com/p/138824387
Kaggle冠军方案--使用Autoencoder MLP+XGBoost做金融市场预测 https://zhuanlan.zhihu.com/p/552237170
Adversarial Weight Perturbation,一文了解kaggle金牌方案都在用的AWP https://zhuanlan.zhihu.com/p/563641649
因果推断(causal inference)是回归(regression)问题的一种特例吗? https://www.zhihu.com/question/266812683
矩阵的本质是什么? https://www.zhihu.com/question/22047061
谷歌发布史上最大「通才」AI 模型,可让机器人更自主,具有哪些意义?应用前景如何? https://www.zhihu.com/question/588318882
用 ChatGPT 开放的 API 接口可以做哪些自研工具? https://www.zhihu.com/question/587168092
深度学习方面的科研工作中的实验代码有什么规范和写作技巧?如何妥善管理实验数据? https://www.zhihu.com/question/268193800
如何评价 OpenAI 的超级对话模型 ChatGPT ? https://www.zhihu.com/question/570189639
如何自然地演讲 PPT,而不是念 PPT? https://www.zhihu.com/question/432657311
为什么现在的LLM都是Decoder only的架构? https://www.zhihu.com/question/588325646
2023年后,AI 还有什么研究方向有前景? https://www.zhihu.com/question/591140366
ChatGPT 为什么不用 Reward-Model 的数据直接 fine-tune,而用 RL? https://www.zhihu.com/question/596230048
如何为GPT/LLM模型添加额外知识? https://www.zhihu.com/question/591935281
MLC-LLM: 在任何设备上编译运行大语言模型 https://zhuanlan.zhihu.com/p/625959003
「走出新手村」十次 CV 论文会议投稿的经验总结 https://zhuanlan.zhihu.com/p/627032371
如何克服科研中不想写论文的心理? https://www.zhihu.com/question/442152051
搞科研的你一般在什么情况/条件下最容易产生灵感? https://www.zhihu.com/question/457212453
世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能 https://zhuanlan.zhihu.com/p/632795115
为什么说大模型训练很难? https://www.zhihu.com/question/498271491
如何才能快乐地做科研? https://www.zhihu.com/question/452940941