02.大语言模型基础 Transformer模型 1.attention 2.layer_normalization 3.位置编码 4.tokenize分词 4.token及模型参数 5.激活函数 大语言模型结构