使用与子系统有关的辅助任务,结果见 results.xlsx
A:[0,1], B:[3], C:[1,3], D:[1]
A,B,C,D即论文中的A,B,C,D分类器
branches里可以写ABCD的任意组合。
python main.py --branches=[[0,1]] # A
python main.py --branches=[[3]] # B
python main.py --branches=[[1,3]] # C
python main.py --branches=[[1]] # D
python main.py --branches=[[0,1],[3]] # A+B
python main.py --branches=[[0,1],[1,3]] # AC
python main.py --branches=[[0,1],[1]] # AD
python main.py --branches=[[3],[1,3]] # BC
python main.py --branches=[[3],[1]] # BD
python main.py --branches=[[1,3],[1]] # CD
python main.py --branches=[[0,1],[3],[1,3]] # ABC
python main.py --branches=[[0,1],[3],[1]] # ABD
python main.py --branches=[[0,1],[1,3],[1]] # ACD
python main.py --branches=[[3],[1,3],[1]] # BCD
python main.py --branches=[[0,1],[3],[1,3],[1]] # ABCD
python main.py --branches=[[0,1],[3],[1,3],[1]] --fold=1
python main.py --branches=[[0,1],[3],[1,3],[1]] --fold=2
python main.py --branches=[[0,1],[3],[1,3],[1]] --fold=3
python main.py --branches=[[0,1],[3],[1,3],[1]] --fold=4
python main.py --branches=[[0,1],[3],[1,3],[1]] --fold=5
和PAD一样,涉及多任务的部分,test loss仅计算了主任务的loss以不影响测试时forward ###以下忽略
基于时序信息处理的最佳模型:GRU+drop low attentionhere
由于GPU原因,去另一台的3090上跑。结果不好,因此不使用最佳时序处理。
还是另一台的3090