forked from facebookresearch/end-to-end-negotiator
-
Notifications
You must be signed in to change notification settings - Fork 3
/
Copy pathgodzilla_cmds.txt
15 lines (6 loc) · 2.02 KB
/
godzilla_cmds.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
CUDA_LAUNCH_BLOCKING=1 CUDA_VISIBLE_DEVICES=6 python train.py --cuda --bsz 16 --clip 2.0 --decay_every 1 --decay_rate 5.0 --domain object_division --dropout 0.1 --init_range 0.2 --lr 0.001 --max_epoch 7 --min_lr 1e-05 --model_type selection_model --momentum 0.1 --nembed_ctx 128 --nembed_word 128 --nhid_attn 128 --nhid_ctx 64 --nhid_lang 128 --nhid_sel 128 --nhid_strat 256 --unk_threshold 20 --skip_values --sep_sel --model_file selection_model.th
CUDA_LAUNCH_BLOCKING=1 CUDA_VISIBLE_DEVICES=6 python train.py --cuda --bsz 16 --clip 0.5 --decay_every 1 --decay_rate 5.0 --domain object_division --dropout 0.1 --model_type rnn_model --init_range 0.2 --lr 0.001 --max_epoch 30 --min_lr 1e-07 --momentum 0.1 --nembed_ctx 64 --nembed_word 256 --nhid_attn 64 --nhid_ctx 64 --nhid_lang 128 --nhid_sel 128 --sel_weight 0.6 --unk_threshold 20 --sep_sel --model_file rnn_model.th
CUDA_LAUNCH_BLOCKING=1 CUDA_VISIBLE_DEVICES=6 python train.py --cuda --bsz 2 --max_epoch 2 --model_type selection_model --skip_values --sep_sel --model_file selection_model.th
CUDA_LAUNCH_BLOCKING=1 CUDA_VISIBLE_DEVICES=6 python selfplay.py --cuda --alice_model_file rnn_model.th --bob_model_file rnn_model.th --context_file data/negotiate/selfplay.txt --verbose --temperature 0.5 --selection_model_file selection_model.th
CUDA_LAUNCH_BLOCKING=1 CUDA_VISIBLE_DEVICES=0 python reinforce.py --cuda --alice_model_file rnn_model.th --bob_model_file rnn_model.th --output_model_file rnn_rl_model.th --context_file data/negotiate/selfplay.txt --temperature 0.5 --log_file rnn_rl.log --sv_train_freq 4 --nepoch 4 --selection_model_file selection_model.th --rl_lr 0.00001 --rl_clip 0.0001 --sep_sel --verbose
CUDA_LAUNCH_BLOCKING=1 CUDA_VISIBLE_DEVICES=0 python reinforce.py --cuda --alice_model_file rnn_model.th --bob_model_file rnn_model.th --output_model_file rnn_rl_model.th --context_file data/negotiate/selfplay_dummy.txt --temperature 0.5 --log_file rnn_rl.log --sv_train_freq 4 --nepoch 1 --selection_model_file selection_model.th --rl_lr 0.00001 --rl_clip 0.0001 --sep_sel --verbose