mosaicml · dakinggg · Feb 9, 2023 · Feb 6, 2023 · Feb 7, 2023 · Feb 9, 2023
@@ -301,9 +301,9 @@ def eval_forward(self, batch, outputs: Optional[Any] = None):
             if self.config.use_return_dict:
                 output = output['logits']
             else:
-                # logits are at index 0 in the output tuple
-                # because we have popped labels, so no loss is present in the tuple
-                output = output[0]
+                # if loss was computed (cached outputs from forward), loss is at index 0 and logits are at index 1
+                # if loss was not computed (no cached outputs during eval), loss is not present and logits are at index 0
+                output = output[1] if len(output[0].shape) == 0 else output[0]
 
             # if we are in the single class case, then remove the classes dimension
             if output.shape[1] == 1:

diff --git a/tests/models/test_hf_model.py b/tests/models/test_hf_model.py
@@ -225,7 +225,7 @@ def test_hf_state_dict_info(tmp_path: Path, pass_in_tokenizer: bool, modify_toke
         assert hf_tokenizer_state == {}
 
 
-def get_lm_trainer(hf_model, hf_tokenizer, save_folder, load_path: Optional[str] = None):
+def get_lm_trainer(hf_model, hf_tokenizer, save_folder, load_path: Optional[str] = None, do_eval: bool = False):
     transformers = pytest.importorskip('transformers')
     from composer.models import HuggingFaceModel
 
@@ -250,8 +250,16 @@ def get_lm_trainer(hf_model, hf_tokenizer, save_folder, load_path: Optional[str]
                                   collate_fn=collator,
                                   sampler=dist.get_sampler(train_dataset))
 
+    eval_dataloader = None
+    if do_eval:
+        eval_dataloader = DataLoader(train_dataset,
+                                     batch_size=batch_size,
+                                     collate_fn=collator,
+                                     sampler=dist.get_sampler(train_dataset))
+
     trainer = Trainer(model=model,
                       train_dataloader=train_dataloader,
+                      eval_dataloader=eval_dataloader,
                       max_duration='1ep',
                       save_folder=save_folder,
                       save_interval='1ep',
@@ -506,3 +514,13 @@ def test_hf_causal_shift_labels(tiny_gpt2_model, tiny_gpt2_tokenizer):
     assert isinstance(model.labels, torch.Tensor)
     assert torch.all(model.labels[..., :3] == batch['input_ids'][..., 1:4])
     assert torch.all(model.labels[..., -1] == -100)
+
+
+def test_hf_return_dict_false(tiny_bert_config, tiny_bert_tokenizer):
+    transformers = pytest.importorskip('transformers')
+
+    tiny_bert_config.return_dict = False
+    tiny_bert_model = transformers.AutoModelForMaskedLM.from_config(tiny_bert_config)
+    trainer = get_lm_trainer(tiny_bert_model, tiny_bert_tokenizer, None, do_eval=True)
+
+    trainer.fit()