Image Captioning and Attention Visualization

Image captioning with pretrained DeiT v3 as encoder on a subset of MSCOCO dataset

Attention map visualization for image captioning:

See problem 2 & 3 in Report.pdf and Spec.pdf more details.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
plot		plot
.gitignore		.gitignore
ICDataset.py		ICDataset.py
P2_evaluate.py		P2_evaluate.py
P2_inference.py		P2_inference.py
P2_model.py		P2_model.py
P2_training.py		P2_training.py
P3.py		P3.py
P3_get_1st and last1.py		P3_get_1st and last1.py
README.md		README.md
Report.pdf		Report.pdf
Spec.pdf		Spec.pdf
get_dataset.sh		get_dataset.sh
requirements.txt		requirements.txt
warmup_scheduler.py		warmup_scheduler.py

Provide feedback