From f0b6a9e7d77747ad1d73c02c35f04b41a6c23be4 Mon Sep 17 00:00:00 2001
From: Xiang Li <44761952+lx709@users.noreply.github.com>
Date: Mon, 23 Oct 2023 21:11:35 +0300
Subject: [PATCH 1/2] Update README_MINIGPTv2_FINETUNE.md

---
 dataset/README_MINIGPTv2_FINETUNE.md | 29 ++++++++++++++++++++++++----
 1 file changed, 25 insertions(+), 4 deletions(-)

diff --git a/dataset/README_MINIGPTv2_FINETUNE.md b/dataset/README_MINIGPTv2_FINETUNE.md
index 2d5c825..2bae2d7 100644
--- a/dataset/README_MINIGPTv2_FINETUNE.md
+++ b/dataset/README_MINIGPTv2_FINETUNE.md
@@ -1,23 +1,44 @@
 ## Download the COCO captions, RefCOCO, RefCOCO+. RefCOCOg, visual genome, textcaps, LLaVA, gqa, AOK-VQA, OK-VQA, OCR-VQA, filtered Flickr-30k, multi-task conversation, and Unnatural instruction datasets
 
-### COCO captions
+After downloading all of them, organize the data as follows in `./playground/data`,
 
+```
+├── coco
+│   └── train2017
+├── gqa
+│   └── images
+├── ocr_vqa
+│   └── images
+├── textvqa
+│   └── train_images
+└── vg
+    ├── VG_100K
+    └── VG_100K_2
+
+
+### COCO captions
+- [train2017](http://images.cocodataset.org/zips/train2017.zip)
 
 ### RefCOCO, RefCOCO+, RefCOCOg
 
 ### Visual genome
-
-### textcaps
+- [part1](https://cs.stanford.edu/people/rak248/VG_100K_2/images.zip), [part2](https://cs.stanford.edu/people/rak248/VG_100K_2/images2.zip)
+### TextCaps
 
 ### LLaVA
 
-### gqa
+### TextVQA
+- [train_val_images](https://dl.fbaipublicfiles.com/textvqa/images/train_val_images.zip)
+### GQA
+- [images](https://downloads.cs.stanford.edu/nlp/data/gqa/images.zip)
+- [Annotations](https://storage.googleapis.com/sfr-vision-language-research/LAVIS/datasets/gqa/testdev_balanced_questions.json)
 
 ### OKVQA
 
 ### AOK-VQA
 
 ### OCR-VQA
+- [download script](https://drive.google.com/drive/folders/1_GYPY5UkUy7HIcR0zq3ZCFgeZN7BAfm_?usp=sharing), **we save all files as `.jpg`**
 
 ### filtered Flickr-30k
 

From 68df270f14dfd30213f95349c458bd1eced6c602 Mon Sep 17 00:00:00 2001
From: Xiang Li <44761952+lx709@users.noreply.github.com>
Date: Mon, 23 Oct 2023 21:15:14 +0300
Subject: [PATCH 2/2] Update README_MINIGPTv2_FINETUNE.md

---
 dataset/README_MINIGPTv2_FINETUNE.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/dataset/README_MINIGPTv2_FINETUNE.md b/dataset/README_MINIGPTv2_FINETUNE.md
index 2bae2d7..438240f 100644
--- a/dataset/README_MINIGPTv2_FINETUNE.md
+++ b/dataset/README_MINIGPTv2_FINETUNE.md
@@ -14,7 +14,7 @@ After downloading all of them, organize the data as follows in `./playground/dat
 └── vg
     ├── VG_100K
     └── VG_100K_2
-
+```
 
 ### COCO captions
 - [train2017](http://images.cocodataset.org/zips/train2017.zip)