path error

anirudhakulkarni · Feb 13, 2023 · 6ae9429 · 6ae9429
1 parent 4c5a0d4
commit 6ae9429
Show file tree

Hide file tree

Showing 7 changed files with 147 additions and 5 deletions.
diff --git a/AUCM_exp/SupContrast/dataset/datasets.py b/AUCM_exp/SupContrast/dataset/datasets.py
@@ -0,0 +1,142 @@
+from PIL import Image
+from torch.utils.data import Dataset
+from libauc.utils import ImbalancedDataGenerator #BUG:  this is using import from conda install
+import numpy as np
+import tensorboard_logger as tb_logger
+import torch
+import torch.backends.cudnn as cudnn
+from torchvision import transforms, datasets
+from libauc.datasets import CAT_VS_DOG, CIFAR10, CIFAR100, STL10, Melanoma
+from util import TwoCropTransform
+
+def make_deterministic(SEED=123):
+    torch.manual_seed(SEED)
+    np.random.seed(SEED)
+    torch.backends.cudnn.deterministic = True
+    torch.backends.cudnn.benchmark = False
+
+SEED=123
+torch.manual_seed(SEED)
+np.random.seed(SEED)
+torch.backends.cudnn.deterministic = True
+torch.backends.cudnn.benchmark = False
+
+
+
+
+class ImageDataset(Dataset):
+    def __init__(self, images, targets,transform_train, transform_val, image_size=32, crop_size=30, mode='train'):
+        self.images = images.astype(np.uint8)
+        self.targets = targets
+        self.mode = mode
+        self.transform_train = transform_train
+        self.transform_val = transform_val
+
+    def __len__(self):
+        return len(self.images)
+
+    def __getitem__(self, idx):
+        image = self.images[idx]
+        target = self.targets[idx]
+        image = Image.fromarray(image.astype('uint8'))
+        if self.mode == 'train':
+            image = self.transform_train(image)
+        elif self.mode == 'val':
+            image = self.transform_val(image)
+        return image, target
+
+
+
+def set_loader(opt):
+    # construct data loader
+    if opt.dataset == 'cifar10':
+        mean = (0.4914, 0.4822, 0.4465)
+        std = (0.2023, 0.1994, 0.2010)
+    elif opt.dataset == 'cifar100':
+        mean = (0.5071, 0.4867, 0.4408)
+        std = (0.2675, 0.2565, 0.2761)
+    elif opt.dataset == 'c2':
+        mean = (0.33554432, 0.33554432, 0.33554432)
+        std = (0.28430098, 0.2612929,  0.24912025)
+    elif opt.dataset == 'stl10':
+        mean = (0.4467, 0.4398, 0.4066)
+        std = (0.2603, 0.2564, 0.2762)
+    elif opt.dataset == 'melanoma':
+        mean = (0.485, 0.456, 0.406)
+        std = (0.229, 0.224, 0.225)
+    else:
+        raise ValueError('dataset not supported: {}'.format(opt.dataset))
+    normalize = transforms.Normalize(mean=mean, std=std)
+
+    if opt.loss!='supcon':
+        train_transform = transforms.Compose([
+            transforms.RandomResizedCrop(size=32, scale=(0.2, 1.)),
+            transforms.RandomHorizontalFlip(),
+            transforms.ToTensor(),
+            normalize,
+        ])
+
+    else:
+        # only for supcon
+        train_transform = transforms.Compose([
+            transforms.RandomResizedCrop(size=opt.size, scale=(0.2, 1.)),
+            transforms.RandomHorizontalFlip(),
+            transforms.RandomApply([
+                transforms.ColorJitter(0.4, 0.4, 0.4, 0.1)
+            ], p=0.8),
+            transforms.RandomGrayscale(p=0.2),
+            transforms.ToTensor(),
+            normalize,
+        ])
+
+
+    val_transform = transforms.Compose([
+        transforms.ToTensor(),
+        normalize,
+    ])    
+    if opt.dataset == 'cifar10':
+        train_data, train_targets = CIFAR10(root=opt.data_folder)
+        val_data, val_targets = CIFAR10(root=opt.data_folder, train=False)
+    elif opt.dataset == 'cifar100':
+        train_data, train_targets = CIFAR100(root=opt.data_folder)
+        val_data, val_targets = CIFAR100(root=opt.data_folder, train=False)
+    elif opt.dataset == 'c2':
+        train_data, train_targets = CAT_VS_DOG(root=opt.data_folder)
+        val_data, val_targets = CAT_VS_DOG(root=opt.data_folder, train=False)
+    elif opt.dataset == 'stl10':
+        train_data, train_targets = STL10(root=opt.data_folder)
+        val_data, val_targets = STL10(root=opt.data_folder, split='test')
+        train_data = train_data.transpose(0, 2, 3, 1)
+        val_data = val_data.transpose(0, 2, 3, 1)
+    elif opt.dataset == 'melanoma':
+        train_set = Melanoma(root=opt.data_folder+'/melanoma/', is_test=False, test_size=0.2)
+        test_set = Melanoma(root=opt.data_folder+'/melanoma/', is_test=True, test_size=0.2)
+        train_set.transforms = TwoCropTransform(train_set.transforms) if opt.loss=='supcon' else train_set.transforms
+        test_set.transforms = TwoCropTransform(test_set.transforms) if opt.loss=='supcon' else test_set.transforms
+        train_loader = torch.utils.data.DataLoader(train_set, batch_size=opt.batch_size, shuffle=True, num_workers=opt.num_workers, pin_memory=True)
+        test_loader = torch.utils.data.DataLoader(test_set, batch_size=opt.batch_size, shuffle=False, num_workers=opt.num_workers, pin_memory=True)
+        return train_loader, test_loader
+    else:
+        raise ValueError(opt.dataset)
+
+    train_sampler = None
+
+    train_transform = TwoCropTransform(train_transform) if opt.loss=='supcon' else train_transform
+    val_transform = TwoCropTransform(val_transform) if opt.loss=='supcon' else val_transform
+
+    generator = ImbalancedDataGenerator(verbose=True, random_seed=SEED)
+    (train_images, train_labels) = generator.transform(
+        train_data, train_targets, imratio=opt.imratio)
+    train_loader = torch.utils.data.DataLoader(ImageDataset(
+        train_images, train_labels,train_transform,val_transform,mode='train'), 
+        batch_size=opt.batch_size, shuffle=(train_sampler is None), num_workers=opt.num_workers, pin_memory=True, sampler=train_sampler)
+
+    (val_images, val_labels) = generator.transform(
+        val_data, val_targets, imratio=0.5) #NOTE: Default testing is at 0.5
+    val_loader = torch.utils.data.DataLoader(ImageDataset(
+        val_images, val_labels,train_transform,val_transform,mode='val'), 
+        batch_size=256, shuffle=False, num_workers=8, pin_memory=True)
+
+    del train_data, train_targets, val_data, val_targets, train_images, train_labels, val_images, val_labels
+    return train_loader, val_loader
+
diff --git a/AUCM_exp/SupContrast/dataset/datasets_multiclass.py b/AUCM_exp/SupContrast/dataset/datasets_multiclass.py
diff --git a/AUCM_exp/SupContrast/main_SLS.py b/AUCM_exp/SupContrast/main_SLS.py
@@ -17,7 +17,7 @@
 from networks.resnet_big import SupConResNet, LinearClassifier
 from sklearn.metrics import roc_auc_score
 from calibration_library.metrics import ECELoss, SCELoss
-from datasets.datasets import set_loader
+from dataset.datasets import set_loader
 from loss import SupConLoss
 import json
 try:

diff --git a/AUCM_exp/SupContrast/main_aucm.py b/AUCM_exp/SupContrast/main_aucm.py
@@ -17,7 +17,7 @@
 from networks.main import SupAUCMResNet
 from sklearn.metrics import roc_auc_score
 from calibration_library.metrics import ECELoss, SCELoss
-from datasets.datasets import set_loader
+from dataset.datasets import set_loader
 import json
 try:
     import apex

diff --git a/AUCM_exp/SupContrast/main_linear.py b/AUCM_exp/SupContrast/main_linear.py
@@ -17,7 +17,7 @@
 from networks.resnet_big import SupConResNet, LinearClassifier
 from sklearn.metrics import roc_auc_score
 from calibration_library.metrics import ECELoss, SCELoss
-from datasets.datasets import set_loader
+from dataset.datasets import set_loader
 import json
 try:
     import apex

diff --git a/AUCM_exp/SupContrast/main_nll.py b/AUCM_exp/SupContrast/main_nll.py
@@ -17,7 +17,7 @@
 from networks.main import SupCEResNet, SupAUCMResNet
 from sklearn.metrics import roc_auc_score
 from calibration_library.metrics import ECELoss, SCELoss
-from datasets.datasets import set_loader
+from dataset.datasets import set_loader
 import json
 from loss import FocalLoss
 try:

diff --git a/AUCM_exp/SupContrast/main_supcon.py b/AUCM_exp/SupContrast/main_supcon.py
@@ -16,7 +16,7 @@
 from util import set_optimizer, save_model
 from networks.resnet_big import SupConResNet
 from loss import SupConLoss
-from datasets.datasets import set_loader
+from dataset.datasets import set_loader
 
 try:
     import apex