Как использовать:
!git clone https://github.com/DmitryMok/od_helper %run od_helper/prepare_for_od.ipynb
Посмотреть разброс размеров изображений
check_img_dir(dir=DIR_IMG)
Количество файлов в папке: 7019 Расширения: jpg
Проверяем количество изображений и файлов разметки
ds=DataSet([DIR_IMG],[DIR_LAB]) ds.get_stat()
Папки с изображениями: /content/train_dir/images | +-- . [кол-во файлов - 7019, расширения: jpg] Папки с файлами разметки: /content/train_dir/annotations | +-- . [кол-во файлов - 7019, расширения: txt]
Выводим несколько изображений
draw_imgs_from_path(DIR_IMG, 12)
Подробная статистика по классам
ds.get_class_stat(img_list, bbox_list, ds_val.img_dirs[0], wh_offset=0)
Классы: 1 2 3 4 5 6 ################################################## КЛАСС - 1 ################################################## /content/train_dir/images/9999999_00309_d_0000137.jpg [ 2. 1174. 678. 56. 141.]
Фильтруем классы и размеры объектов
idx = ds.get_filt_classes(img_list, bbox_list, ds.img_dirs[0], inc_cl=None, exc_cl=[0,7,8,11], mis_sq=0, max_sq=10e7)
Список классов: [ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.] из 7019 изображений соответствует фильтру 2514 изображений (393719/87336) включены классы None, исключены [0, 7, 8, 11], мин. площадь 0, макс. площадь 100000000.0 остались классы [ 1. 2. 3. 4. 5. 6. 9. 10.]