GitHub - security-pride/Vulnerability-Dataset-Denoising at 6983caaafd5c9bd5f7feea38caabafb6a1e1d678

security-pride / Vulnerability-Dataset-Denoising Public

Notifications You must be signed in to change notification settings
Fork 1
Star 7

Artifact for ISSTA'23 paper "Understanding and Tackling Label Errors in Deep Learning-based Vulnerability Detection (Experience Paper)"

7 stars 1 fork Branches Tags Activity

Star

Notifications

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
configs		configs
models		models
prepare_data		prepare_data
tools/joern_slicer		tools/joern_slicer
utils		utils
.gitignore		.gitignore
README.md		README.md
confident_learning.py		confident_learning.py
differential_training.py		differential_training.py
dwk_train.py		dwk_train.py
gen_raw_data.py		gen_raw_data.py
pre_train.py		pre_train.py
reveal_train.py		reveal_train.py
sard_crawl.py		sard_crawl.py
statistic.py		statistic.py
sysevr_train.py		sysevr_train.py
vdp_train.py		vdp_train.py

Repository files navigation

This toolkit is all the code used by Issta2023

Folder Description:

configs:

config files for deep learning models. In this work, we just use deepwukong.yaml, silver.yaml, and vuldeepecker.yaml.

models:

code files for deep learning models.

prepare_data:

util files that prepare data for FFmpeg+qumu.

tools:

program slice util files.

utils:

commonly used functions.

confident_learning.py:

entrance of confident learning.

differential_training.py:

entrance of differential training.

dwk_train.py:

entrance of training deepwukong.

sys_train.py:

entrance of training sysevr.

vdp_train.py:

entrance of training vuldeepecker.

scrd_crawl.py:

code for crawling sard dataset.

Datasets:

SARD:

You can crawl vulnerability data from the SARD official website through script:

python sard_crawl.py

Qemu+FFmpeg:Qemu+FFmpeg

You can download it via this link.

About

Artifact for ISSTA'23 paper "Understanding and Tackling Label Errors in Deep Learning-based Vulnerability Detection (Experience Paper)"

Readme

Activity

Custom properties

7 stars

0 watching

1 fork

Report repository

Releases

No releases published

Packages

No packages published

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

This toolkit is all the code used by Issta2023

Folder Description:

Datasets:

SARD:

Qemu+FFmpeg:Qemu+FFmpeg

About

Releases

Packages

Contributors 4

Languages

security-pride/Vulnerability-Dataset-Denoising

Folders and files

Latest commit

History

Repository files navigation

This toolkit is all the code used by Issta2023

Folder Description:

Datasets:

SARD:

Qemu+FFmpeg:Qemu+FFmpeg

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages