Multitask disfluency detection

Code for the paper "Multi-Task Learning for Domain-General Spoken Disfluency Detection in Dialogue Systems" (Igor Shalyminov, Arash Eshghi, and Oliver Lemon) [SemDial 2018 paper] [Slides]

Model architecture

Getting started

Set up the environment (below are steps for Conda):

$ cd code-directory
$ git submodule update --init
$ conda create -n multitask_disfluency python=2.7
$ conda activate multitask_disfluency
$ pip install -r requirements.txt

Preprocess the Switchboard dataset for training:

$ python make_deep_disfluency_dataset.py swbd disfluency

Train the model:

$ python train.py swbd model

bAbI+ disfluency study data generation

Get the bAbI tools and install requirements
Download bAbI dialog tasks into the babi_tools folder
Run sh make_generalization_study_datasets.sh <RESULT_FOLDER>
Run sh tag_dataset.sh <RESULT_FOLDER> <config_file_name> for every config in 2018_generalization_study_configs
The resulting datasets are <RESULT_FOLDER>/<BABI_DATASET_NAME>/*.tagged.json

Name		Name	Last commit message	Last commit date
Latest commit History 155 Commits
deep_disfluency @ 91bcbf3		deep_disfluency @ 91bcbf3
legacy		legacy
models		models
util		util
.gitmodules		.gitmodules
README.md		README.md
config.json		config.json
config.py		config.py
data_utils.py		data_utils.py
deep_disfluency_utils.py		deep_disfluency_utils.py
denoise_lstm.py		denoise_lstm.py
dialogue_denoiser_lstm.ipynb		dialogue_denoiser_lstm.ipynb
dialogue_denoiser_lstm.py		dialogue_denoiser_lstm.py
evaluate.py		evaluate.py
evaluate_deep_disfluency.py		evaluate_deep_disfluency.py
fine_tune_lstm_denoiser.py		fine_tune_lstm_denoiser.py
importance_sampling.ipynb		importance_sampling.ipynb
looking_at_swda.ipynb		looking_at_swda.ipynb
make_deep_disfluency_dataset.py		make_deep_disfluency_dataset.py
make_parallel_swda_corpus.py		make_parallel_swda_corpus.py
make_pretraining_dataset.py		make_pretraining_dataset.py
make_training_dataset.py		make_training_dataset.py
metrics.py		metrics.py
mining_repair_structures.ipynb		mining_repair_structures.ipynb
model_architecture.png		model_architecture.png
multitask_disfluency_detector.jpg		multitask_disfluency_detector.jpg
pos_tag_dataset.py		pos_tag_dataset.py
post_train_lm.py		post_train_lm.py
predict.py		predict.py
requirements.txt		requirements.txt
requirements_cpu.txt		requirements_cpu.txt
swda_utils.py		swda_utils.py
tag_dataset_deep_disfluency.py		tag_dataset_deep_disfluency.py
tag_swda_disfluencies.py		tag_swda_disfluencies.py
train.py		train.py
training_utils.py		training_utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multitask disfluency detection

Model architecture

Getting started

bAbI+ disfluency study data generation

About

Releases

Packages

Contributors 2

Languages

ishalyminov/multitask_disfluency_detection

Folders and files

Latest commit

History

Repository files navigation

Multitask disfluency detection

Model architecture

Getting started

bAbI+ disfluency study data generation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages