sequence_collapsing

Python scripts to collapse sequences into unique sequences

Installation

Clone this repository in your designated directory

git clone https://github.com/MullinsLab/sequence_collapsing.git

it will create a directory called "sequence_collapsing" in your designated directory (i.e. WhereSequenceCollapsingInstalled)

Usage

Collapsing sequences

In a working directory that contains sequence fasta file (filename.fasta), run the following command to collapse sequences in the fasta file into unique sequences

python WhereSequenceCollapsingInstalled/collapse_sequences.py filename.fasta

it will output two files. One is the collapsed unique sequence fasta file (filename_collapsed.fasta), the other is the name file that is tab delimited text file listing the unique sequence names and corresponding original sequence names (filename_collapsed_name.txt)

Or, run the following command to collapse sequences in the fasta file into unique sequences based on groups/timepoints

python WhereSequenceCollapsingInstalled/collapse_sequences.py filename.fasta -g

in order to collapse sequences based on groups/timepoints, the sequence names have to follow the pattern of "projectID_sampleID_group_generegion_somethingElse"
it will output two files. One is the collapsed unique sequence fasta file (filename_collapsed_by_grp.fasta), the other is the name file that is tab delimited text file listing the unique sequence names and corresponding original sequence names (filename_collapsed_by_grp_name.txt)

Uncollapsing sequences

In a working directory that contains collapsed unique sequence fasta file and the name file, run the following command to uncollapse unique sequences in the collapsed sequence fasta file into the original uncollapsed sequences

python WhereSequenceCollapsingInstalled/uncollapse_sequences.py filename.fasta namefile

it will output the uncollapsed sequence fasta file (filename_uncollapsed.fasta)

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.gitignore		.gitignore
README.md		README.md
collapse_sequences.py		collapse_sequences.py
collapse_sequences_by_groups.py		collapse_sequences_by_groups.py
uncollapse_sequences.py		uncollapse_sequences.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

sequence_collapsing

Installation

Usage

Collapsing sequences

Uncollapsing sequences

About

Releases

Packages

Languages

MullinsLab/sequence_collapsing

Folders and files

Latest commit

History

Repository files navigation

sequence_collapsing

Installation

Usage

Collapsing sequences

Uncollapsing sequences

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages