Preprocessing protocol for alelle-specific expression on RNA-seq

Includes:

pseudoreference preparation: pseudoreferences_creation/prepare_pseudoreference.py
alignment: STAR
alelic reads resolving: fastq_to_allelic_counts_tabs/alleleseparation.py
counting reads per gene: featureCounts

See also: controlFreq, R-package for calculating overdispersion in RNA-seq samples, in presence of technical replication or spike-ins.

For an example wrapper function for steps (1-3) see fastq2allelicbams.sh; for stats collection (like # of raw reads, # of aligned reads, spike-in reads proportion) see fastq2allelicbams_stats.sh; for step (4) see allelicbams2genecounts.sh. See example directory for sample butch table example, and Wiki page for more details and usecases, motivation of pipeline choice, and QC.

Note: step (1) is the same as in ASEReadCounter* (see Wiki), when (2-4) have been evolved.

Scheme is made in BioRender.

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
example/info_table		example/info_table
fastq_to_allelic_counts_tabs		fastq_to_allelic_counts_tabs
pseudoreferences_creation		pseudoreferences_creation
schemes		schemes
README.md		README.md
allelicbams2genecounts.sh		allelicbams2genecounts.sh
fastq2allelicbams.copy.sh		fastq2allelicbams.copy.sh
fastq2allelicbams.sh		fastq2allelicbams.sh
fastq2allelicbams_stats.sh		fastq2allelicbams_stats.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Preprocessing protocol for alelle-specific expression on RNA-seq

About

Releases

Packages

Languages

gimelbrantlab/fastq2allelictabs

Folders and files

Latest commit

History

Repository files navigation

Preprocessing protocol for alelle-specific expression on RNA-seq

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages