Biyoinformatik

Hizalama ve varyant çağırma çalışması

Hizalama çalışması için öncelikle E. coli referans genomunu data klasörüne indirelim.

Programlar:

sudo apt-get install bwa samtools bcftools vcftools

Veya conda ile yükleyin:

conda install bwa samtools bcftools vcftools

Hizalama aşaması

Ardından ilk olarak bwa programı ile referans genomu indeksleyelim.

bwa index data/E_coli.fna

Şimdi ise ileri ve geri yönlü okumaları referans genoma hizalayalım. Unutmayın, bir ders önce işlediğimiz okumaları hizalayacağız.

İlk olarak sonuçları depolayacağımız results klasörünü oluşturalım:

mkdir results

Şimdi ise hizalama indeks dosyalarının oluşturalım:

 bwa aln -t 4 data/E_coli.fna data/ERR3473047_1_processed.fastq.gz > results/ERR3473047_1.sai

bwa aln -t 4 data/E_coli.fna data/ERR3473047_2_processed.fastq.gz > results/ERR3473047_2.sai

Bir sonraki adımda hizalama işlemini gerçekleştirelim:


bwa sampe data/E_coli.fna results/ERR3473047_1.sai results/ERR3473047_2.sai data/ERR3473047_1_processed.fastq.gz data/ERR3473047_2_processed.fastq.gz > results/ERR3473047.sam

Elde ettiğimiz dosya bir sam dosyası olacaktır.

Ama bu dosya hizalanmamış okumaları da içeriyor. Sonraki adımlara geçmek için sadee hizalanmış okumaları alalım ve sıkıştırılmış bam dosyası elde edelim.


samtools view -F12 -q30 -Sb results/ERR3473047.sam > results/ERR3473047.bam

İstersek samtools view komutu ile bu dosyayı inceleyebiliriz:

samtools view results/ERR3473047.bam | less

Ama istersek tüm bu adımları tek bir satıra indirgeyebiliriz:

bwa sampe data/E_coli.fna results/ERR3473047_1.sai results/ERR3473047_2.sai data/ERR3473047_1_processed.fastq.gz data/ERR3473047_2_processed.fastq.gz | samtools view -F4 -q30 -Sb > results/ERR3473047.bam

Varyant çağırma

Varyant çağırmak için ilk olarak elde ettiğimiz bam dosyasını indeksleyip, sıralamamımz gerek

samtools sort results/ERR3473047.bam -o results/ERR3473047.sorted.bam
samtools index results/ERR3473047.sorted.bam

Bu işlem sonucunda bai uzantılı bir index dosyası oluşmalı. Bu dosya bizim için önemli. Bir yerden bir yere kopyalama esnasında, bu dosyayı da yüklemeliyiz.

Sonraki adımda ise bcftools programını kullanarak varyant çağırma işlemini gerçekleştirebiliriz:

 bcftools mpileup -Ov --fasta-ref data/E_coli.fna results/ERR3473047.sorted.bam | bcftools call -mv -Ov -o results/calls.vcf