Hizalama çalışması için öncelikle E. coli referans genomunu data
klasörüne indirelim.
Programlar:
sudo apt-get install bwa samtools bcftools vcftools
Veya conda ile yükleyin:
conda install bwa samtools bcftools vcftools
Ardından ilk olarak bwa
programı ile referans genomu indeksleyelim.
bwa index data/E_coli.fna
Şimdi ise ileri ve geri yönlü okumaları referans genoma hizalayalım. Unutmayın, bir ders önce işlediğimiz okumaları hizalayacağız.
İlk olarak sonuçları depolayacağımız results
klasörünü oluşturalım:
mkdir results
Şimdi ise hizalama indeks dosyalarının oluşturalım:
bwa aln -t 4 data/E_coli.fna data/ERR3473047_1_processed.fastq.gz > results/ERR3473047_1.sai
bwa aln -t 4 data/E_coli.fna data/ERR3473047_2_processed.fastq.gz > results/ERR3473047_2.sai
Bir sonraki adımda hizalama işlemini gerçekleştirelim:
bwa sampe data/E_coli.fna results/ERR3473047_1.sai results/ERR3473047_2.sai data/ERR3473047_1_processed.fastq.gz data/ERR3473047_2_processed.fastq.gz > results/ERR3473047.sam
Elde ettiğimiz dosya bir sam
dosyası olacaktır.
Ama bu dosya hizalanmamış okumaları da içeriyor. Sonraki adımlara geçmek için sadee hizalanmış okumaları alalım ve sıkıştırılmış bam
dosyası elde edelim.
samtools view -F12 -q30 -Sb results/ERR3473047.sam > results/ERR3473047.bam
İstersek samtools view
komutu ile bu dosyayı inceleyebiliriz:
samtools view results/ERR3473047.bam | less
Ama istersek tüm bu adımları tek bir satıra indirgeyebiliriz:
bwa sampe data/E_coli.fna results/ERR3473047_1.sai results/ERR3473047_2.sai data/ERR3473047_1_processed.fastq.gz data/ERR3473047_2_processed.fastq.gz | samtools view -F4 -q30 -Sb > results/ERR3473047.bam
Varyant çağırmak için ilk olarak elde ettiğimiz bam dosyasını indeksleyip, sıralamamımz gerek
samtools sort results/ERR3473047.bam -o results/ERR3473047.sorted.bam
samtools index results/ERR3473047.sorted.bam
Bu işlem sonucunda bai
uzantılı bir index dosyası oluşmalı. Bu dosya bizim için önemli. Bir yerden bir yere kopyalama esnasında, bu dosyayı da yüklemeliyiz.
Sonraki adımda ise bcftools
programını kullanarak varyant çağırma işlemini gerçekleştirebiliriz:
bcftools mpileup -Ov --fasta-ref data/E_coli.fna results/ERR3473047.sorted.bam | bcftools call -mv -Ov -o results/calls.vcf