GATK BQSR後のVariant Calling -GATK解説シリーズ-part 10
GATK BQSR後のVariant Calling
使用難易度★☆☆☆☆
本記事は、GATK解説シリーズのPart 10です。
GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com
今回は何をする?
前回のGATK VariantFilterationで出力された、
*.bqsr.bam
を基に2回目のVariant Callingを行います。今回行う内容は、GATK解説シリーズ Part 5 からPart 8で行った仕事の繰り返しになります。新しく覚えることは特にありません。
今回得た
merged_snps/indels_filtered.vcf
を使って、多様なゲノムワイド解析を行うことができます。
Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。
フォローする @harrykun_blog
GATK BaseRecalibratorとApplyBQSRの使い方 -GATK解説シリーズ-part 9
GATK BaseRecalibrator, ApplyBQSR
使用難易度★☆☆☆☆
本記事は、GATK解説シリーズのPart 9です。
GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com
今回は何をする?
前回のGATK VariantFilterationで出力された、
merged_snps/indels_filtered.vcf
を基にBQSRを行います。これまであまり理解せずに使用していたBQSRですが、この機会に公式HPのGATK BaseRecalibratorのページを全部読んでみたので、内容をかいつまんで説明します。
さらに、 BaseRecalibratorとApplyBQSRの具体的な使用例を紹介します。
Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。
フォローする @harrykun_blog
公式HPのリンク
Base Quality Score Recalibration (BQSR)
BaseRecalibrator
ApplyBQSR
GATK VariantFiltrationの使い方 -GATK解説シリーズ-part 8
GATK VariantFiltration
使用難易度★★★★★
本記事は、GATK解説シリーズのPart 7-2です。
GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com
今回は何をする?
前回のGATK SelectVariantsの使い方の続きになります。
GATK VariantFiltrationを使って、vcfファイルから低クオリティのバリアントを除外します。
FilteringのステップはSelectVarinatsとVariantFiltrationをセットで実行することになります。
GATK SelectVariatnsについては前回の記事を参照してください。今回のVariantFiltrationの条件は解析結果に大きな影響を及ぼしますが、実用レベルでもよく使用するオプションの種類が多く、最適な設定の検討が難しいことなどから奥が深くて難解なステップだと感じています。しかし、ここを乗り切れば難所はおしまいです!!
FIlteringの条件として、GATK Legacy Forumの値を参考にしました。リンクはこちら
少し情報が古いので、もっといい参考資料を発見したらアップデートします。VCFファイルについて理解していない方には難しい内容だと思います。
VCFファイルについて知りたい方は、先に↓こちらの記事を読むことをお勧めします
eupatho-bioinfomatics.hatenablog.com
eupatho-bioinfomatics.hatenablog.com
Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。
フォローする @harrykun_blog
公式HPの VariantFiltrationのリンク
GATK SelectVariantsの使い方 -GATK解説シリーズ-part 7
GATK SelectVariants
使用難易度★★★★★
本記事は、GATK解説シリーズのPart 7です。
GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com
今回は何をする?
GATK SelectVariantsを使って、Part 6の記事で得たmerged.vcfファイルから、自身の解析条件に適したフィルター条件を設定して、バリアントを選別します。
実際には、FilteringのステップはSelectVarinatsとVariantFiltrationをセットで実行することになります。
GATK VariantFilterについては次回解説します。今回と次のVariantFiltrationの条件が解析結果に大きな影響を及ぼしますが、実用レベルでもよく使用するオプションの種類が多く、最適な設定の検討が難しいことなどから奥が深くて難解なステップだと感じています。しかし、ここを乗り切れば難所はおしまいです!!
VCFファイルについて理解していない方には難しい内容だと思います。
VCFファイルについて知りたい方は、先に↓こちらの記事を読むことをお勧めします
eupatho-bioinfomatics.hatenablog.com
eupatho-bioinfomatics.hatenablog.com
Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。
フォローする @harrykun_blog
公式HPのSelectVariantsのリンク
[https://gatk.broadinstitute.org/hc/en-us/articles/360056969012-HaplotypeCaller:title]