バイオインフォマティクスでゲノムワイド関連解析(GWAS)

バイオインフォマティクスを頑張っている方が、本ブログの内容を真似することで、自分のデータで解析ができる情報を提供することが目標です! 今はGATKの解説をメインテーマにしています。

MENU

GATK BQSR後のVariant Calling -GATK解説シリーズ-part 10

GATK BQSR後のVariant Calling

使用難易度★☆☆☆☆
本記事は、GATK解説シリーズのPart 10です。

GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com

今回は何をする?

  • 前回のGATK VariantFilterationで出力された、*.bqsr.bamを基に2回目のVariant Callingを行います

  • 今回行う内容は、GATK解説シリーズ Part 5 からPart 8で行った仕事の繰り返しになります。新しく覚えることは特にありません

  • 今回得たmerged_snps/indels_filtered.vcfを使って、多様なゲノムワイド解析を行うことができます


Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。

続きを読む

GATK BaseRecalibratorとApplyBQSRの使い方 -GATK解説シリーズ-part 9

GATK BaseRecalibrator, ApplyBQSR

使用難易度★☆☆☆☆
本記事は、GATK解説シリーズのPart 9です。

GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com

今回は何をする?

  • 前回のGATK VariantFilterationで出力された、merged_snps/indels_filtered.vcfを基にBQSRを行います。

  • これまであまり理解せずに使用していたBQSRですが、この機会に公式HPのGATK BaseRecalibratorのページを全部読んでみたので、内容をかいつまんで説明します。

  • さらに、 BaseRecalibratorとApplyBQSRの具体的な使用例を紹介します。


Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。

公式HPのリンク
Base Quality Score Recalibration (BQSR) 
BaseRecalibrator
ApplyBQSR

続きを読む

GATK VariantFiltrationの使い方 -GATK解説シリーズ-part 8

GATK VariantFiltration

使用難易度★★★★★
本記事は、GATK解説シリーズのPart 7-2です。

GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com

今回は何をする?

  • 前回のGATK SelectVariantsの使い方の続きになります。

  • GATK VariantFiltrationを使って、vcfファイルから低クオリティのバリアントを除外します。

  • FilteringのステップはSelectVarinatsとVariantFiltrationをセットで実行することになります
    GATK SelectVariatnsについては前回の記事を参照してください。

  • 今回のVariantFiltrationの条件は解析結果に大きな影響を及ぼしますが、実用レベルでもよく使用するオプションの種類が多く、最適な設定の検討が難しいことなどから奥が深くて難解なステップだと感じています。しかし、ここを乗り切れば難所はおしまいです!!

  • FIlteringの条件として、GATK Legacy Forumの値を参考にしました。リンクはこちら
    少し情報が古いので、もっといい参考資料を発見したらアップデートします。

  • VCFファイルについて理解していない方には難しい内容だと思います。
    VCFファイルについて知りたい方は、先に↓こちらの記事を読むことをお勧めします

eupatho-bioinfomatics.hatenablog.com

eupatho-bioinfomatics.hatenablog.com


Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。

公式HPの VariantFiltrationのリンク

https://gatk.broadinstitute.org/hc/en-us/articles/4404604763547-VariantFiltration#--set-filtered-genotype-to-no-call

続きを読む

GATK SelectVariantsの使い方 -GATK解説シリーズ-part 7

GATK SelectVariants

使用難易度★★★★★
本記事は、GATK解説シリーズのPart 7です。

GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com

今回は何をする?

  • GATK SelectVariantsを使って、Part 6の記事で得たmerged.vcfファイルから、自身の解析条件に適したフィルター条件を設定して、バリアントを選別します。

  • 実際には、FilteringのステップはSelectVarinatsとVariantFiltrationをセットで実行することになります
    GATK VariantFilterについては次回解説します。

  • 今回と次のVariantFiltrationの条件が解析結果に大きな影響を及ぼしますが、実用レベルでもよく使用するオプションの種類が多く、最適な設定の検討が難しいことなどから奥が深くて難解なステップだと感じています。しかし、ここを乗り切れば難所はおしまいです!!

  • VCFファイルについて理解していない方には難しい内容だと思います。
    VCFファイルについて知りたい方は、先に↓こちらの記事を読むことをお勧めします

eupatho-bioinfomatics.hatenablog.com

eupatho-bioinfomatics.hatenablog.com


Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。

公式HPのSelectVariantsのリンク
[https://gatk.broadinstitute.org/hc/en-us/articles/360056969012-HaplotypeCaller:title]

続きを読む