GATK
使用するツール Cat, Trimmomatic, Picard FastqToSam, Bedtools bamtofastq 今回は何をする? 最近、カバレッジの不足を補うために、別々に実施したWGSデータを合体させて解析に使う機会がありました。 「単純にcatコマンドで合成するだけでできるよ」と共…
GATK FastaAlternateReferanceMakerの使い方 使用難易度★★★★☆ 本記事は、GATK解説シリーズのPart 11です。 GATK解説シリーズのリンクまとめは↓こちら GATKの導入方法から、変異情報の取得までをハプロイドの病原体を使った実例とともに紹介しています。 eupa…
主な使用ツール; RAxML-NG, Modeltest-NG, FigTree 使用難易度★★★☆☆ Produce an ML phylogeny by RAxML-NG@Harrykun_blog 今回は何をする? 前回の記事で取得したSNP情報を基に最尤法による系統解析を行います。 全ゲノムスケールのSNP情報を使用することで…
GATK BQSR後のVariant Calling 使用難易度★☆☆☆☆ 本記事は、GATK解説シリーズのPart 10です。 GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com 今回は何をする? 前回のGATK VariantFilterationで出力された、*.bqsr.bamを基…
GATK BaseRecalibrator, ApplyBQSR 使用難易度★☆☆☆☆ 本記事は、GATK解説シリーズのPart 9です。 GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com 今回は何をする? 前回のGATK VariantFilterationで出力された、merged_snps/…
GATK VariantFiltration 使用難易度★★★★★ 本記事は、GATK解説シリーズのPart 7-2です。 GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com 今回は何をする? 前回のGATK SelectVariantsの使い方の続きになります。 GATK Varian…
GATK SelectVariants 使用難易度★★★★★ 本記事は、GATK解説シリーズのPart 7です。 GATK解説シリーズのリンクまとめは↓こちら eupatho-bioinfomatics.hatenablog.com 今回は何をする? GATK SelectVariantsを使って、Part 6の記事で得たmerged.vcfファイルか…
VCF (Variant call format)ファイルの見方 今回は何をする? 本記事は、VCFファイルを解説する記事の後編です。 前半をご覧になっていない方はこちらからどうぞ。 後編では各バリアントサイトのレコードに付随する項目やスコアについて説明します。 GATK公式…
VCF (Variant call format)ファイルの見方 今回は何をする? これまでに全くVCFファイルに触れたことのない方に向けて、ファイルを構成する要素を詳しく解説します。 VCFは変異解析に不可欠な要素であり、必ず理解しなければなりません。 初めて見た時の感想…
GATK GenomicsDBimport, GATK GenotypeGVCFs, Picard VcfToIntervalList 使用難易度★★★☆☆ 本記事は、GATK解説シリーズのPart 6です。 eupatho-bioinfomatics.hatenablog.com 今回は何をする? GATK GenomicsDBimport および GATK GenotypeGVCFs を使って、前…
GATK HaplotypeCaller 使用難易度★★★☆☆ 本記事は、GATK解説シリーズのPart 5の後編です。 eupatho-bioinfomatics.hatenablog.com 前編の記事は↓こちら eupatho-bioinfomatics.hatenablog.com 今回は何をする? GATK HaplotypeCallerを使って、Part 4の記事で…
GATK HaplotypeCaller 使用難易度★★★☆☆ 本記事は、GATK解説シリーズのPart 5の前編です。 eupatho-bioinfomatics.hatenablog.com 今回は何をする? GATK HaplotypeCallerを使って、前回の記事で得たBAM形式ファイルから、変異情報の記載されたVCFファイルを…
GATK MarkDuplicate 使用難易度★★☆☆☆ 本記事は、GATK解説シリーズのPart 4です。 eupatho-bioinfomatics.hatenablog.com 今回は何をする? 前回の記事で得たBAM形式ファイルを使って、GATK MarkDuplicates/MarkDuplicateSparkにより重複したリードにタグを付…
FastQC, trimmomatic, bwa, samtools 導入難易度★☆☆☆☆ 使用難易度★★★☆☆ 今回は何をする? 前回の記事で収集したマラリア原虫のWGSデータを使ってマッピングを行い、BAM形式のファイルを生成します。内容は以前に投稿した下記の記事と重複しますが、これから…
GATKの使い方 BAMファイルからVCF出力までのロードマップ GATK4.2の使い方について、ロードマップを作成しました。 各partに対応した作業内容について、1つずつ記事にしています。 ちなみに、ブログ主の研究対象がハプロイドの病原体なので、とりあえず1倍…
sra-toolkit, fasterq-dump, sra-toolkit 導入難易度★☆☆☆☆ 使用難易度★★☆☆☆ 今回は何をする? 今後のGATK解析で使用するマラリア原虫のWGSデータを収集します。せっかくなので、以前のprefetchとは違うfasterq-dumpを使ったダウンロードの方法を紹介します。…
GATKの導入とPATHの通し方 今回は何をする? GATK4を自分のPCに導入します。 GATKとは GATKはBroad研究所が提供する、変異の検出に特化したゲノム解析ツールキットです。非常に多機能でゲノム解析分野で業界標準として広く使われていますが、操作難易度が高…