バイオインフォマティクスでゲノムワイド関連解析(GWAS)

バイオインフォマティクスについて、具体例を使って紹介します。

MENU

WGSデータの品質管理[FastQC]

FastQCの使い方

導入難易度☆☆☆☆
使用難易度☆☆☆☆

このツールで何ができる?
WGSデータのための必須級品質管理ツールです
一つのツールで多様な品質情報をアウトプットしてくれます。

私の使用感
別記事で紹介したFastQ screenとFastQCを、結果を得た日のうちに実行して、サンプル自体の品質や調整方法に問題が無かったかを確認します。簡単、迅速、便利なツールです。


Twitterで記事の更新をお知らせしているので、興味を持たられた方は是非フォローをお願いします。

1. ツールのインストール

conda install -c bioconda fastqc 

インストールが正しく導入されたか確認する。

fastqc

正しく導入されていれば、GUI版のFastqcが起動する。
今回は使用しないので終了する。

2. 解析の準備に必要な手順

必要な準備は特にない、強いて言えばFastqファイルをダウンロードすることと、それらを一つのフォルダに収納すること。
なお、本ブログの過去記事↓

eupatho-bioinfomatics.hatenablog.com

で作成したマラリア原虫のFastq.gzファイルを例として用いる。

3. FastQCを実行する。

fastqc -t 16 -o /path/to/working/dir/fastqc_reports/ \ 
   /path/to/working/*.fastq.gz

4. 解析結果

以前の記事で紹介したmultiQCで、一まとめにした結果を貼っておきます。
結果の解釈は公式HPに詳細な説明がされています。日本語ではbioinformaticsに、分かり易く説明されています。
公式HPのExample Reportsの欄に良い例と悪い例が載っているので参考にしてください。

f:id:Harry-kun:20210623124353j:plain
FastQCの結果
注:PlasmodiumはAT richな生物です。

今回はこれで終わりです。
忙しい時用にとっておいたFastQCの回を早くも使ってしまいました。。。。
よければ他の記事のも見ていってください。

eupatho-bioinfomatics.hatenablog.com