バイオインフォマティクスでゲノムワイド関連解析(GWAS)

バイオインフォマティクスを頑張っている方が、本ブログの内容を真似することで、自分のデータで解析ができる情報を提供することが目標です! 今はGATKの解説をメインテーマにしています。

MENU

2021-06-01から1ヶ月間の記事一覧

MEGA Xを使って系統樹を作成する。[MEGA X]

MEGA Xの使い方, 病原体ゲノムデータベース(PlasmoDB)の使い方。 導入難易度★★☆☆☆ 使用難易度★★☆☆☆ この記事を読むと何ができる? 公共データベースからマラリア原虫のMAF1遺伝子のアミノ酸配列を収集し、それを使って分子系統解析を行う方法を紹介します…

plinkを使ってゲノムの集団構造を体験する-パート2

plinkの使い方 導入難易度★☆☆☆☆ 使用難易度★★★☆☆ 使用するRのパッケージ: tidyverse, dplyr, cowplot 使用するRのコマンド: read.delim, read.csv, colnames, merge, ggplot, plot_grid この記事を読むと何ができるようになる? plinkを使ったGWAS解析の演習…

plinkを使ってゲノムの集団構造を体験する-パート1

plinkの使い方 導入難易度★☆☆☆☆ 使用難易度★★★☆☆ この記事を読むと何ができるようになる? 今回から2回に分けて、plinkを使ったGWAS解析の演習を行います。まず、国際的なヒトゲノムプロジェクト(1000 Genome Project)により得られたシークエンスデータを公…

Trimmomaticの使い方[WGSデータのトリミング]

Trimmomaticの使い方 Trimmomaticの概要 Trimmomaticはマルチスレッド対応のトリミングツールです。 FASTQデータを入力として、アダプターや末端配列の除去に加えて、低品質リード[phredスコア]の除去が行えます。 入力ファイルとして、fastqファイルまたはg…

WGSデータの品質管理[FastQC]

FastQCの使い方 導入難易度★☆☆☆☆ 使用難易度★☆☆☆☆ このツールで何ができる? WGSデータのための必須級品質管理ツールです。 一つのツールで多様な品質情報をアウトプットしてくれます。 私の使用感 別記事で紹介したFastQ screenとFastQCを、結果を得た日の…

MultiQCで分析結果をまとめてみる。[MultiQC]

MultiQCの使い方 導入難易度★☆☆☆☆ 使用難易度★☆☆☆☆ このツールで何ができる? MultiQCは、他のバイオインフォマティクスツールで生成された結果やログファイルを要約するレポートツールです。 MultiQCを起動すると、指定されたファイルパスを検索して適合す…

複数のレファレンスゲノムへのマッピングでライブラリーDNAの組成を知る[FastQ screen]

FastQ screenの使い方 導入難易度 低い★☆☆☆☆高い 使用難易度 低い★☆☆☆☆高い このツールで何ができる? Fastqに対して、任意の数のリファレンスゲノムをマッピングしてリード数を比較することで、ライブラリーの含まれるリード数の組成を%で知ることができる…

バイオインフォマティクスのおすすめ書籍紹介

バイオインフォマティクス関連のおすすめ書籍を紹介します。 バイオインフォマティクスを勉強している中で、「参考になる本が知りたい!誰か教えて!」と思うことが頻繁にあります。専門的な分野なので書籍自体の数も多くない上に、Amazonのレビュー数も少な…

SNP情報の取得[Samtools mpileup]

Samtools mpileupの使い方 samtools, bcftools, vcftools BAMファイルから変異情報を記述したVCF (Variant Call Format)という形式のファイルをbuildします。全ゲノムスケールの様々な解析にはVCFファイルが前提となることが多いため、GWAS(ゲノムワイド関…

Qualimap2でBAMファイルのカバレッジを見る

Qualimapのコマンドラインでの使い方 バイオインフォマティクスを始めたばかりで、マッピングで出力されたBAMファイルをどうやって評価するか分からず悩んでいる人が大勢いると思います。ブログ主の場合、カバレッジを細かく知る必要があったため、マッピン…

バイオインフォマティクスのロードマップ Part1

SRA形式からBAMファイル出力までのロードマップ 記事にした作業内容について、自分のメモとして作成している図表を時折アップしていきます。 覚書程度の内容です。 Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いしま…

リファレンスゲノムへのマッピング [BWA]

BWAの使い方。 bwa mem, samtools sort, samtools index これまでに準備したファイルを使って、BWAを用いたリファレンスゲノムへのWGSデータのマッピングを行います。 今回使う主なコマンドは 1. bwa mem 2. samtools sort 3. samtools index の3つ。 Twitt…

マッピングの前準備

リファレンスゲノムのダウンロード、インデックスファイルの作成、SRAからfastqおよびfastq.gzへの変換する。 BWA index, fastq-dump, pigzの使い方。 マッピングに必要な準備としてリファレンスゲノムのダウンロード、インデックスファイルの作成、SRA形式…

SRAファイルをまとめてダウンロード [prefetch]

prefetchの使い方 複数のSRAファイルをprefetchを使って一括ダウンロードする方法を紹介します。 個々のSRAファイルは、accession numberを検索してブラウザから一つずつダウンロードすることも可能ですが、多数のデータを用いる場合に非効率的です。 そこで…

ブログの方針と自己紹介-このブログについて

はじめまして、本ブログの主のハリーくんと言います。感染症の分野で研究者をやっています。これまでウェットの実験しかやってきませんでしたが、9ヶ月ほど前からNIHへの留学を機にバイオインフォマティクスを始めました。教科書やインターネットを頼りに独…

プライバシーポリシー

当サイトに掲載している広告について 当サイトは第三者配信の広告サービス「Googleアドセンス、A8.net、Amazonアソシエイト、もしもアフィリエイト」を利用しています。 広告配信事業者は、ユーザーの興味に応じた広告を表示するために「Cookie(クッキー)…