バイオインフォマティクスでゲノムワイド関連解析(GWAS)

バイオインフォマティクスを頑張っている方が、本ブログの内容を真似することで、自分のデータで解析ができる情報を提供することが目標です! 今はGATKの解説をメインテーマにしています。

MENU

ブログの方針と自己紹介-このブログについて

はじめまして、本ブログの主のハリーくんと言います。感染症の分野で研究者をやっています。これまでウェットの実験しかやってきませんでしたが、9ヶ月ほど前からNIHへの留学を機にバイオインフォマティクスを始めました。教科書やインターネットを頼りに独学で取り組む中で、具体的な解析例を盛り込んだHow toの情報が少なく、自身の研究に当てはめるために大変苦労しました。そこで、このブログでは初めての人でも手を動かしながら進めていけるように、工程X具体例の形式で、これまで習得してきた内容やこれから勉強する解析手法を紹介していきます。

まだまだ勉強中の身でブログの進め方も手探りですが、これからバイオインフォマティクスを始められる方のお役に少しでも立てる様に頑張りますので、よろしくお願いします。

 

当面の目標として、パブリックデータを使いゲノムデータのダウンロード、クオリティコントロール、リファレンスゲノムへのマッピング、一塩基多型(SNP)の取得、全ゲノムスケールでの系統解析までを順番にやっていきたいと考えています。現在、皆さんと一緒に進めていくちょうど良い解析対象(病原体)を選定中なので、合間に個別の便利なツールやGWASに関する論文の紹介等を挟みつつ進めていきます。良い材料が見つかれば、量的形質解析もやりたいと思います。

 

私自身の研究テーマは、GWASを使って病原体の遺伝的多様性を捉え、病原体の持つ毒性因子を見つけることです。これまでに蓄積されたゲノムデータを使って、さまざまな疾患を対象としたヒトの疾患関連遺伝子の解析は広く行われていますが、病原体のゲノム集団構造に関する研究は大きく遅れています。いずれの科学分野においても、これからますます重要な研究テーマとなるであろう「多様性(Variation)」を理解することで、新たな領域を開拓していければといいな考えながら日々を過ごしています。