バイオインフォマティクスでゲノムワイド関連解析(GWAS)

バイオインフォマティクスを頑張っている方が、本ブログの内容を真似することで、自分のデータで解析ができる情報を提供することが目標です! 今はGATKの解説をメインテーマにしています。

MENU

dos2unixの使い方-知らないと損するツール集 Part1 [dos2unix]

ゲノム解析にちょこっと役立つ、でも知らないと損するツールを箇条書き程度の情報量で紹介します。

dos2unix


Twitterで記事の更新をお知らせしているので、興味を持たれた方は是非フォローをお願いします。

CRLFテキストをUnix形式に変換するツール

  • ワードやエクセルで作成したテキストファイルをプログラムで使用すると、改行コードがWindow用のCRLF形式で保存されているためにエラーが出ることが頻繁にある。

  • dos2unixを使って、ファイル形式をASCII形式に変換する。

使用方法の例
インストールする。

conda install -c conda-forge dos2unix 


入力ファイルにエラーが出た際に、fileコマンドで元のファイル形式を確認する。

file XXXX.txt
ASCII text, with CRLF line terminators


のようにCRLFとなっているので、これを変換する。

dos2unix XXX.txt


これだけで、ASCII textに変換される。

今回はこれで終わりです。

よければ他の記事のも見ていってください。


バイオインフォマティクス関連の書籍紹介は↓こちら eupatho-bioinfomatics.hatenablog.com