アライメントと関連ファイルの変換
ClustalW, aln2mns.pl, aln2phy.pl, seq2mns.pl, seq2phy.pl

SHeadの環境は、ClustalWを使ってアライメントを行うように設計されています(ユーザで独自に使用したいツールがある場合は作者にご連絡を)。SHeadでは、ClustalW関連のファイル(入力用シーケンスファイル、出力されたアライメントファイル)を進化的解析ツールに読み込める形式に変更する4つのスクリプトを用意しています。

ClustalWの使い方

お使いのWorkstationにClustalWがインストールしてあれば、SHeadの環境でアライメントが可能です(入手先ftp.bio.indiana.edu/molbio/align)。seqasm.plで作ったシーケンスファイル(ファイル名.seq)があるとき、ClustalWでのアライメントの一番簡単な方法は以下の通りです。
user@host% clustalw ファイル名.seq
成功すれば、カレントディレクトリに ファイル名.aln というファイルが出来ます。これがアライメントファイルです。
アライメントの済んだデータは、エディタ等を用いて御自分でおかしな所が無いかご確認下さる事をお奨めします。アライメントツールのだす答えは、実際のものと明らかに異なる事があります。

アライメントファイルをMEGA形式に変更する

ClustalWで作ったアライメントファイルは、そのまま解析ツールに使う事は出来ません。SHeadは、PHYLIPMEGAという2つの有名な進化学的解析ツールを用いるようにデザインされています。このうち、アライメントファイルをMEGAで使えるようにするには、aln2mns.plというフィルタ形式のスクリプトを使います。プロンプトから、
user@host% aln2mns.pl ファイル名.aln
と打ち込んで下さい。
aln2mns.plはフィルタなので、入力に標準入力のリダイレクトやパイプを用いる事も出来ますが、MEGAのシーケンスファイルはデータ名を記述する項目があり、aln2mns.plではここにアライメントファイルの名前を入れるので、上記のようにした方が良いと思います。
リターンキーを押すと、画面上にMEGA用データが出力されます。これをファイルにする為には、以下のようにリダイレクトしてください。
user@host% aln2mns.pl ファイル名.aln > 名前.mns
拡張子.mnsは必須では有りませんが、SHeadでの推奨です。

アライメントファイルをPHYLIP形式に変更する

ClustalWで作ったアライメントファイルは、そのまま解析ツールに使う事は出来ません。SHeadは、PHYLIPMEGAという2つの有名な進化学的解析ツールを用いるようにデザインされています。このうち、アライメントファイルをPHYLIPで使えるようにするには、aln2phy.plというフィルタ形式のスクリプトを使います。プロンプトから、
user@host% aln2phy.pl ファイル名.aln
と打ち込んで下さい。
aln2phy.plはフィルタなので、入力は標準入力のリダイレクトやパイプでも構いません。
user@host% aln2phy.pl < ファイル名.aln
user@host% cat ファイル名.aln | aln2phy.pl
リターンキーを押すと、画面上にPHYLIP用データが出力されます。これをファイルにする為には、以下のようにリダイレクトしてください。
user@host% aln2phy.pl ファイル名.aln > 名前.phy
拡張子.phyは必須では有りませんが、SHeadでの推奨です。PHYLIPでは入力はすべてinfileなので、infileとしても良いでしょう。

シーケンスファイルをMEGA形式に変更する

seqasm.plで作った、ClustalW用の入力ファイル(シーケンスファイル)に、明らかにアライメントの必要が無い時は、seq2mns.plを用いて時間のかかるClustalWを省略する事ができます。seqasm.plでアセンブルを済ませたシーケンスファイル(ファイル名.seq)がある時、プロンプトから、
user@host% seq2mns.pl ファイル名.seq > ファイル名.mns
と打ち込む事で、シーケンスファイルを直接MEGAに持っていくことができます。
もしアセンブル前のデータしか無い時は、以下の様にする事もできます。まず、生データの置かれたディレクトリにカレントディレクトリからどうアクセスするかを確認します。ここでは、ls ../data/ で生データが確認できる事にします。そこで、
user@host% seqasm.pl ../data/* | seq2mns.pl > ファイル名.mns
とすると、一気にMEGA用ファイルが作成されます。ただし、この場合MEGA用ファイルにはデータ名の記述がなくなります。

シーケンスファイルをPHYLIP形式に変更する

seqasm.plで作った、ClustalW用の入力ファイル(シーケンスファイル)に、明らかにアライメントの必要が無い時は、seq2phy.plを用いて時間のかかるClustalWを省略する事ができます。seqasm.plでアセンブルを済ませたシーケンスファイル(ファイル名.seq)がある時、プロンプトから、
user@host% seq2phy.pl ファイル名.seq > ファイル名.phy
と打ち込む事で、シーケンスファイルを直接PHYLIPに持っていくことができます。
もしアセンブル前のデータしか無い時は、以下の様にする事もできます。まず、生データの置かれたディレクトリにカレントディレクトリからどうアクセスするかを確認します。ここでは、ls ../data/ で生データが確認できる事にします。そこで、
user@host% seqasm.pl ../data/* | seq2phy.pl > ファイル名.phy
とすると、一気にPHYLIP用ファイルが作成されます。