MEGA用シーケンスファイルの扱い
fshift, mns2seq.pl

aln2mns.pl, seq2mns.pl等で作成されたMEGAの入力用シーケンスファイルは、PCに持って行ってMEGAで使うことが可能です。PCへの移行には少々のテクニックを要します。また SHeadの環境には、MEGAの入力用シーケンスファイル変換・操作する為の幾つかのスクリプトも用意されています。

MEGAへの入力に関する注意

残念な事に、現在の所MEGAはIBM-PC互換機+PC-DOS(DOS/Vでも可)という環境でのみ動きます(次のバージョンはWindows対応です)。そのため、SHeadをUnixで動かしているユーザは、MEGA使用の為のファイル転送がどうしても必要になります。PC-DOS専用機でネットワーク接続されたマシンは少ないと思われますので、一旦Windows95マシンやMacintoshに転送して(Samba, AppleTalkが使えれば簡単ですし、FTPでも可能です)、しかる後にfloppy diskでMEGAに持っていくことになるでしょう。この時注意しなければならないのは、UnixとDOS, Macintochの改行コードの差異です。特にMacintoshに転送する時はこの違いをUNIX上で変換する事が必須です。
Unixと他の機種とのファイル変換のためのツールで、よく使われるのがqkcです。ここでは、qkcを使ったファイル転送の前処理の方法を説明します。
お使いのUNIX Workstationにqkcがインストールされていない場合は、インストールして下さい。一般ユーザでもインストール可能です。

AppleTalk経由でMacintoshに持って行く時は、プロンプトから

user@host% qkc -ma ファイル名
とします。そのあと、このファイルをmvコマンドでAppleTalkで読めるディレクトリに移動して下さい。なお、Fetchで転送する場合は変換の必要はありません。これをMac上でAppleFileExchange等でDOSのfloppy diskに落すわけです。

Samba経由でWindowsに持って行く時は、プロンプトから

user@host% qkc -m ファイル名
とします。ただし、この変換は必ずしも必要ではないようです。そのあと、このファイルをWindows95のデスクトップ上に出し、Floppy diskに落します。なおFTPツールを使う時には変換は必要有りません。

Nucleotide sequenceのフレームを合わせる

MEGAは、読みこんだ核酸シーケンスをコーディング領域とみなして、アミノ酸配列への変換・コドン毎の解析・synonimous substitutionの推定などを行う機能を持ちます。この機能を使うためには、入力ファイルの各シーケンスの先頭をコドン第1位に合わせる必要があります。SHeadでは、この過程を簡便にするためにfshiftというスクリプトを用意しています。fshiftは単に各シーケンスの先頭の一塩基を削るフィルタです。
user@host% fshift ファイル名.mns
とすると、先頭塩基を削ったMEGAファイルを画面上に出力します。もし、フレームが1塩基右にずれていたとしたら、
user@host% fshift ファイル名.mns > 新ファイル名.mns
で、フレームシフトの済んだファイルをつくる事が出来ます。フレームが2塩基ずれている場合は、
user@host% fshift ファイル名.mns | fshift > 新ファイル名.mns
とします。

MEGA入力ファイルをシーケンスファイルに戻す

SHeadには、MEGA用に作ったシーケンスファイルをClustalV形式に変えるスクリプトも用意されています。このスクリプトを使う場面は少ないと思いますが、古いファイルをPHYLIPでも解析したい時などには有効でしょう。
mns2seq.plというフィルタ形式のスクリプトが、このためのツールとなります。プロンプトから、
user@host% mns2seq.pl ファイル名.mns > ファイル名.seq
と打ち込むと、目的のファイルをClustalVのシーケンスファイルに変換したファイルが作成されます。