Last Modified:

Reference manual of SHead


Changes

Alphabetical List

A |B |C |D |E |F |G |H |I |J |K |L |M |N |O |P |R |S |T |U |V
- A -
aln2fig.pl <アライメントされた配列のfigure化/フィルタ>

標準入力から読み込んだ .aln ファイルから、配列を 抽出し、あらかじめオプションで指定した名前の配列と比較、同 一部を . 、ギャップを - で表示し、配列長を含めて図のような 形で出力する。比較元の配列(一番上に表示される)は -r オプシ ョンで指定するが、必ず指定しなければならない。配列くぎりを どうするかを決定できる(defaultは10づつくぎる)。また、配列 名を長くとることもできる。

Usage: aln2fig.pl -r reference_sequence [-c|n|w#]phy_file
                    -c: divided in codon length
                    -n: not divided
                    -w: define width of the name coloum 
aln2mns.pl <ClustalV形式→MEGA形式のコンバータ/フィルタ>

標準入力から読み込んだ.alnファイルを、MEGA形式のアライ メントデータ入力ファイルに変換する。処理データがアミノ酸配 列の場合、オプション -a を使用する。

Usage: aln2mns.pl [-a] MEGA_file
            option: -a convert an amino acid sequence.
            If you have mac-formated Clustal file only:
             qkc -Ou filename | aln2mns.pl > MEGA_file
aln2phy.pl <ClustalV形式→PHYLIP形式のコンバータ/フィルタ>

標準入力から読み込んだ.alnファイルを、PHYLIP形式のアライ メントデータ入力ファイルに変換する。現バージョンのオプショ ンはない。

Usage: aln2phy.pl aln_file >phy_file
            If you have mac-formated sequence file only:
             qkc -Ou filename | aln2phy.pl > phy_file
aln2seq.pl <ClustalV形式→FASTA形式のコンバータ/フィルタ>

標準入力から読み込んだ.alnファイルを、FASTA形式の多重配 列ファイルに変換する。オプション -DDBJ をつけると、DDBJ 等で要求される 小文字表記のファイルとなる。

Usage: aln2seq.pl [-DDBJ] seq_file
                       -DDBJ represents a DDBJ form of FASTA format
aln2snap.pl <ClustalV形式→Snap形式のコンバータ/フィルタ>

標準入力から読み込んだ.alnファイルを、Snapのテーブルフ ァイルに変換する。Snapは、非同義/同義置換の推定ツール のため、このフィルタも塩基配列データ以外は受け付けない ように作られている。現バージョンのオプションはない。

Usage: aln2snap.pl table_file
alngrep.pl <アライメントファイル中のデータ検索/フィルタ>

標準入力から読み込んだ.alnファイル中の配列データを、正 規表現にしたがって検索し、条件に一致した配列からなる新たな アライメントファイルを生成する。grepのアライメントファイル 版として開発された。検索は通常、配列名に対して行なわれるが、 オプション -s をつけると配列そのものを検索する。出力形式は、 ClustalVのアライメント形式(デフォルト)と配列名のみのリスト (オプション -lで指定)を選択できる。出力の際、配列は名前に よって自動的に並び変えられるが、オプション -u でこの機能を 無効にすることも可能である。検索は正規表現で行なう が、オプション -fに続けてファイル名を書くことで配列名のリ ストで置き換えることができる。また、オプション -v を指定す ると、条件にマッチしない配列のみを抽出する。

Usage: alngrep.pl [-v][-s][-l][-u][-flistfile] [reg_exp] output
               option: -v Invert the sense of matching, to select
                          non-matching sequences.
                       -s search a sequence pattern.
                       -l output a list file instead of an alignment file.
                       -f search from the list file. 
                          Causion! No space needs between -f and filename.
                       -u unsort the output sequences
alnslate.pl <アライメントファイルの翻訳(アミノ酸配列化)/フィルタ>

標準入力から読み込んだ.alnファイルを翻訳し、アミノ酸配 列に直したのち、.aln形式に整形して標準出力に出力する。 alnslate.plは、入力ファイルの配列先頭部がコドンフレームか らずれているときのために、フレームシフトのためのオプション を持つ。-s1は一塩基、-s2は二塩基後ろから翻訳を始める。

さらに詳しい説明

99/10/29 -> ver2.0

  1. -d オプションの追加: DNAシーケンスとの比較に使用する。
  2. ギャップ処理の変更:1塩基のギャップを表現するようにした。

Usage: alnslate.pl [-s1|2] output
               option: -s flame-shift 1 or 2 base
- B -
boottree.pl <PHYLIPによるブートストラップの支援/一般型ツール>

PHYLIPの consense の作る treefile (consensus bootstrap tree) を実際のtreeと比較して、実際のtreeにbootstrap probabilityを 付加する。実ツリーファイル、コンセンサスツリーファイル 名をそれぞれ第一引数、第二引数として指定する。結果は、 実ツリーファイル名に "_b.tre" をつけたファイルに出力さ れる。標準出力には、実行ステータスが出力される。

Usage: boottree.pl real-treefile
	 consense-treefile
boxcut.pl <テキストファイルを矩形に切り取る/標準出力ツール>

指定したテキストファイルの座標に囲まれた部分を切り取っ て、標準出力にプリントする。ファイルの指定は第一引数で、左 上の座標を第二/第三引数で(列/行の順)、右下の座標を第四/ 第五引数で指定する。

Usage: boxcut.pl file_name 左上列数 左上行数 右下列数 左下列数
boxpaste.pl <テキストファイルに矩形データを挿入する/標準出力ツール>

指定したテキストファイルの任意の座標に、別のファイルを 矩形状に挿入する。boxcut.plの逆を行な うと考えてよい。対象ファイルを第一引数に、挿入ファイルを第 二引数に、挿入座標を第三/第四引数に(列/行の順)指定する。 結果は標準出力にプリントされる。

Usage: boxpaste.pl file paste X Y
- C -
- E -
exonuc.pl <アライメントデータに対するExonuclease/フィルタ>

ClustalWの出力するアライメントファイル中の配列を一部削 除したいときに用いるフィルタ。引数として、削除したい塩基数 を指定すると、あたかもexonuclease処理をしたようにすべての配列の 5'末端から指定した塩基数だけを取り除く。exonuc.plには非常に多機 能なオプション(-で指定)があり、これによって「削る末端の指定」 「塩基数でなくコドン数での指定」「塩基数でなく位置による指定」 「位置のオフセット値の指定」などが可能となる。以下にオプションを あげる。

Usage: exonuc.pl [-5|-3 -c -p[offset]] number < ファイル名.aln
- F -
fshift <アライメントデータのフレームシフト/フィルタ>

ClustalWの出力するアライメントファイル中の配列をフレー ムシフトさせて、配列の先頭をコドン区切りに合わせたい時に使用する フィルタ。exonuc.pl 1

と同じ動作を、引数な しで実行する。つまり、単に全ての配列から5’端の一塩基を除くだけ である。2つずらしたいときには、パイプ処理で2回実行させるように 設計されている。
Usage: fshift < ファイル名.aln
- H -
hetspec.pl <塩基またはアミノ酸サイト毎のheterogeneityの計算>

アライメントを取った配列データの各サイトにおける、変異 の多様度を"heterogeneity"として計算する。入力ファイルはClustalW の出力ファイル。結果は、入力ファイル名に拡張子 .hetをつけたファイ ルに出力される。

Usage: hetspec.pl aln_file

- L -
ligase.pl <電子的リガーゼ>

複数のClustalW形式アライメントファイルを、入力した順序 で結合して、一つのアライメントファイルにする。結果は標準出力に出 力される。

Usage: ligase.pl  aln_file aln_file [..]

- M -
mdivide.pl <距離行列の除算>

入力された2つのMEGA形式距離行列ファイルを除算して、結 果をMEGA形式で返す。除算は 第1引数/第2引数の形で行われる。 第3引数にリストファイルを与えることによって、 特定の要素だけを抽出して計算させる機能を持つ。結果は、 標準出力に出される。

Usage: mdivide.pl syn-file nonsyn-file [listfile]

mdx2dat.pl <MEGA型距離行列を表計算ソフトで読める形に>

MEGA形式の距離行列を、DAT形式(タブ区切りのデータベー スファイル・Excel等で読み込める)に変換するフィルタ。結果は標準出 力に出される。

Usage: mdx2dat.pl < MEGA-distance_matrix

mdx2pdx.pl <MEGA型距離行列をPhylip形式に>

MEGA形式の距離行列を、Phylip形式に変換するフィルタ。 結果は標準出力に出される。

Usage: mdx2pdx.pl < MEGA-distance_matrix

mdx2send.pl <MEGA型距離行列をSEND形式に>

MEGA形式の距離行列を、SEND形式に変換するフィルタ。 結果は標準出力に出される。

Usage: mdx2send.pl < MEGA-distance_matrix

mdx2txt.pl <MEGA型距離行列をテキスト閲覧可能な行列に>

MEGA形式の距離行列を、テキスト形式に変換するフィルタ。 結果は直接、または表計算ソフトを介してプリントアウトして、論文等 の図表として活用できる。

Usage: mdx2txt.pl < MEGA-distance_matrix

mdxrange.pl <MEGA形式の距離行列の最小値と最大値を求める>

MEGA形式の距離行列の各値のうち、最大と最小の値を求める。 第2引数としてリストファイルを入力することで、限られた要素群の中 の最小/最大値を求めることが可能。 結果は標準出力に出される。

Usage: mdxrange.pl matrix_file [list_file]

mdxxlist.pl <MEGA形式の距離行列の特定の要素を抽出>

MEGA形式の距離行列から、リストファイルに指定した要素だ けを抽出し、新たな距離行列を作成する。 結果は標準出力に出される。

Usage: meandiv.pl matrix_file list_file

meandiv.pl <距離行列の平均を計算する>

MEGA形式の距離行列の、加重平均と標準誤差を計算する。 通常nucleotide diversityの計算に用いられる。 第2引数としてリストファイルを与えることで、 特定の要素間のみで計算を行う子とが可能。

Usage: meandiv.pl matrix_file [list_file]

mns2seq.pl <MEGA形式のアライメントファイルをFASTA形式に>

MEGAのデータ入力につかう配列ファイルを、FASTA形式にする フィルタ。結果は標準出力に出される。

mns2seq.pl MEGA_file >seq_file

- P -
pdx2mdx.pl <PHYLIP形式の距離行列をMEGA形式に>

PHYLIPの出す距離行列ファイルをMEGA形式に変換するフィルタ。 距離行列の計算をPHYLIPに任せた場合、このフィルタを使うことで SHeadの他のツールを利用できるようになる。結果は標準出力に出される。

Usage: pdx2mdx.pl < phylip-distance_matrix

- R -
rst2aln.pl <PAML/rst出力ファイルをClustalW形式に>

Ziheng Yangの開発した最尤法計算パッケージ PAML の出力す る配列ファイル(rst)をClustalW形式のアライメントファイルに変換す るフィルタ。結果は標準出力に出される。

rst2aln.pl < rst_file > aln_file

- S -
scandist.pl <塩基置換数のウインドウスキャン>

指定した2つの配列間の任意の領域における塩基置換数を推 定し、領域をずらして計算を続けることによって配列の全長にわたる塩 基置換の変移を調べるツール。塩基置換推定法としては、Kimura 2 parameter法、Nei & Gojobori の同義置換数、非同義置換数を選べる (それぞれオプション -d, -s -n で指定)。 また、-wに引き続いて数字を入力することで領域の幅(window width)、 -pに引き続いて数字を入力することでずらすコドン数(塩基数でないこ とに注意)を指定できる。-hでヘルプメッセージが出力される。 なお、本ツールはオプションが複雑だがフィルタの形式を取っており、 データの入力、出力は標準入出力のリダイレクトやパイプ処理で行う。

Usage: scandist.pl [-d|s|n] [-w#] [-p#] name1 name2 <
aln_file > scanning_list_data

seq2mns.pl <FASTA形式をMEGA形式に>

FASTA形式のファイルをMEGA形式に変換するフィルタ。これで 変換するとアライメントを取らないので注意すること

seq2mns.pl seq_file > MEGA_file

seq2phy.pl <FASTA形式をPHYLIP形式に>

FASTA形式のファイルをPHYLIP形式に変換するフィルタ。これで 変換するとアライメントを取らないので注意すること

seq2phy.pl seq_file > MEGA_file

seqasm.pl

配列だけが書き込まれた個々のシーケンスファイルを統合し て、FASTA形式のファイルを構築するツール。個々のファイル名が、配 列名として採用される。入力するファイルは、シーケンサが出すテキス トファイル(配列だけが書かれているもの)と、GenBank形式のファイル が可能(一部読めないフィールドがある)。seqasm.plは、配列を大文字 で出力するが、これはDDBJの大量サブミッションの指定と異なる。その 対応として、ver.1.5から-DDBJオプションが加わった。これをつけると、 配列が小文字で出力される。結果は標準出力に出されるので、そのまま、 clustalwにデータを投入することが可能。

seqasm.pl sequence [sequence ..]

00/12/22 -> ver1.7

  1. 60塩基づつ整形して折り返すようにした
seqcount.pl

FASTA形式のファイルの各配列要素の配列長を数えてリストする。 出力は、Excel等で利用できるスペース区切りのデータベースで、配列 bpの順 に並んでいる。

Usage: seqcount.pl seq_file

sitecount.pl <サイト毎の塩基/残基の使用数の計算>

ClustalWのアライメントファイルの各サイトを見て、使われ ている塩基/残基の種類と数を数える。入力は塩基配列、アミノ酸配列 の両方に対応している。

Usage: sitecount.pl file_name

- U -
uniqlist.pl <同一シーケンスの排除>

ClustalWのアライメントファイルを見て、同一の配列を排除 する。ユニークな配列のみで構成されたアライメントファイルを、拡張 子 .uniq.aln に、その配列名のリストファイルを .uniq.listに書き込 む。また、標準出力には、どの配列名がが同一の配列を持っているかを 表示する。

Usage: uniqlist.pl aln_file [ >groups]

- V -


What changes in:

Release 1.4.
Add command "seqcount.pl ver.1.0"
Release 1.3.
Copyright © 1998, 1999, 2000 T. Shiino
Maintained by SHIINO, Teiichiro Ph.D.