ID登録せずに、無料で質問できる♪ 教えて!gooアプリ>>

マルチプルアラインメントの配列の相同性を視覚的に見ることができる
Sequence Logoを作成するソフトウェアのWeb Logoというものがありますが、
使い方が全く分かりません(涙)
そのWeb Logoを使って、2種類の微生物の配列を比較したいと考えています。

どのようにそのソフトウェアを用いたらいいのか、
どなたか教えてください!
お願い致します!

A 回答 (1件)

あなたのやりたい事と WebLogo でできる事とが噛み合っていないように見えます。



まず、マルチプルアラインメントというのはもっと多数の配列間で相同性を調べるものです。
2種類の微生物の配列を比較したいなら pairwise alignment で十分だと思うのですが。

http://www.ebi.ac.uk/Tools/psa/
こことか

http://blast.ncbi.nlm.nih.gov/Blast.cgi
BLAST で "Align two or more sequences" をやっても良いですし。

研究室で使っている配列解析ソフトでできる場合もあります。


次に、WebLogo は BoxShade や ESPript のようにマルチプルアラインメントを行なった後のデータの加工に使うサービスですから、あらかじめ ClustalW 等でアラインメントを行なっておかなくてはなりません。

最後に、WebLogo は多数の相同性の高い配列から一般に言われるコンセンサス配列よりも詳しく塩基やアミノ酸残基の配列の傾向を抽出してくれます。そのためには比較する配列が多い方が良いようで、2つの配列では一致する塩基やアミノ酸残基のみが表示されるだけになってしまいます。その程度の情報でいいなら、既に書いた通り pairwise alignment で十分得られます。


結論としては pairwise alignment をやってください、となります。
どうしても WebLogo が使いたければ、WebLogo の examples で "Edit Logo" ボタンを押してどんなデータやパラメータが入力されているかを見る事と、ヘルプページを見ながら examples のパラメータをいじってロゴがどう変わるかを見て勉強するのが早道な気がします。

examples
http://weblogo.berkeley.edu/examples.html

help
http://weblogo.berkeley.edu/info.html
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Qgrepで検索文字列が完全一致した行だけ取り出す方法

grepの文字列検索で検索文字列が単語として、完全一致した行だけ取り出す方法はないでしょうか?

通常は
grep hoge hoge.txt

と打つと、hogeが含まれる行が出力されますが、今回は含まれる行ではなくて完全に文字列が一致した行だけ取り出したいのです。

例えばhoge.txtの中に
cc ghoge
kkl hogem
jjll hoge
という3行があったとしたら最後の行でhogeという文字が空白で区切られた行だけ取り出したいのです。

何かよい方法があれば教えてください

Aベストアンサー

-w オプションじゃだめですか?

参考URL:http://www.linux.or.jp/JM/html/GNU_grep/man1/grep.1.html

Qマイクロ(μ)の文字を半角で出すには?

マイクログラム  μg  とか
マイクロリットル μL
の表記をするときに、マイクロの文字を半角で出す良い方法はありませんか?
(上の表記は全角で打っています)
半角のmをsymbolフォントにするととりあえず表示できるのですが、パソコンを変えると表示できなかったり(白い四角になってしまう)mにもどってミリと間違えたりして使いにくいのです。
みなさんどうされていますか?

Aベストアンサー

半角(1バイト)で表そうと思ったら,やはりフォントに依存せざるを得ません。
論文投稿というのは,プリントアウトしたものを投稿するのでしょうか。
であれば,Wordなどフォントが指定できるアプリケーションで,フォントをTimes New Roman Greekなどギリシャ文字を含むものに設定して,Altキーを押しっぱなしにしながら,テンキーで0236と打つと出ます。
(もちろん,symbolフォントのmでも出ます。)
テキストファイルによる投稿が求められ,かつ日本語や英語とμの文字とが混在するのであれば,いっそのことTeXを使うという方法もありますね(投稿規定に許されていれば)。

ホームページでも,自分が作るページなどでフォントの指定ができるのなら,同様の方法が使えます。
ここ(教えて!Goo/OKWeb)や一般の掲示板などでは,フォント指定はできませんので,全角(JISの2バイト文字)のμを使うのが無難でしょう。

Q脱イオン水、MilliQ、蒸留水 の違いを教えて下さい

こんにちは。お世話になります。

バイオ、生化学系の実験に従事しているものですが「水」について教えて下さい。

水道水、脱イオン水、MilliQ、蒸留水(二段蒸留水)、超純水の違いを教えて下さい。
お互いの関係などありましたら(○○を~すると△△になる等)教えていただけると
わかりやすいかもしれません。

また、実験内容によってはエンドトキシンを気にする実験もありますが、エンドトキシンフリーの水を使う場合はどれを選べばよいのでしょうか?
動物細胞培養用に使う場合はどの水を選べばよいのでしょうか?

よろしくお願いいたします。

Aベストアンサー

pinokoBBさん、こんにちは。

バイオ・生化学関係に用いられる水は水道水をプレフィルターを通し、イオン交換・蒸留・逆浸透法、限外濾過などを複数回組み合わせて生成します。

プレフィルターは鉄さびや大き目のゴミを取り除くに用います。

イオン交換法は酸性・強アルカリ性の樹脂を通し、イオン化合物を除く方法でこれを行った水がイオン交換水(脱イオン水)です。水の純度の評価には比抵抗を用いますが、およそ数百kΩ・cmの水が得られます。この段階で除けるのはイオン化合物だけで有機物・微生物は除けません。

蒸留法は水を蒸留することで不純物を除く方法です。イオン交換法と組み合わせて2回蒸留することが一般的です。一般的な2次蒸留水の比抵抗は数MΩ・cmでバイオ・生化学関係には十分な純度です。動物培養細胞にも使用可能です。エンドトキシンも完全にフリーとまではいかないけれどもある程度の除去はできています。蒸留法は多くの不純物を除去可能ですが100度付近の沸点を持つ物質は除けません。

逆浸透法は半透膜に圧力をかけて精製する方法です。

限外濾過法は限外濾過膜を通す方法です。孔径は半透膜が数十nmに対し、限外濾過膜は数nmです。それゆえ、数kDa以上の分子であれば、限外濾過法で除けますので、エンドトキシンやRNaseなども除去できます。本当にエンドトキシンフリーな水が必要でしたら限外濾過法を行った水が必須です。ただ、普通のCOSとかHEKとかの動物細胞培養でしたら2次蒸留水でも十分です。蛍光検出用のマイクロアレイなんかは限外濾過水が必須なようです。

超純水は十数MΩ・cmの水のことです。MilliQはミリポア社の超純水装置を用いて作った水で比抵抗は15MΩ・cm以上と高純度の水です。MilliQに関してはイオン交換樹脂を通し、逆浸透法、限外濾過法を用いて精製しているようです。

>また、実験内容によってはエンドトキシンを気にする実験もありますが、エンドトキシンフリーの水を使う場合はどれを選べばよいのでしょうか?
これに関しては上で書いたように限外濾過膜で精製した水です。MilliQが当てはまるでしょう。(超純水も一般的には限外濾過をしているのでこれも当てはまりますかね。)

>動物細胞培養用に使う場合はどの水を選べばよいのでしょうか?
これは、2次蒸留水以上の純度があれば十分です。2次蒸留水、MilliQ水、超純水が使用できます。

ただ、水関係の装置は日頃のメンテナンスが重要でイオン交換樹脂とか水を貯めるタンク、蛇口に汚染がないかは確認する必要があります。

実験書には必ずはじめのほうに書いてあることですので、pinokoBBさん自身でなにか実験書をご参照ください。

pinokoBBさん、こんにちは。

バイオ・生化学関係に用いられる水は水道水をプレフィルターを通し、イオン交換・蒸留・逆浸透法、限外濾過などを複数回組み合わせて生成します。

プレフィルターは鉄さびや大き目のゴミを取り除くに用います。

イオン交換法は酸性・強アルカリ性の樹脂を通し、イオン化合物を除く方法でこれを行った水がイオン交換水(脱イオン水)です。水の純度の評価には比抵抗を用いますが、およそ数百kΩ・cmの水が得られます。この段階で除けるのはイオン化合物だけで有機物・微生物は...続きを読む

Q塩基配列の同一性(%)を計算したい

いまはWinのフリーソフトBioeditを使ってシークエンスの並べ替えをしています。

いくつかの塩基配列同士の同一性(identity)の計算をしたいのですが、いくらいじってもそれらしきものが計算できません。
相同性でネットを検索するとBLASTとかそういう結果しか出なくて、同一性で検索すると双子の同一性とかしか見つけられなくて困っています。

ひとつだけBioeditでそれらしきものとしてidentity matrixという表がでて(まるで総当たり戦のような表)が出ましたが、数値が0.280とか0.180とかで、この数値の意味も分からなく使えません。

どなたか
bioeidtで同一性の算出方法をご存知の方教えてください。
または、ネットで(配列を送ったら)計算できる場所をご存知のかた教えてください。

Aベストアンサー

bioeditは使用したことがないので分かりませんが、参考リンク先でBLASTエンジンを用いてウェブ上でアラインメントを作れます。その際にIdentityも計算してくれます。

参考URL:http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qawkを用いて、特定の文字を含む以下の行を抜き出す

件名にあるように
awkを用いて、特定の文字を含む以下の行を抜き出したいのですが
どのようにしたらよいでしょうか?

具体的には
#cat text
aaaa
bbb ccc
<exe> aa
xxxxx vvvv
・・・

というようなファイルtextがあるとき
<exe> 以下の行すべてを抜き出したいです。
ご教授お願いします。

Aベストアンサー

awk '/<exe>/,0' text

でいけるかと。
<exe> が第一フィールドにあるときだけとかいう
条件があるなら

awk '$1~/<exe>/,0' text

Qエクセルで、条件に一致した行を別のセルに抜き出す方法

エクセルで、指定した条件に一致するセルを含む行をすべて抜き出す方法が知りたいです。

たとえば、

<A列> <B列> <C列>
7/1 りんご 100円
7/2 ぶどう 200円
7/2 すいか 300円
7/3 みかん 100円

このような表があって、100円を含む行をそのままの形で、
別のセル(同じシート内)に抜き出したいのですが。

7/1 りんご 100円
7/3 みかん 100円

抽出するだけならオートフィルターでもできますが、
抽出結果を自動的に、別の場所に、常に表示させておきたいのです。

初歩的な質問だと思いますが、検索しても分からなかったので、よろしくお願いします。

Aベストアンサー

同じ質問が結構よく出てますが、そんなに初歩的でもありません
別シートのA1セルに「100円」と入力し、そのシートの任意のセルに以下の式を貼り付けて下さい。後は、下方向、右方向にコピー。
日付のセル書式は「日付」形式に再設定してください

=IF(COUNTIF(Sheet1!$C:$C,$A$1)>=ROW(A1),INDEX(Sheet1!A:A,LARGE(INDEX((Sheet1!$C$1:$C$500=$A$1)*ROW(Sheet1!$C$1:$C$500),),COUNTIF(Sheet1!$C:$C,$A$1)-ROW(A1)+1)),"")

データ範囲は500行までとしていますが、必要に応じて変更して下さい

Qエクセル コピーしたデータを1行おきに貼り付け

エクセル2003を使っております。
コピーしたデータを1行おきに貼り付けたいのですがやり方がわかりません。あと、1つのセルに対して2行ごとに結合したいのですがどのようにすればいいのか。教えてください。よろしくお願いします。

Aベストアンサー

>1行おきに空白があるデータがありまして、それにコピーしたデータ
を貼り付けたいのです。
あいまいにならないように、実例を質問に挙げること。
例えば
コピー先 -は空白行を示す(1)は行番号
A列
(1)12
(2)ー
(3)15
(4)ー
(5)8
(6)ー
(7)5
ーー
(A)上記のーのセルに
(B)1回の操作で
貼り付けたいのだな。
ーー
ここへコピー元はどういうデータですか。
D2:D8に(-は空白セル)
a

b

c

d
なら
D2:D8をコピー
A2を選択
編集ー形式を選択して貼り付け
空白を無視する、にチェック
で貼り付け。
ーーー
結果
12
a
15
b
8
c
5
d
こんなことか?。質問の書き方をむしろ勉強してほしい。


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング