gooポイントが当たる質問投稿キャンペーン>>

ある生物のある遺伝子のDNA塩基配列があり、既知の生物種の配列と「99%以上の確率で相同性を示した」(ので同じ生物種か極めて近縁の種である)と書いてある場合、具体的にはどのような計算をしているのでしょうか?

例えば、長さ900塩基のうち、調べたい配列と既知の配列が892個は一致していたとします。この場合は99.1%の一致率(同一性?)ですが、「相同性」ということとは違いますか?文献をみていると、塩基が99.1%で一致していたことを「塩基配列で99.1%のホモロジーであった」と書いてあるものがあったのですが、ホモロジー・相同性とはそういう用語なのでしょうか?「相同性は質的性質(ある/なし)である」という説明も見たことがあって、そうすると単純なパーセンテージで示せないと思うのですが…。

よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

● 99%以上の確率で相同性を示した


というのは、おそらく、ある配列Aに類似した配列をデータベースの中を検索し、その結果見つかった既知の生物種の配列A’が、配列Aと偶然一致する確率が 0.01よりも小さいことを意味しています。この場合の確率というのは、あるデータベースを検索した時の結果を評価する値です。具体的にどのような計算をしているのかは、私はよく知りません。以下の参照URLの Expect (E) valueについて調べることは、参考になるかもしれません。

●長さ900塩基のうち、調べたい配列と既知の配列が892個は一致していた
というのは、二つの配列間(AとA’)の関係についてだけ、述べています(データベースの検索結果とは関係なく)。二つの配列を比べた時、塩基配列間で99.1%が一致しており、これらは配列類似性が高いという使い方をしますね。

●相同性は質的性質(ある/なし)
二つの遺伝子が「相同である」というのは、二つの遺伝子が「共通の遺伝子から派生している」という意味です。共通遺伝子から派生した遺伝子群は、配列類似性が高い場合が多いですが、その逆は言えません。つまり、二つの遺伝子間の配列類似性が高くても、共通遺伝子から派生した遺伝子(相同性である)とは限りません。配列類似性が高くても、別々の独立した遺伝子からそれぞれが派生した場合もありえます。

参考URL:http://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web& …
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
やはり統計的な処理を経て言っているのですね。あまり得意な分野ではないですが、教えていただいたサイトなどを読み、勉強してみます。

お礼日時:2012/10/04 21:48

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q塩基配列の同一性(%)を計算したい

いまはWinのフリーソフトBioeditを使ってシークエンスの並べ替えをしています。

いくつかの塩基配列同士の同一性(identity)の計算をしたいのですが、いくらいじってもそれらしきものが計算できません。
相同性でネットを検索するとBLASTとかそういう結果しか出なくて、同一性で検索すると双子の同一性とかしか見つけられなくて困っています。

ひとつだけBioeditでそれらしきものとしてidentity matrixという表がでて(まるで総当たり戦のような表)が出ましたが、数値が0.280とか0.180とかで、この数値の意味も分からなく使えません。

どなたか
bioeidtで同一性の算出方法をご存知の方教えてください。
または、ネットで(配列を送ったら)計算できる場所をご存知のかた教えてください。

Aベストアンサー

bioeditは使用したことがないので分かりませんが、参考リンク先でBLASTエンジンを用いてウェブ上でアラインメントを作れます。その際にIdentityも計算してくれます。

参考URL:http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi

Q塩基配列の相同性の計算方法について

こんにちは。
いま、卒業研究でウイルスゲノムの塩基配列の相同性を比較するという作業をしています。
ウイルス20株間すべての相同性を出したいのです。
いまは、Genetyxで一つ一つ計算しているのですが、とても手間がかかります。
一度に、多数の株間の相同性を計算してくれるようなフリーソフトをご存じでしたら教えていただけませんか?
よろしくお願いいたします。

Aベストアンサー

clustalW (clustalX)などでマルチプルアライメントをとり、出力形式をdistance matrixなどにしておけば一発ですが・・・

いちばん簡単な方法を紹介します。
clustalXを準備してください。(web検索で探し出して、インストールしてください。英語ページですがインストール自体はめちゃくちゃ簡単なはずなので)
ウイルスゲノム(全長どのくらい?)を全てFASTAフォーマットでひとつのファイルにまとめてください。
まずはAlignmentをとり、Treesの作成でphylip distance matrixも出力するようチェックを入れておくと、作成されたファイルはタブ区切りの相違性になっているので、相同性%に直すのも楽でしょう。

簡単にウイルスゲノムの比較と行っても、ゲノム全体とゲノム全体を比較すればいいのか、連続的に似ているところをピックアップする必要があるのか、比較した後で特異的な検出用プライマーを作成したいのか・・・など考慮すべき点はいろいろあります。なんだかおもしろそうな研究ですので、計算する過程なども楽しんでください。
いちど指導教員の先生や大学院生に方針を確認した方がよいような気がします。

clustalW (clustalX)などでマルチプルアライメントをとり、出力形式をdistance matrixなどにしておけば一発ですが・・・

いちばん簡単な方法を紹介します。
clustalXを準備してください。(web検索で探し出して、インストールしてください。英語ページですがインストール自体はめちゃくちゃ簡単なはずなので)
ウイルスゲノム(全長どのくらい?)を全てFASTAフォーマットでひとつのファイルにまとめてください。
まずはAlignmentをとり、Treesの作成でphylip distance matrixも出力するようチェックを入れ...続きを読む

Q系統樹の読み方について

系統樹の読み方について


生物学の初心者です。


系統樹で、図の下の方にこのような図がありますが

|――――| 
 0.01

(解りにくくてすみません)

どういった意味か教えてください。


距離のことを示しているということはだいたいわかりますが、

なんの距離なんでしょう?

よろしくお願い致します。

Aベストアンサー

おそらく図の説明文にスケールバーの説明はあるはずですが・・・

系統樹の種類によってスケールの正確な意味は変わってきます。
今回の場合,おそらく塩基配列かアミノ酸配列を利用した分子系統樹ではないでしょうか?
仮にそうであれば,スケールバーは「座位あたりの置換数」を意味するはずです。
(系統構築の方法によっては違う意味の場合もあり得なくはない)

つまり,系統樹上で枝の長さがスケールバーと同じ長さであれば,
その間に特定の座位で,0.01回の置換(塩基置換またはアミノ酸置換)が起こったと推定される,という意味です。
なお,普通は多数の塩基かアミノ酸情報を用います。
そうすると,例えば 1000 塩基の DNA 配列を用いたのであれば,スケールバーと同じ長さの枝の距離は 1000 x 0.01 で 10 塩基の置換が起こったと期待される進化的距離,ということになります。

注意が必要なのはこれはあくまで理論的な期待値だということです。
実際に 2 種の間が "0.01" の距離で隔てられていたからと言って 2 種の DNA 配列に 1000 塩基あたり 10 塩基の違いがあるとは限りません。
(系統樹作成時に様々な数学的補正がかかるためと思ってください)

この他にも系統樹を読み解くには落とし穴が色々とありますので,
一度なんらかの参考書を調べてみることをおすすめします。

おそらく図の説明文にスケールバーの説明はあるはずですが・・・

系統樹の種類によってスケールの正確な意味は変わってきます。
今回の場合,おそらく塩基配列かアミノ酸配列を利用した分子系統樹ではないでしょうか?
仮にそうであれば,スケールバーは「座位あたりの置換数」を意味するはずです。
(系統構築の方法によっては違う意味の場合もあり得なくはない)

つまり,系統樹上で枝の長さがスケールバーと同じ長さであれば,
その間に特定の座位で,0.01回の置換(塩基置換またはアミノ酸置換)が起こった...続きを読む

Q系統樹の見方について

現在論文を読んでいます。その論文で系統樹が示されているのですが、見方などがさっぱりわかりません。

http://www.chiringi.or.jp/k_library/kaishi/kaishi2004_1/90g2-2.gif

このような系統樹です(論文に出てきたのと似たものです)。

特に、枝分かれのところに示された数字が何を表すのかを知りたいのですが、お分かりの方いらっしゃいましたら御教授ください。

また、参考になるWEBサイトなども教えていただけたらと思います。
宜しくお願いします。

Aベストアンサー

系統樹とかって,ややこしいんですよね.

No.1の方がおっしゃっているように,枝分かれのところの数字はブートストラップのことですね.例えば80と書いてあったら,100回計算して80回同じ枝分かれが表示された,ということを示しています(1000回のうち800回かもしれません.それは図の説明の最後の方に,replicated XX timesとか書いてあると思います).

こういったデータの処理について書かれた文章は難しいので,まずは知ってる人に尋ねるのが一番ですね.
実は自分も最近始めたばかりでエラそうなことは言えません.よくわかるサイトなどあれば知りたいですね.

QW/V%とは?

オキシドールの成分に 過酸化水素(H2O2)2.5~3.5W/V%含有と記載されています。W/V%の意味が分かりません。W%なら重量パーセント、V%なら体積パーセントだと思いますがW/V%はどのような割合を示すのでしょうか。どなたか教えていただけないでしょうか。よろしくお願いいたします。

Aベストアンサー

w/v%とは、weight/volume%のことで、2.5~3.5w/v%とは、100ml中に2.5~3.5gの過酸化水素が含有されているということです。
つまり、全溶液100ml中に何gの薬液が溶けているか?
ということです。
w/v%のwはg(グラム)でvは100mlです。

Q遺伝子について

私は、大学で植物育種の研究室に配属されました。まだ勉強し始めたばかりなのですが、参考書を読んでいて、相同性の高い遺伝子で『ホモログ』と『オーソログ』というものがありますが、このふたつの違いは何でしょうか?詳しく教えていただければ嬉しいです。よろしくお願いいたします。

Aベストアンサー

http://www.msu.edu/~jhjacksn/Reports/similarity.htm
英語のサイトですがわかりやすいと思いますので紹介いたします。
ホモログ、オーソログ以外にもパラログ、アナログ、ゼノログも用いられます。

ホモログは共通の起源をもつ相同性の高い配列のことをさし、オーソログやパラログを含みます。
オーソログは共通の起源をもつ単一の遺伝子から種の分化によって出来た相同性を持つ配列をさし
パラログは遺伝子重複によりその遺伝子がコピーされて出来たものです。
Aという起源をもつB種のBとC種のCはオーソログであり
Dという起源をもE種のEとE’はパラログである。

ホモログだけでは同じ起源をもつ相同性の高い配列に過ぎず、どのように分かれたかが特定されてオーソログ、パラログと呼ばれるわけです。

ゼノログは水平伝播、アナログは異起源によるものとされます。

QDNAとゲノムDNAの違い

DNAとゲノムDNAの違いを教えてください。
遺伝子とDNAの違いはわかるのですが、上記の2つについてはわかりません。
よろしくお願いします。

Aベストアンサー

ゲノム
http://ja.wikipedia.org/wiki/%E3%82%B2%E3%83%8E%E3%83%A0

DNA
http://ja.wikipedia.org/wiki/DNA
DNAは化学的な物質名で人口に合成した化学物質でも、その化学的構造を持っていればDNAといいます。

ゲノムDNAの定義はよく分かりませんが、真核生物などはミトコンドリアなどにもDNAがあり、それと区別してゲノムDNAといえるかもしれません。また、ウイルスが感染しいて、染色体以外にDNAが存在する時、両者を区別するのにそういう表現ができると思います。

Q塩基配列のBLAST解析

シークエンス反応を通して塩基配列が決定されたものをBLAST解析して自分の精製した塩基配列がどのような遺伝子でどんな微生物に類似しているのかを同定したいのですが・・・

塩基配列をNCBIからNucleotide BLASTのトップページで入力したところ、赤いバーのようなものが多数出たページと、Max identが97%などと出てくるページと、QueryとSbjctといった特定の塩基が結合しているようなページが出ました。

これらのページのどこを見て、どのような微生物と類似しているのかを調べたらいいのかがイマイチわかりません。英語ばかりで英語苦手な自分としてはなんともわかりにくい状態です。

特にどこ見て考えたらいいのでしょうか?わかりにくい質問かもしれないですが、よろしくお願いします。

Aベストアンサー

 これはBLASTを使う上では本当に基礎的なことで、この質問は例えるなら「電卓の"2"と"+"と"3"と"="のキーを押してみたら"5"と表示されました。これはいったいどう見ればいいのでしょう」と質問するのと同じくらい、初歩的で聞くのが恥ずかしい質問です。

 いや、もちろん最初は誰だって知らないのですから質問者さんが知らないこと自体はちっとも恥ずかしいことではないのですが、それをこのような「オープンなサイトで聞く」ことが恥ずかしいことです。
 実験計画の立て方から始まって実験方法、データの解析方法、さらに考察までが「研究」です。それらのスキルはそのラボで養成しないとラボとして成立しないでしょう。即戦力だけを契約研究員でかき集めているようなラボならともかく。
 ま、ですから、そういうことは研究室の教官なり先輩にきちんと教育してもらうのが本来の姿ですし、彼らに聞くのが勉強というものです。
 こういうオープンな、回答が正しいのか間違っているのか判断しなければならないところで聞くのは、勉強の仕方としては決定的に間違っています。

 しっかり勉強して下さいね。知らないのは恥ではなく、知らないということを言えないのが恥ずかしいことです。

 ま、これだけではなんなので、簡単に説明を。オプションの設定等によって多少違うかもしれませんが。

 自分の得た配列を入力してサーチすると、まずリストが出てくるはずです。
 これはヒットした遺伝子が相同性が高い順に並んでいるリストです。
 それぞれ左端にリンクが張られているはずですが、このリンクをクリックすると、その遺伝子(報告)の全配列と文献などが出てきます。この画面はGENETYX等の遺伝子解析ソフトで直接読める形式になっています。

 で、次に赤いバーがたくさん並んだ画面になるはずです。
 これは入力した自分の遺伝子とヒットした遺伝子の位置関係を簡単に図示したものです。まあこれはあまり気にしなくて良いし、図を見れば何となく何を意味するかは判ると思うのですが・・・
 要するに、例えば自分が500bpの配列を入力して検索したとして、ヒットした配列が、その500bpを完全に含んでいるのか、途中からのデータなのか、といったことを図示しているだけです。
 その下のアライメントが詳細表示なので、別に気にする必要はありません。

 で、その下のQueryとSbjctの配列が棒で結ばれているような図ですが、Queryが入力した配列、Sbjctがヒットした配列です。その2つをアライメントを取って並べてくれたのがこの図です。
 ・・・アライメント、判ってますよね?
 棒で結ばれているのは、同じ塩基、という意味です。

 なお、BLASTでマルチプルアライメントもできるみたいなことは書いてあるのですが、オプションで見あたらないため私にはよく判りません。マルチプルアライメントはClustalWでやっているので気にしてないのもありますが。

 ちなみにDDBJのサイトから入ると、入力画面は日本語なのでまだ理解しやすいかもしれません。出力はやっぱり英語ですが。
 いろいろな検索のフロントエンドに入れるようなのですが、私はBLASTとClustalWくらいしか使わないので他はよく判りません。

 もしアライメントなどの用語が判らなければ、それこそ先輩や教官に聞いてみてください。
 聞けるのは最初の内だけです。研究室に後輩が入ってくるくらいの時期になると、それこそ今までまったく勉強せずにサボっていたのが暴露されてしまうので恥ずかしくて聞けなくなってしまいますよ。
 聞ける内に知らないことは全部聞いておくくらいの気持ちでいてください。

参考URL:http://www.ddbj.nig.ac.jp/Welcome-j.html

 これはBLASTを使う上では本当に基礎的なことで、この質問は例えるなら「電卓の"2"と"+"と"3"と"="のキーを押してみたら"5"と表示されました。これはいったいどう見ればいいのでしょう」と質問するのと同じくらい、初歩的で聞くのが恥ずかしい質問です。

 いや、もちろん最初は誰だって知らないのですから質問者さんが知らないこと自体はちっとも恥ずかしいことではないのですが、それをこのような「オープンなサイトで聞く」ことが恥ずかしいことです。
 実験計画の立て方から始まって実験方法、データの...続きを読む

Qエタノール沈殿での70%エタノールと100%エタノールの使い分け

エタノール沈殿をする際に、「70%エタノール」と「100%エタノール」を使用しますが、どうしてこの2種類の違う濃度のエタノールを使用するのか単純に疑問に思っています。
別に70%エタノールで洗浄して、もう一度70%エタノールで洗浄してもいいと思いますし、逆に両方とも100%エタノールでもいいのではないかと素人の私は思ってしまいます。
70%エタノールと100%エタノールを使い分ける意味を知っている方がおられましたら、お暇な時で結構ですので教えて頂ければ幸いです。
よろしくお願い致します。

Aベストアンサー

エタノール沈殿の原理は省いて簡単に書きます。

DNAが塩析してくる最適なエタノール濃度が70%ほどであるのです。
通常、100%エタノールをもとの液の2~2.5倍ほど加えると思います。
すると最終的にエタノールの濃度は70%ほどになるはずです。

このように最終的に70%ほどの濃度にする、ということが目的なので
最初に加えるエタノールは100%じゃないとかなり面倒なことになると思いませんか?

そして洗浄のときですが、70%エタノールではDNAは溶けません。
もちろん100%エタノールにも溶けません。

ですが、エタノール沈殿における「洗浄」というのは、余計な塩を取り除くということです。
塩は水に溶けますが、アルコールには溶けません。
なんで、洗浄の時に100%エタノールを使っても塩を溶かし込んで覗けないということになります。
70%エタノールの30%は水であるということが重要なのです。
30%の水に塩を溶かして洗浄すると想像してください。

簡単なエタノール沈殿ですが、それぞれに意味があり、かつよく考えれられてデザインさているのです。

そういうことをきちんと理解して実験することは重要だと思います。

エタノール沈殿の原理は省いて簡単に書きます。

DNAが塩析してくる最適なエタノール濃度が70%ほどであるのです。
通常、100%エタノールをもとの液の2~2.5倍ほど加えると思います。
すると最終的にエタノールの濃度は70%ほどになるはずです。

このように最終的に70%ほどの濃度にする、ということが目的なので
最初に加えるエタノールは100%じゃないとかなり面倒なことになると思いませんか?

そして洗浄のときですが、70%エタノールではDNAは溶けません。
もちろん100%エタノールにも溶けま...続きを読む

QDNA断片のシークエンス結果の読み方について

今回、実験で菌体のDNA断片の塩基配列を解析しました。

その結果、A・T・G・C の組み合わせ配列の最後に、
NNNNNNNNNNNNNNNNNNNNNNNNNNNNと、Nが多数ありました。

Blastで解析し、菌の同定は出来たのですが
このNNNNNというのがきになりました。


このNNNNNNNNNが意味していることは何か、ご存じの方がいたら教えてください。
ヨロシクお願いします。

Aベストアンサー

DNAの配列決定を行なう場合、読める配列には限りがあり、限界に近づくと決定できない塩基が増えてきます。

どの塩基か決定できなかった部分は通常Nであらわされます。
従って、Nの部分は、読めなかったシークエンスということですので、除去してからBLAST等の解析に進むのが普通です。

また、Nが連続しだす少し前の部分も、読み間違いが発生している可能性が高いので、要注意です。


人気Q&Aランキング