バイオ・データ・マイニング/BLASTで相同性検索を行う
をテンプレートにして作成
開始行:
*はじめに [#redbd380]
ここでは,''BLAST''を使って相同性検索を行います.
*相同性検索 [#x948b460]
DNAやタンパク質が進化的に共通の祖先を持つものを''相同体''...
DNAデータベースの中からクエリーとして与えられた塩基配列の...
*BLAST [#e4689043]
''BLAST''は配列をクエリーとして相同性検索を行うツールです.
BLASTには,DNAの塩基配列をクエリーとして塩基配列を検索す...
ここでは,タンパク質のアミノ酸配列をクエリーとしてアミノ...
*BLASTによる相同性検索の仕組み [#nfedeebb]
BLASTは,まず,クエリーとして与えられたタンパク質のアミノ...
情報科学の分野では ''n-gram'' と呼ばれている技術の n=3 の...
たとえば,''CDEFGHI'' というクエリー配列が与えられると,...
次に,アミノ酸置換確率行列に基づいて,生成した部分文字列...
たとえば,アミノ酸 ''I'' はアミノ酸 ''V'' と類似している...
部分文字列または類似文字列に一致する個所を,タンパク質デ...
部分文字列が一致するかどうかには有限オートマトンが使われ...
*E-value [#af09e496]
検索対象のデータベースにおいて,クエリー配列が偶然に一致...
まず,検索対称のタンパク質データベースに出現するアミノ酸...
これによって,各アミノ酸が独立に出現すると仮定したときの...
ここから,各アミノ酸が独立に出現すると仮定したときにある...
各アミノ酸が独立に出現するときにランダムに生成したアミノ...
そこで,Gumbel分布の上でスコアが [math]S[/math] 以上にな...
これが ''E-value'' です.
したがって,同じタンパク質データベースの中で比較すると,...
*タンパク質データベース [#tefe9197]
検索対象となるタンパク質データベースは,いくつかの種類が...
''nr'' は,Non-redundant を表し,色々なデータベースを統合...
''refseq'' は,Reference sequenceを表し,NCBI(アメリカの...
''SwissProt'' や ''PDB'' や ''Patent'' は,それぞれ独自に...
SwissProtは幅広い知識を注釈としてつけたもの,PDBはタンパ...
*BLASTによるタンパク質の相同性検索 [#q5e32c69]
タンパク質データベースの一つであるUniProtからタンパク質の...
UniProtからアミノ酸配列を取得する方法については,以下のペ...
-[[ClustalWでペアワイズ・アラインメントを行う>バイオ・デ...
ここでは,ヒトのヘモグロビン HBA_HUMAN のアミノ酸配列をク...
まず,''protein blast''を選択します.
#ref(./blast.png,nolink,50%)
次に,クエリーのところにUniProtから入手したFASTA形式の配...
#ref(./blast_input.png,nolink,50%)
すると,検索が実行されますが,時間がかかるので,次のよう...
#ref(./blast_searching.png,nolink,50%)
検索が終わると,結果が表示されます.
#ref(./blast_output_top.png,nolink,50%)
一番上には,サマリーとして,検索されたタンパク質の一致部...
#ref(./blast_output_summary.png,nolink,50%)
一致部分が表示され,一致部分の長さが色で表されています.
次に,検索されたタンパク質の名前,最大スコア,総合スコア...
#ref(./blast_output_descriptions,nolink.png,50%)
最後に,検索されたタンパク質のそれぞれについて,ペアワイ...
#ref(./blast_output_alignments.png,nolink,50%)
ClustalWのアラインメント結果とは異なり,クエリー配列と検...
アミノ酸置換確率が高く,類似しているアミノ酸の所には''+''...
*演習 [#h7e0322a]
UniProtからヒトのアミラーゼ AMY1_HUMAN のアミノ酸配列を入...
ただし,アミラーゼは配列長が長いので,丸ごと検索すると,E...
一部分だけを取り出して(一部分を削除して)検索してみまし...
アミノ酸配列がどのくらいの長さだとE-valueがどのくらいにな...
*参考文献 [#a297d100]
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
-6章 類似配列のデータベース検索
終了行:
*はじめに [#redbd380]
ここでは,''BLAST''を使って相同性検索を行います.
*相同性検索 [#x948b460]
DNAやタンパク質が進化的に共通の祖先を持つものを''相同体''...
DNAデータベースの中からクエリーとして与えられた塩基配列の...
*BLAST [#e4689043]
''BLAST''は配列をクエリーとして相同性検索を行うツールです.
BLASTには,DNAの塩基配列をクエリーとして塩基配列を検索す...
ここでは,タンパク質のアミノ酸配列をクエリーとしてアミノ...
*BLASTによる相同性検索の仕組み [#nfedeebb]
BLASTは,まず,クエリーとして与えられたタンパク質のアミノ...
情報科学の分野では ''n-gram'' と呼ばれている技術の n=3 の...
たとえば,''CDEFGHI'' というクエリー配列が与えられると,...
次に,アミノ酸置換確率行列に基づいて,生成した部分文字列...
たとえば,アミノ酸 ''I'' はアミノ酸 ''V'' と類似している...
部分文字列または類似文字列に一致する個所を,タンパク質デ...
部分文字列が一致するかどうかには有限オートマトンが使われ...
*E-value [#af09e496]
検索対象のデータベースにおいて,クエリー配列が偶然に一致...
まず,検索対称のタンパク質データベースに出現するアミノ酸...
これによって,各アミノ酸が独立に出現すると仮定したときの...
ここから,各アミノ酸が独立に出現すると仮定したときにある...
各アミノ酸が独立に出現するときにランダムに生成したアミノ...
そこで,Gumbel分布の上でスコアが [math]S[/math] 以上にな...
これが ''E-value'' です.
したがって,同じタンパク質データベースの中で比較すると,...
*タンパク質データベース [#tefe9197]
検索対象となるタンパク質データベースは,いくつかの種類が...
''nr'' は,Non-redundant を表し,色々なデータベースを統合...
''refseq'' は,Reference sequenceを表し,NCBI(アメリカの...
''SwissProt'' や ''PDB'' や ''Patent'' は,それぞれ独自に...
SwissProtは幅広い知識を注釈としてつけたもの,PDBはタンパ...
*BLASTによるタンパク質の相同性検索 [#q5e32c69]
タンパク質データベースの一つであるUniProtからタンパク質の...
UniProtからアミノ酸配列を取得する方法については,以下のペ...
-[[ClustalWでペアワイズ・アラインメントを行う>バイオ・デ...
ここでは,ヒトのヘモグロビン HBA_HUMAN のアミノ酸配列をク...
まず,''protein blast''を選択します.
#ref(./blast.png,nolink,50%)
次に,クエリーのところにUniProtから入手したFASTA形式の配...
#ref(./blast_input.png,nolink,50%)
すると,検索が実行されますが,時間がかかるので,次のよう...
#ref(./blast_searching.png,nolink,50%)
検索が終わると,結果が表示されます.
#ref(./blast_output_top.png,nolink,50%)
一番上には,サマリーとして,検索されたタンパク質の一致部...
#ref(./blast_output_summary.png,nolink,50%)
一致部分が表示され,一致部分の長さが色で表されています.
次に,検索されたタンパク質の名前,最大スコア,総合スコア...
#ref(./blast_output_descriptions,nolink.png,50%)
最後に,検索されたタンパク質のそれぞれについて,ペアワイ...
#ref(./blast_output_alignments.png,nolink,50%)
ClustalWのアラインメント結果とは異なり,クエリー配列と検...
アミノ酸置換確率が高く,類似しているアミノ酸の所には''+''...
*演習 [#h7e0322a]
UniProtからヒトのアミラーゼ AMY1_HUMAN のアミノ酸配列を入...
ただし,アミラーゼは配列長が長いので,丸ごと検索すると,E...
一部分だけを取り出して(一部分を削除して)検索してみまし...
アミノ酸配列がどのくらいの長さだとE-valueがどのくらいにな...
*参考文献 [#a297d100]
#html{{
<iframe style="width:120px;height:240px;" marginwidth="0"...
}}
-6章 類似配列のデータベース検索
ページ名: