• 追加された行はこの色です。
  • 削除された行はこの色です。
このページはまだ書きかけです.


*はじめに [#redbd380]

ここでは,''BLAST''を使って相同性検索を行います.


*相同性検索 [#x948b460]

DNAやタンパク質が進化的に共通の祖先を持つものを''相同体'' (homologue) といい,DNAやタンパク質が進化的に共通の祖先を持つことを''相同性'' (homology) といいます.

DNAデータベースの中からクエリーとして与えられた塩基配列の相同体を見つける,あるいは,タンパク質データベースの中からクエリーとして与えられたアミノ酸配列の相同体を見つけることを''相同性検索''といいます.


*BLAST [#e4689043]

''BLAST''は配列をクエリーとして相同性検索を行うツールです.

BLASTには,DNAの塩基配列をクエリーとして塩基配列を検索する''blastn'',タンパク質のアミノ酸配列をクエリーとしてアミノ酸配列を検索する''blastp'',DNAの塩基配列をクエリーとして(それを翻訳して)アミノ酸配列を検索する''blastx''などが含まれています.

ここでは,タンパク質のアミノ酸配列をクエリーとしてアミノ酸配列を検索するblastpを対象にします.


*相同性検索の仕組み [#nfedeebb]

BLASTは,まず,クエリーとして与えられたタンパク質のアミノ酸配列を3文字ずつに分割します.(DNAの塩基配列9文字分に相当します.)

たとえば,''CDEFGHI'' というクエリー配列が与えられると,これを ''CDE'', ''DEF'', ''EFG'', ''FGI'' という長さ3の部分文字列に分解します.

次に,アミノ酸置換確率行列に基づいて,生成した部分文字列の類似文字列を作成します.

たとえば,アミノ酸 ''I'' はアミノ酸 ''V'' と類似している(置換される確率が高い)とき,''FGI'' の ''I'' を ''V'' に置換した''FGV'' を類似文字列として作成します.

部分文字列または類似文字列に一致する個所を,タンパク質データベースのアミノ酸配列の中から探し,一致した度合いに基づいて''類似度''を計算します.

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS