- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- バイオ・データ・マイニング/BLASTで相同性検索を行う へ行く。
このページはまだ書きかけです.
はじめに †
ここでは,BLASTを使って相同性検索を行います.
相同性検索 †
DNAやタンパク質が進化的に共通の祖先を持つものを相同体 (homologue) といい,DNAやタンパク質が進化的に共通の祖先を持つことを相同性 (homology) といいます.
DNAデータベースの中からクエリーとして与えられた塩基配列の相同体を見つける,あるいは,タンパク質データベースの中からクエリーとして与えられたアミノ酸配列の相同体を見つけることを相同性検索といいます.
BLAST †
BLASTは配列をクエリーとして相同性検索を行うツールです.
BLASTには,DNAの塩基配列をクエリーとして塩基配列を検索するblastn,タンパク質のアミノ酸配列をクエリーとしてアミノ酸配列を検索するblastp,DNAの塩基配列をクエリーとして(それを翻訳して)アミノ酸配列を検索するblastxなどが含まれています.
ここでは,タンパク質のアミノ酸配列をクエリーとしてアミノ酸配列を検索するblastpを対象にします.
相同性検索の仕組み †
BLASTは,まず,クエリーとして与えられたタンパク質のアミノ酸配列を3文字ずつに分割します.(DNAの塩基配列9文字分に相当します.)
たとえば,CDEFGHI というクエリー配列が与えられると,これを CDE, DEF, EFG, FGI という長さ3の部分文字列に分解します.
次に,アミノ酸置換確率行列に基づいて,生成した部分文字列の類似文字列を作成します.
たとえば,アミノ酸 I はアミノ酸 V と類似している(置換される確率が高い)とき,FGI の I を V に置換したFGV を類似文字列として作成します.
部分文字列または類似文字列に一致する個所を,タンパク質データベースのアミノ酸配列の中から探し,一致した度合いに基づいて類似度を計算します.