[討論]生物序列資料庫的搜尋策略

這是從陽明大學轉過來的,網址http://binfo.ym.edu.tw/post/

在這裡我要轉貼記憶用的是關於資料庫搜尋的策略

搜尋資料庫有三種策略:String search,Pattern search與Similarity search

String search :「字串」是由一連串明確的字元的序列片段,例如
* 核酸字串: "ATGC"
* 蛋白質字串: "DEAD" 是螺旋酵素中的守舊序列

Pattern search :「模組樣式」是一個含有不明確字元的序列片段,例如
* Ava I 限制酵素切割位置: "C(T,C)CG(A,G)"
* leucine zipper : "LX{6}LX{6}LX{6}L"

Similarity search : 根據運算法(algorithms),尋找相似的序列,也就是尋找符合下列條件的所有序列:
* 利用 blosum 或 PAM 等評分矩陣(scoring matrix) 決定得分
* 由誤配(mismatch) 的數目,插入空隙(gap insertion) 的數目,與空隙長度(gap length) 決定扣分(penalty)

留言

這個網誌中的熱門文章

Linux's C++ Compiler

MPICH系統的使用與安裝