RLE壓縮

RLE是"Run-length Encoding"的簡寫,中文名稱是"變動長度編碼法",壓縮的方法是將重複的字元壓縮起來,用一個數字代替。例如:Apple,經過壓縮之後,就會輸出A1p2l1e1這樣的字串出來。

不過這種壓縮法最大的缺點就是萬一字元都是獨立的話,這種方法的壓縮率就不好了,我以Encoding的這個Word舉例,當這個字經過壓縮之後,就會輸出E1n1c1o1d1i1n1g1這樣的結果,如果1不輸出的話就更不壓縮是相同的結果。

目前我主要研究的是RLE去壓縮DNA序列,因為DNA序列主要只有ATCG四種結果而已,所以希望透過這種壓縮方法,可以取得比較好的結果。

參考:Wiki and 自己

留言

這個網誌中的熱門文章

Linux's C++ Compiler

MPICH系統的使用與安裝