ヒビルテ(2007-08-07)

日々の流転

2007-08-07 [長年日記]

λ. 文字列検索の性能

こないだの ICFP Programming Contest 2007 の時に以下のような文字列検索関数を書いた(実際にはリストではなくData.Sequenceが対象だったけど)。書いたときは「文字列上を逆に戻ることが無いから、少しは速そう」とか思っていたんだけど、そもそも比較回数は全然減っていないので全然速くない。アホだ、私。

findSubstring :: Eq a => [a] -> [a] -> Maybe Int
findSubstring [] = const (Just 0)
findSubstring pat = f [] 0
  where
    f ([]:_) n _ = Just $ n - length pat
    f s n xs =
        case xs of
          (x:xs') -> f [s' | (c:s') <- (s++[pat]), x==c] (n+1) xs'
          [] -> Nothing

毎日HaskellのKMP法検索(2006-05-03)とBM法検索(2006-06-16)と比較してみる。

Prelude Test> findSubstring (replicate 1000 'a' ++ ['b']) (replicate 10000 'a')
Nothing
(2.54 secs, 253290572 bytes)
Prelude Test> kmp_search (replicate 1000 'a' ++ ['b']) (replicate 10000 'a')
False
(0.03 secs, 525604 bytes)
Prelude Test> bm_search (replicate 1000 'a' ++ ['b']) (replicate 10000 'a')
False
(0.21 secs, 2622592 bytes)

この程度の短い文字列でも最悪ケースだと全然性能が違うんだな。

Tags: haskell

本日のツッコミ(全1件) [ツッコミを入れる]

ψ [1..100]>>=pen (2007-08-10 01:58)

なんとなくBM法が一番速いだろうと思っていたのですがKMP法より<br>かなり遅いですね。実装の問題だろうな。


		2007年 8月
日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

日々の流転

2007-08-07 [長年日記]

λ. 文字列検索の性能

プロフィール

カレンダー

日記内検索

タグ

最近のツッコミ

最近のトラックバック

この日記と連携する

アンテナ等