http://yanok.net/2012/08/post-226.html を読んで、 それはそうなんだけど、 そういう処理って自分では書きたくないし、 合成文字とかを考慮した上で文字数をカウントするような標準的ライブラリがなかったら、 そうなっちゃうよなぁ、と思った。
各言語で、そういう処理をしてくれる標準的なライブラリがあるのかどうか、知りたいところ。
あと、逆に U+FB00 LATIN SMALL LIGATURE FF 「ff」は二文字と数えるべきなのかな。 これを二文字と数えるとして、さらに極端なことを言ったら、 U+201C LEFT DOUBLE QUOTATION MARK 「“」は、U+2018 LEFT SINGLE QUOTATION MARK 「‘」二文字分とカウントすべき、なんてことになったりするのかな……