2003-08-06 [長年日記]
λ. ITスキル標準人材育成研修
マルチメディアデータベースとかメタデータの話。実習では、とりあえず画像のHSV(HLSの方が良かったかも?)の各成分について平均と分散を計算してみる。SとVは確かに画像の明るさや鮮やかさやコントラストを反映した結果が出てきたけど、Hは……って、考えてみたらHの平均や分散って何やねん! 単純に計算したら意味ないよねー。というわけで、Hは無視してSとVに関するデータを使って類似度を計量しようとするわけだけど、どうしたものかちょっと悩ましい。結局、考えるのが面倒くさくなってしまって、適当な係数で調整した後、ベクトルとして内積をとってみる。あー、なんて安直な。
終わってから気がついたのだが、最初にデータを平均や分散にしてしまったのがダメで、ヒストグラムをとって、ヒストグラムの差の積分(?)で距離を定義したりすると、もうちょっと良かったんじゃないかと。あー、でもヒストグラムが櫛になってる可能性を考えると、単純にこれではあまり嬉しくないかも。むー