OpenCVを使って画像を4値化したいのですが、アルゴリズムはわかっているのですがどうプログラムを組めばいいのかわかりません。
アルゴリズムはまず濃度ヒストグラムを作って
(1)適当な閾値を3つ(t1,t2,t3),決める。
(2)4つの領域で平均濃度を計算し、それらをa1,a2,a3,a4とする。(4つの領域ってどこ?
(3)新閾値t1,t2,t3とt1=(a1+a2)/2,t2=(a2+a3)/2,t3=(a3+a4)/2として計算する。
(4)Σ(j=1,3) |tj-tj|<εならば停止。そうでなければ(2)に戻る。
なのですが、教えて下さい。
No.4
- 回答日時:
こんにちは。
補足頂きました。グレースケールの公式のつもりだったのですが、一般的ではないのかもしれません。
以下を使用しています(LibPNGと言う、PNG画像を処理する有名なライブラリのヘルプドキュメント内に紹介されているグレースケールの公式です)。
http://dencha.ojaru.jp/programs_07/pg_graphic_10 …
出力画素 = 0.212671 * R成分 + 0.715160 * G成分 + 0.072169 * B成分
グレースケールの公式や手段に関しては、其の他にも幾つか有る様です。
http://ofo.jp/osakana/cgtips/grayscale.phtml
話を戻すと、以下の様な関数に成ります。
int RGBToY(int R, int G, int B)
{
return (0.212671 * R) + (0.715160 * G) + (0.072169 * B);
}
小数を含む計算は速度が落ちる為、各係数を256倍して整数だけの計算にしています。
int RGBToY(int R, int G, int B)
{
return ((54 * R) + (183 * G) + (18 * B)) / 256;
}
>> 8は8ビット右にシフトする演算です。/ 256と同じ結果が出せます。
/ 256とするよりも>> 8とした方がCPUは早く計算出来るので、
int RGBToY(int R, int G, int B)
{
return ((54 * R) + (183 * G) + (18 * B)) >> 8;
}
としています。
グレースケール変換については、以下が非常に参考になります。
http://cell.fixstars.com/ps3linux/index.php/2.9% …
No.3
- 回答日時:
こんにちは。
補足頂きました。この手の事は中々簡単に説明出来るモノではないのですが、手っ取り早く解説すると、
//(1)
for(int y = 0; y < img->height; y++)
{
//(2)
for(int x = 0; x < img->width; x++)
{
//(3)
const int pos = (y * img->widthStep) + (x * img->nChannels);
//(4)
const int R = (unsigned char)img->imageData[pos];
//(5)
const int G = (unsigned char)img->imageData[pos + 1];
//(6)
const int B = (unsigned char)img->imageData[pos + 2];
//(7)
const int Y = ::RGBToY(R, G, B);
//(8)
const int result = ::GetLevel(Y, thresholds, count) * band;
//(9)
for(int i = 0; i < img->nChannels; ++i)
img->imageData[pos + i] = result;
}
}
imgはファイルから読み込んできたカラービットマップを示しています(読み込んでくるファイルは24bitを前提としています)。
(1)imgの縦幅の分だけ回ります
(2)imgの横幅の分だけ回ります
(3)imgから処理対象の画素の位置を計算しています。img->widthStepは次の行に改行する為に必要な正確なバイト数を示しています。
img->nChannelsは、画素一つ辺りに幾つの色素があるかを示しています。
24bit に限定しているので img->nChannelsは 3 で RGB(赤、緑、青)です(其れ以外は表示が可笑しくなる)。
この場合、次の画素へ移動するには3バイトずつ移動する事になります。
(4)赤の色素を取り出しています[0-255]。pos = 0の時 赤の位置は pos
(5)緑の色素を取り出しています[0-255]。pos = 0の時 緑の位置は pos + 1
(6)青の色素を取り出しています[0-255]。pos = 0の時 青の位置は pos + 2 次の画素に移動してpos = 3になる
(7)赤、緑、青の色素を使ってグレースケールに変換します[0-255]。
(8)グレースケールされた数字を[0-255]を閾値と比較して[0-3]へ4値化します。
しかし[0-3]ではディスプレイ出来ませんので、band を掛け合わせることで resultが
0→0
1→85
2→170
3→255
に成る様に調整します。ですので、band = 85です。
(9)赤、緑、青のデータに書き込みます(例えばresult = 170であった場合、赤170 緑170 青170 にしている)。
上記の手順を画像が持つ全ての画素に行う事で、4値化されたグレースケールになります。
此れでよろしいでしょうか。
この回答への補足
ありがとうございます!
大変わかりやすいです。
何度も申し訳ないのですが、もう一つ質問させてください。
//グレースケール変換[0-255]を出力する
int RGBToY(int R, int G, int B)
{
return ((54 * R) + (183 * G) + (18 * B)) >> 8;
}
の関数で{54,183,18}というのは適当な値と解釈してよろしいでしょうか。
また「>>8」というのはどういう意味なのでしょうか。
よろしくお願いします。
No.2ベストアンサー
- 回答日時:
こんにちは。
数学としてのN値化は分からないのですが、画像処理としてのN値化でお話しすると、
(1)RGB[0-255, 0-255, 0-255]の画素をY[0-255]のグレースケールに変換
(2)Y[0-255]に対して、[N-1]個の閾値を境界線として0~[N-1]を出力する
が多いように思います。
(2)は、例えば2値化の場合、1個の閾値を境界線にして、画像フォーマットが1ビットであれば、0~1を出力します。24ビットカラーなどであれば、RGB(0,0,0)又はRGB(255,255,255)を出力します。
此れを4値化で考えると、3個の閾値で0~3を出力しますが、フォーマットが1ビットでは入りきらない為、4ビット以上の画像フォーマットにセーブすると言う事です(大抵24ビットを使用する)。
0→RGB(0,0,0)
1→RGB(85,85,85)
2→RGB(170,170,170)
3→RGB(255,255,255)
アラも在るのですが、以下参考になれば。
//配列の個数を数える
#define ArrayCount(a) (sizeof(a)/sizeof(a[0]))
//グレースケール変換[0-255]を出力する
int RGBToY(int R, int G, int B)
{
return ((54 * R) + (183 * G) + (18 * B)) >> 8;
}
//閾値と比較して[0~count]を決定する
int GetLevel(int color, const int array[], int count)
{
for(int i = 0; i < count; ++i)
if(color < array[i])
break;
return i;
}
//テスト
void test()
{
//IPLに読み込む(24ビットカラー)
IplImage* img = ::cvLoadImage("testimage.bmp", CV_LOAD_IMAGE_ANYDEPTH | CV_LOAD_IMAGE_ANYCOLOR);
//閾値の配列
const int thresholds[] = {64, 128, 192};
//閾値の数
const int count = ArrayCount(thresholds);
//count x band = 255にする為
const int band = 255 / count;
for(int y = 0; y < img->height; y++)
{
for(int x = 0; x < img->width; x++)
{
const int pos = (y * img->widthStep) + (x * img->nChannels);
const int R = (unsigned char)img->imageData[pos];
const int G = (unsigned char)img->imageData[pos + 1];
const int B = (unsigned char)img->imageData[pos + 2];
const int Y = ::RGBToY(R, G, B);
const int result = ::GetLevel(Y, thresholds, count) * band;
for(int i = 0; i < img->nChannels; ++i)
img->imageData[pos + i] = result;
}
}
//4値化した結果を24ビットカラーでセーブする
::cvSaveImage("yontika.bmp", img);
//IPLの解放
::cvReleaseImage(&img);
}
この回答への補足
プログラムしてみたところできました!
1つ質問ですが、この部分がどういう処理なのか教えていただけますでしょうか。
for(int y = 0; y < img->height; y++)
{
for(int x = 0; x < img->width; x++)
{
const int pos = (y * img->widthStep) + (x * img->nChannels);
const int R = (unsigned char)img->imageData[pos];
const int G = (unsigned char)img->imageData[pos + 1];
const int B = (unsigned char)img->imageData[pos + 2];
const int Y = ::RGBToY(R, G, B);
const int result = ::GetLevel(Y, thresholds, count) * band;
for(int i = 0; i < img->nChannels; ++i)
img->imageData[pos + i] = result;
}
}
No.1
- 回答日時:
>4つの領域ってどこ?
min~t1、t1~t2、t2~t3、t3~maxの4領域。
例えば、最初に0~63、64~127、128~191、192~255の4つの領域に4分し、それぞれの範囲での平均濃度を求める。
それぞれの平均が1、82、130、254だった場合、t1=(1+82)÷2=41、t2=(82+130)÷2=106、t3=(130+254)÷2=192となる。
次に、0~40、41~105、106~191、192~255の4つの領域に4分し、それぞれの範囲での平均濃度を求める。
以下、終了条件に達する(何回繰り返してもt1、t2、t3が3つとも、ある程度以上は変化しなくなる)まで繰り返し。上記の例では、t3が2回目で変化しなくなっている。
但し「ある周期で、いくつかの値を繰り返す」と言う「発振」を起こす可能性があるので、終了判定に注意する事。例えば、t1が「40⇒43⇒40⇒43⇒…」と延々と繰り返す可能性がある。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 計算機科学 急ぎです、大学数学再帰の問題難しくてがわからないです。 以下の4つの文字列を連結して新たに生成できる 1 2023/05/17 20:11
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- C言語・C++・C# C#テキストボックスの文字を配列にいれてその後表示する 4 2022/07/17 04:47
- レディース アニエス・ベーについて教えてください。 Tシャツのサイズ表記に1.2.3のほかにT1.T2.T3とT 1 2022/05/17 18:13
- C言語・C++・C# ポインタの型変換、どうやるんでしたっけ? 2 2022/03/28 11:00
- Excel(エクセル) SUMIF関数について 4 2023/06/14 13:13
- Excel(エクセル) ExcelのIF関数について 4 2023/05/24 12:54
- Excel(エクセル) エクセル・セルに数式を入力してセル指定計算 2 2023/04/21 12:46
- 哲学 日本語は 言語類型として あたかも始原のごとくである 3 2022/05/29 04:41
- Excel(エクセル) マクロでコピーすると数式が表示される 1 2022/09/09 20:21
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
C言語で%を使わない余りの出し方
-
分数の足し算をさせるプログラ...
-
nCrの計算
-
C言語
-
カードシャッフルのブログラム...
-
CppUnitはCプログラムにも使え...
-
intとlongは同じ?
-
ハフマン符号化の問題を解くプ...
-
C++で表を作成したいのです ...
-
プログラミング
-
VC++でコマンドラインから引数...
-
C言語 サイコロ 2つの値を返せない
-
2÷3などの余りについて
-
比較回数と交換回数表示について
-
信頼区間の1.96や1.65ってどこ...
-
nCmの関数
-
複数桁10進数の*桁目だけを抽出...
-
Notepad++の関数リスト表示の変...
-
C言語のfor文です。 繰り返しの...
-
break文でループを一気に抜ける...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
2の補数を計算するプログラム
-
intとlongは同じ?
-
再起呼び出しの回数をカウント...
-
C言語で%を使わない余りの出し方
-
迷路を脱出する経路探索プログ...
-
画像の拡大・縮小
-
分数の足し算をさせるプログラ...
-
C言語で簡単なパックマンゲーム...
-
C++で表を作成したいのです ...
-
条件が多い場合
-
複数の共有メモリの作成
-
ヒストグラム均等化処理プログラム
-
3のつく数と3の倍数を表示 C言語
-
argvのNULLチェック
-
乱数で交互に偶数、奇数が、、、。
-
プログラミングに関して
-
OpenCVによる4値化について
-
再帰処理をループ処理に変換
-
16bitで乱数を生成する方法
-
C++ Debug Errorについて教えて
おすすめ情報