球の中心と半径の求め方

Question

カテゴリーでは数学部門だと思うのですが…

現在、ある球体を測定してその物の球の中心と半径を求めようと思っています。

球体の表面をある機械で測定しています。それぞれの機械から計測された３次元の形状データとしては１００００点ほど有ります。
そこで、４点をピックアップして球の公式に入れて求めると、全てがかなりばらつきのあるデータが出てきます。

これではどのあたりに球の中心があり半径がどうなのか分かりません。

できれば、統計的、数学的に中心と半径は信頼度が高く求める方法があれば教えて下さい。

ちなみに、４点からのデータから中心と半径を１００回求め、平均してもばらつきがひどくてこの方法は使わないようにしています。

そこで、１０点をピックアップして、最小二乗法から中心と半径を１００回求め、平均する方法をしたりしました。
まだ、この方法が有用かなと思いましたが…
データのばらつきが少ないからいいのかなと思いました。

大変理解していただくには難しい内容かもしれません。随時、応えさせていただきますので、色々なご意見宜しくお願いいたします。

boobee0125 · Accepted Answer

#2です。

本件は球の中心位置と半径を正確に求めるのが目的かと思っていましたが、機械の測定誤差を評価・検証する場合には別の考慮も必要になります。

一般に計測装置の誤差にはノンリニアリティー、スパン誤差、オフセット誤差、バラツキなどがありますが、バラツキ以外は装置によっては補正をかけることも可能です。

球を使った場合はノンリニアリティー以外の評価が可能で、半径の誤差がスパン誤差に、中心位置の誤差がオフセット誤差に、また #2手順(2)の rms がバラツキの標準偏差 σ に対応します。また半径の異なる複数の球を使えばノンリニアリティーの評価も可能になります。測定のバラツキが他の誤差評価に影響を与えないようにするには測定点数 n を大きく取る必要があります。n の目安は

rms/√n ＜＜ 要求されるスパン誤差、オフセット誤差評価の標準偏差

で求められます。＜＜ は３～１０程度の比と考えてください。
　 
>この教えていただいたニュートン法でのループを減らし、または誤差二乗和（二乗平均誤差）を利用すれば今回の私が求めたいと考えていることに近づけるのでしょうか？

n = 10000程度のデータでしたらパソコンでの計算ではループ回数＝15で異常データ排除ループを入れてもおそらく数秒で終る程度ですからループ回数を減らす必要はなさそうですし、またバラツキが不明の場合は#2手順(2)の終了判定は使わないでループ回数を固定するほうがよいでしょう。装置の性格によっては異常データは排除しない方が良い場合もありますし、異常データを排除する場合は異常データを含めた rms も評価の対象にすべきです。

arrysthmia · Answer

No.1 の者です。基本方針はアレでよいと思うのですが、

＞ 結局、１００００点の重心を求めるだけですから、計算も簡単です。

の部分には、重大な思い違いがありました。スミマセン。
No.2 さんの手順を参考にして下さい。

boobee0125 · Answer

基本的に #1 の方と同じ意見です。

追加質問のアルゴリズムに関して原理をスキップして手順のみ示します。以下ベクトルを ~ 、転置を ' で表します。

[定義]
計測データ数を n とし、下記のベクトル、行列を定義する。

●計測データベクトル ui~ = (xi,yi,zi)'
●パラメータベクトル p~  = (a,b,c,R)'
●式誤差ベクトル e~ = (E0,E1,...,En-1)  
ここに Ei = F(ui~,p~)
= (a-xi)^2 + (b-yi)^2 + (c-zi)^2 - R^2

●偏微分行列 G = {gij} （サイズは n x 4） 

gi0 = ∂F(ui~,p~)/∂a = 2*(a-xi) 
gi1 = ∂F(ui~,p~)/∂b = 2*(b-yi) 
gi2 = ∂F(ui~,p~)/∂c = 2*(c-zi) 
gi3 = ∂F(ui~,p~)/∂R = -2*R 


[ニュートン法により最良パラメータを求める手順]

(1) パラメータベクトル p~ に初期値として（何らかの方法で求めた）近似値を与える。

(2) 誤差ベクトル e~ を作り、誤差の自乗平均誤差 

rms = √(ΣEi^2/n)

が指定値以下であれば現パラメータベクトル p~ を最終解として処理を終了する。

(3) 偏微分行列 G を作る。

(4) G から擬似逆行列 inv(G'*G)*G' を作る。

(5) パラメータベクトル p~ を下記のように改良する。

p~ = p~ - k*inv(G'*G)*G'*e~  

ここに k はいわゆる加速係数で 0＜k≦1 の範囲に選ぶ。この k が小さすぎると収束が遅くなり、大きすぎると収束が不安定になったり発散することがある。

(6) 手順(2)にジャンプする。　

[補足１]
実際のプログラムでは手順(3)～(5)の inv(G'G)*G'*e~ の計算を下記のようにしてメモリ量を節約できる。Σは for ループによる i = 0～n-1の積算を意味する。G'*e~、G'*G に対応する配列をそれぞれ GTE[4]、GTG[4][4]とするとき

GTE[0] = Σ{gi0*Ei} = 2*Σ{(a-xi)*Ei}
GTE[1] = Σ{gi1*Ei} = 2*Σ{(b-yi)*Ei}
GTE[2] = Σ{gi2*Ei} = 2*Σ{(c-zi)*Ei}
GTE[3] = Σ{gi3*Ei} = -2*R*Σ{Ei}

GTG[j][k]=Σ{gij*gik}

[補足２]
手順(2)の終了判断を行わずにループ回数を固定する方が高い精度が得られる場合がある。今回の問題の場合では加速係数=0.5、ループ回数=15回程度で十分な収束が可能と思われる。

[補足３]
計測データの中に異常データが含まれる場合には、上記の手順完了後に

|Ei|＞k1・rms

となるデータを全て排除し、残りのデータのみを用いて再度(1)～(6)を実行する。この k1 は異常データの発生状況にもよるが 2～3 程度にとる。この操作を３～４回繰り返せば異常データを排除した精度の良い計測が可能となる。

arrysthmia · Answer

なぜ、１００００点のデータから、１０点×１００回だけ取り出すのでしょう？
最適性の定義が最小二乗法で良いのなら、１００００点全部使って
半径の誤差二乗和が最小になるような中心を選んでみては、どうでしょう。
点数が多い程、中心極限定理が効いてくるし、
結局、１００００点の重心を求めるだけですから、計算も簡単です。

１００００点の中に、とんでもない外れ値が含まれていて、値がズレる
ということならば、(かなり場当たり的ですが、)
上の方法で、仮の中心と半径を一旦求め、仮の半径を参考に
仮の中心からの距離に閾値を設けてデータを選別し、残ったデータでもう一度
最小二乗法を行う　という手もあるでしょう。

球の中心と半径の求め方

#2です。

No.1 の者です。

基本的に #1 の方と同じ意見です。

この回答への補足

なぜ、１００００点のデータから、１０点×１００回だけ取り出すのでしょう？

この回答への補足

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング