アプリ版:「スタンプのみでお礼する」機能のリリースについて

例えば、ある標本のデータが(x1,y1),(x2,y2)・・・・・・(xn,yn)であるとします。
そして、そこからt時間経過後の同じ標本のデータを採取し、それらを比較する場合、どの様な比較手法を用いたらよいかわからずに困っております。

ご存知の方がいらっしゃいましたらよろしくお願いします。

A 回答 (1件)

そもそも、どのような目的でデータを採取したのかがポイントでしょう。

その目的に沿って分析することが必要です。データそのものは、無色でいろいろな顔を持っていますので。(その意味で、最近流行の「ビッグデータ」は、何でも目的とする結果が得られる「諸刃の剣」だと思います)

 漠然と、2つのデータ集合を比較するということであれば、そのデータがどのようなものであるかを考えて、適切な方法を選択してください。

 例えば、同じ事象の多数の標本(たとえば、ある時間の製品の検査データと、t時間後の検査データを各々100点計測したような)ということであれば、「平均」と「分散」(あるいはその平方根の「標準偏差」)を見るのがセオリーでしょう。時間変化により、製品品質が変わったのかどうかを確認するのが目的でしょう。

 その標本自体が、何らかの関数になっているものだとすれば(たとえば、ある時間の温度と圧力のデータと、t時間後の温度と圧力のデータを各々100点計測したような)、回帰直線(曲線)をひいて直線(曲線)自体を比べてみる、あるいは回帰直線からのばらつきを比べるなどの分析方法があるでしょう。

 要するに、何か証明・検証したい「仮説」を立てて、その仮説を実証する、あるいは反証するようなデータ分析をする、ということかと思います。単なる「教科書に書いてある手法を使ってみる」という実習でない限りは。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!