電子書籍の厳選無料作品が豊富!

下に引用の図は、wikipedia30ヶ国語の最初の1000万語について頻度分析をした者です。
すなわち、縦軸がある語の出現頻度、横軸が、出現頻度の大きい順に順位(ランク)を振ったものです。

題にも書きましたが、下の図の対数目盛の読み方について教えてください。

https://www.fastpic.jp/viewer.php?file=657725482 …

A 回答 (3件)

>>一番大きい番数(ランク)は、1000万番のはず


1000万語は言葉(語)の種類。
このグラフは出現した頻度グラフ(その語が何回出てきたか)。

縦軸は頻度だから0回~100兆回まで目盛りがあります。

横軸はそれの順番なんだから、1番目~100番目まで必要でしょう?

あと、対数目盛りにしてるのは、字の重なりと言うより、グラフが長くなるのを防いで一覧性を確保する為です。

例えば横軸の2は100の意味で0~100まで実測で2.5cmあります。
14の位置は100兆だから、等間隔目盛だと、右へ2500万kmの位置。

逆に一番右の100兆は実測で18cmだから、これを基準に等間隔にすると100の位置は左から1.8cm÷1000億。

こんなグラフ使え無いですよね。

縦軸も同じ。だから対数にしています。
    • good
    • 1
この回答へのお礼

回答ありがとうございます!

よくわかりました。ただ、少し思ったのですが、図はもしかして自然対数(eを底)なのかな、と思いました(ちなみに図の引用元には何も書いてありません)。
 縦軸の14(100兆)回, 12( 1兆回) は少し多すぎるような気もします。ネイピア数(自然対数)なら12(約16万回)でしっくりくる気がします。

いずれにせよ、理屈はわかりました。ありがとうございました。

お礼日時:2017/04/09 16:51

No.2の5行目は以下でした。


横軸はそれの順番なんだから、1番目~100兆番目まで必要でしょう?
    • good
    • 0

常用対数は自然対数は書かれていないので、多分常用対数でしょう。


log10=1 log10ⁿ=n
6=log10⁶、縦軸・横軸とも6なら1,000,000なので、質問の通りです。

横軸を対数にしているのは、普通に書くと桁数が多くなって、数字が重なってしまうからです。

10=10000000000
12=1000000000000

と、長~く、なりますから。
    • good
    • 0
この回答へのお礼

おおっ!早速の回答ありがとうございます。

→横軸を対数にしているのは、普通に書くと桁数が多くなって、数字が重なってしまうからです。

この点について質問なのですが、横軸の10はつまり、=10,000,000,000番目(100億番目)ということだと思いますが、この図の頻度分析の対象となった語数は、それぞれの言語について1000万語とのことです。そうすると、一番大きい番数(ランク)は、1000万番のはずですが、これは、「10=10000000000番目、12=1000000000000番目」との解釈と矛盾していないでしょうか。

お礼日時:2017/04/09 14:23

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!