アプリ版:「スタンプのみでお礼する」機能のリリースについて

 
将棋ソフトについて詳しいかた教えて下さい。

1.将棋ソフトは相手が同じ手を指すと常に同じ手を指し、その結果相手が同じ手を指し続けると何度やっても同じ棋譜が繰り返されることになるのでしょうか。

2.将棋ソフトの打つ手はハードには影響されず、ハードスペックは単に形勢の読みに必要な計算時間に影響するだけなのでしょうか。

3.電王戦ライブに表示されるボンクラーズの評価値(+500 -500など)はどのように読めばよいのでしょうか

4.これまでの電王戦の結果を見て思ったのですが、前半戦はプロ棋士有利で進み、後半戦で将棋ソフトに逆転される流れが目立つのは人間対将棋ソフトが対戦するときの特徴なのでしょうか。
 

A 回答 (3件)

1 常に同じ手を指すことはないです。

最近の将棋ソフトは学習機能をもっているので、この手を指して負けたというようなことを学んだら他の手を指します。また同じ局面でも、候補手が3つくらいあってどのどれもが同じくらいの評価の手だった場合などはランダムに選択されるので、そういうのが積み重なっていくと結局同じ棋譜にはならないと思います。

2 例えば電王戦などは制限時間があり、良い手を制限時間内で指すには、ハードが良くなければならないので、制限時間がある将棋の指し手はハードに影響すると思います。

3 例えば先手が+200で後手が-200であれば、先手が歩一枚分くらい優勢で、後手が歩一枚分ぐらい劣勢という感じです。

4 おっしゃるとおり、今のところはソフトは序盤が苦手で終盤が得意という特徴が出ています。
 もちろん時が経てば序盤も克服するでしょう。
    • good
    • 0

分かるところだけですが




> 1.将棋ソフトは相手が同じ手を指すと常に同じ手を指し、その結果相手が同じ手を指し続けると何度やっても同じ棋譜が繰り返されることになるのでしょうか。

場合によります。人間相手の場合同じになるのはつまらないので、ある程度揺らぐように、疑似乱数を使っているようです。
ソフトによってはON/OFFが設定できるものもあります。
詳しい計算方法は、ソースが公開されているソフトがあるので、それを見るのが確実です。が、見るのは難しいですけどね…。

例えばGPS将棋ならオープンソースなので見れます。
http://gps.tanaka.ecc.u-tokyo.ac.jp/gpsshogi/


> 2.将棋ソフトの打つ手はハードには影響されず、ハードスペックは単に形勢の読みに必要な計算時間に影響するだけなのでしょうか。

ある意味そうです。一定の量を読むと決めて、それを読み終わるまでひたすら計算させると、ご質問されている意味の通りになりますが、
これですと、大量に読む設定にすると、何時間も場合によっては年単位で考える事になります。
電王戦のような対局ではこれはまずいです。

したがってよく使われているのは、一定時間で読めるだけ読んで、その中で一番評価関数が高い=良さそう な所に打つ、という方法です。
この場合、一定時間でどれだけの演算が可能かによって強さが大きく変わってきますので、性能により大きく左右されます。
強いと言われているソフトでも、例えば昔のファミコンのCPUで動かしたら、凄まじく弱いと思います。

ソフトの作り方の方針によって、それほど早いハードが無くてもそこそこいい手を探せる物、早いハードを使った時にとにかく強くなる物、など色々ありますのでこのあたりは開発者の考え方ですね。


> 3.電王戦ライブに表示されるボンクラーズの評価値(+500 -500など)はどのように読めばよいのでしょうか

+-1000を超えたらそっちがけっこう有利という感じでしょうか。

> 4.これまでの電王戦の結果を見て思ったのですが、前半戦はプロ棋士有利で進み、後半戦で将棋ソフトに逆転される流れが目立つのは人間対将棋ソフトが対戦するときの特徴なのでしょうか。

前半は、それ以降どういう展開になるのか読むのが不可能ですのでコンピューターは弱いところです。
もちろん性能的な問題なので、スペックが上がれば解決できますが、100%読むのは結構先になりそうです。
現在の技術の延長では難しそうですが、量子コンピューターとかが出てくるなら可能かもしれません。
    • good
    • 0

1.適宜、乱数的な要素をプログラミングに組み込み、同じ程度の評価値のときにどちらを選ぶかは「適当」に決めているようです。



2.将棋ソフトは、時間制限を設定してその間に「深く読み→読んだ先の局面の評価を比較し→着手を選択」を行っています。
 ハードの性能が良くなると同じ時間内に深く読むことができるので、異なる手を選択することが多いです。
 三浦八段が「性能の低いPCに入れたGPS将棋には連戦連勝だったが最新のPCに入れたらとたんに強くなってびっくりした」をおっしゃっています。

3.ソフトによって評価値の上限・下限は様々ですが、ボンクラーズでは、+500点くらいで指しやすいと人間も感じる(それ以内は人間の感覚では誤差のうち)、+1000点くらいで逆転がなくなる感じ・・・って、プロのみなさんが言ってましたね。一方、+100点で1歩得1手得とも言ってました。

4.ソフトの最終盤が強いことは間違いがないことです。特に詰む詰まないの判定では人間は全く敵いません。
この関係で、危なそうな手にどのように対応するかという終盤の一手争いにも強いです。
たとえば人間だと「よくわからないけど詰めろっぽい手」には受けざるを得ませんが、ソフトはその辺の評価が正確なので「恐れずに」攻めてきたりします。
 逆に、人間の優位フィールドは序盤から中盤です。飛車先歩交換の得や、わずかな形の差による優劣はまだソフトの評価は人間(プロ棋士)には届いていないということがこの電王戦3局で見えてきました。
    • good
    • 0
この回答へのお礼

将棋ソフトは、

乱数を用いて打つ手を変える。

ハードの性能に応じて読みの深さが変わる。
つまりハードの性能に応じて打つ手が変わる。

人間は序盤から中盤で圧倒的優位に立たない限り、終盤必ず逆転される。

どうやら電王戦の全体像が見えて来ました。

非常に参考になりました。

次回の電王戦観戦の参考にしたいと思います。

有難うございます。

お礼日時:2013/04/12 10:17

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!