| そんなこと言われると | うさぴょんの育ての親 | 2007年 4月29日(日)23時44分56秒
|
| Late Move Reductionsとか | 山下 | 2007年 4月29日(日)23時59分34秒
|
| Re:Late Move Reductionsとか | 恩本 | 2007年 4月30日(月)02時13分8秒
|
| AI将棋 | ふむふむ | 2007年 4月30日(月)20時41分42秒
|
| Re: AI将棋 | 山下 | 2007年 4月30日(月)21時57分6秒
|
| ShotestもBonanzaには結構勝ってる?よう... | 山下 | 2007年 4月30日(月)22時02分35秒
|
| (無題) | 保木 | 2007年 5月 1日(火)04時45分11秒
|
| LMR | 恩本 | 2007年 5月 1日(火)12時27分32秒
|
| Re: LMR | 山下 | 2007年 5月 1日(火)17時06分35秒
|
| Re: LMR | うさぴょんの育ての親 | 2007年 5月 2日(水)07時18分35秒
|
| 激指はMacのようです | 山下 | 2007年 5月 2日(水)18時25分37秒
|
| そういえば | うさぴょんの育ての親 | 2007年 5月 2日(水)21時52分24秒
|
| (無題) | 保木 | 2007年 5月 2日(水)22時25分25秒
|
| ハッシュのロック | 山下 | 2007年 5月 3日(木)04時19分10秒
|
| 1回戦、2回戦の組み合わせが出ています | 山下 | 2007年 5月 3日(木)10時09分55秒
|
| Re:ハッシュのロック | うさぴょんの育ての親 | 2007年 5月 3日(木)10時23分22秒
|
| (無題) | ソフト好き | 2007年 5月 5日(土)17時20分48秒
|
| おめでとうございます。 | 丸電 | 2007年 5月 5日(土)18時56分49秒
|
| みなさんお疲れ様でした | tss | 2007年 5月 5日(土)21時33分47秒
|
| そうなんですよ? | ふむふむ | 2007年 5月 6日(日)03時18分40秒
|
| Re: そうなんですよ? | こまち | 2007年 5月 6日(日)10時14分23秒
|
| 勝手にベンチマーク | おせら | 2007年 5月 6日(日)13時39分28秒
|
| 選手権参加ソフトリンク集更新 | TETSU | 2007年 5月 6日(日)18時50分37秒
|
| ありがとうございます | 山下 | 2007年 5月 6日(日)19時43分6秒
|
| CGF特別例会が6月9日、10日に | 山下 | 2007年 5月 7日(月)16時23分3秒
|
| 2次予選からの進出者の決勝成績 | 山下 | 2007年 5月10日(木)00時54分59秒
|
| 順位順の星取表です | 山下 | 2007年 5月10日(木)03時10分49秒
|
| 自戦記書きました | 棚瀬 | 2007年 5月10日(木)16時21分22秒
|
| 自戦記拝見しました | tss | 2007年 5月11日(金)00時01分17秒
|
| Java将棋のアルゴリズム | 山下 | 2007年 5月13日(日)02時44分5秒
|
| ShotestのJeffさんの写真 | 山下 | 2007年 5月15日(火)02時23分56秒
|
| (無題) | 奈良和文 | 2007年 5月15日(火)21時42分36秒
|
| 将棋倶楽部24 | 山下 | 2007年 5月16日(水)01時28分41秒
|
| (無台) | ふむふむ | 2007年 5月16日(水)18時26分31秒
|
| Re: 対局マシンの性能 | 山下 | 2007年 5月16日(水)19時22分57秒
|
| Crazy Stoneの日本語記事 | 山下 | 2007年 5月17日(木)18時20分34秒
|
| TACOS対鈴木英春さん | 橋本@TACOS | 2007年 5月18日(金)14時18分57秒
|
| 将棋倶楽部24でのYSSのレーティング | 山下 | 2007年 5月18日(金)16時31分28秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | うさぴょんの育ての親 | 2007年 5月18日(金)21時03分31秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 棚瀬 | 2007年 5月19日(土)21時35分20秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | tss | 2007年 5月19日(土)23時53分21秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 棚瀬 | 2007年 5月20日(日)00時40分10秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | tss | 2007年 5月20日(日)01時48分23秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 加藤 (gg) | 2007年 5月20日(日)02時16分38秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 山下 | 2007年 5月20日(日)04時09分56秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 棚瀬 | 2007年 5月20日(日)13時02分17秒
|
| Re:TACOS対鈴木英春さん | 都万 | 2007年 5月20日(日)14時00分8秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | tss | 2007年 5月20日(日)15時38分5秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 竜魔王 | 2007年 5月20日(日)22時30分43秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | tss | 2007年 5月21日(月)17時51分13秒
|
| 正確なレーティング | tss | 2007年 5月21日(月)17時52分36秒
|
| Re: 将棋倶楽部24でのYSSのレーティング | 竜魔王 | 2007年 5月21日(月)19時25分13秒
|
| 訂正 | 竜魔王 | 2007年 5月21日(月)19時46分40秒
|
| これ以上のレーティングに関する話はご遠... | 山下 | 2007年 5月21日(月)22時28分12秒
|
| Re:TACOS対鈴木英春さん | 3年目@TACOS | 2007年 5月24日(木)12時48分11秒
|
| Re:TACOS対鈴木英春さん | 橋本@TACOS | 2007年 5月25日(金)17時15分27秒
|
| 対鈴木英春さん | もうすぐ3年目 | 2007年 5月26日(土)15時45分32秒
|
| 英春 | 都万 | 2007年 5月28日(月)06時27分30秒
|
| 加藤幸男さんが朝日アマ名人戦で2連覇 | 山下 | 2007年 6月 4日(月)03時09分10秒
|
| CGF特別例会(コンピュータ囲碁大会)が今... | 山下 | 2007年 6月 4日(月)04時45分55秒
|
| 薄れる詰将棋への信頼感 | 山下 | 2007年 6月 4日(月)23時24分3秒
|
| 詰将棋にはdf-pnが最適? | 山下 | 2007年 6月 4日(月)23時32分52秒
|
| 8CPUでの効率 | 山下 | 2007年 6月 5日(火)04時55分48秒
|
| 効率化の推定に使った数値 | 山下 | 2007年 6月 5日(火)04時57分31秒
|
| root での並列化 | 保木 | 2007年 6月 5日(火)12時49分40秒
|
| Re: root での並列化 | 山下 | 2007年 6月 5日(火)21時04分55秒
|
| root での並列化 | 保木 | 2007年 6月 6日(水)21時56分4秒
|
| Re: root での並列化 | 棚瀬 | 2007年 6月 7日(木)13時13分43秒
|
| Re: root での並列化 | 山下 | 2007年 6月 7日(木)18時32分7秒
|
| Re: rootでの並列化 | 横山 | 2007年 6月 8日(金)00時42分40秒
|
>今頃バタバタとプログラムを変更したりしている状態なので期待は出来ないですね。
…こんなことを言われると、これからプログラムのデバッグを始める私の立場は(苦笑)。
私も現状報告などを。
今日は重い腰を上げて秋葉原でXeon2.66GHz Quad Coreを2つ買ってきました。
マシン作るのが面倒なのですが。
最近の改良で一番お手軽で効果があったのは吉村さんから教えてもらった
Late Move Reductions、という方法です。
http://www.glaurungchess.com/lmr.html
やってることはすごく単純で、5手目以降に読む手は1手浅くして
値を更新すれば普通の深さで再探索、という方法です。
YSSでは6割くらいの勝率になりました。
さらに10手目以降は2手浅く、とかも0.52ぐらいで効果がありそうなので入れてます。
王手の場合や駒取りですでに+の延長されてる場合はなしで。
History PruningとかRank Cutとかも同じような部類の方法?でしょうか。
今は詰探索をどこで読むか、というのを調べていて、試しに全部詰みを(1手詰すらも)
外してみたら、意外と勝率では互角でした。ピンポイントで読むと0.54ぐらいに勝率が
上がります。
いまさらながら、相当今まで無駄な探索してるな、という感じです。
YSSもこの種のリダクションを入れましたか。やはり効果があるようですね。
LMRとhistory pruningは似たような方法だと思います。
備後将棋もLMRに変更して試してみようと思っていましたが、
すっかり忘れていました...
AI将棋は東大将棋みたいな定石道場とか詰将棋とか入れないんですか?それとすべてのソフトが1.5年前から新しいバージョンがないんですが何故?
詰将棋はなんとかなりそうですが、定跡道場は高度な将棋の知識が必要なので難しいです。
Jeffさんの会社のページが更新されてたのですが、
http://www.aifactory.co.uk/
> Our engine "Shotest" is taking games off Bonanza in testing,
take games off をなんと訳すのかよく分からないのですが、
なんとなく勝ってるみたいですね。
LMR (history pruning) は Bonanza でも上手くいってます.null move search や extended futility pruning との相性もまずまずです.
この reduction と re-search の組み合わせを初めに発表したのは誰なのでしょうか? もしかしたら,realization probability search (tsuruoka, et al) かもしれませんね.
> 最近の改良で一番お手軽で効果があったのは
pv node で 0.5 手延長をしていても上手くいくとは凄まじいですね...
備後将棋はLMRではなくhistory pruningをしていますが、pv nodeでやはり 0.5手延長しています。(前回の反復で得られたハッシュの手を延長)
延長を入れたほうが強くなるようです。
(リダクションで読むのが短くなったのを補う効果?)
あ、恩本さんは0.5手延長を使われてるのですか。 なんだかうれしいですね。
YSSだと前回のハッシュの手で0.5手延長、さらに最善手を途中で更新したら延長、
ハッシュに手がなければ多重反復深化、でやってます。
他のモデルで実験したことがないので何とも言えないのですが、YSSの場合は後ろの2つを
入れないとほとんど勝率に変化は出ませんでした。
> この reduction と re-search の組み合わせを初めに発表したのは
誰なんでしょう?
解説を読んでても自然発生的に出てきたみたいでよく分からないですね。
Null Move Pruningは商用チェスでこっそり?使われててそのうち広まったみたいですけど
その流れかも。
鶴岡さんの論文がきっかけなら面白いですね。
後ろの手を浅く読む、という発想自体は30年ぐらい前の本に
初手は深さ5手、2手目は深さ4手、3手目は深さ3手というように見込みのない枝は浅くする、
みたいな解説があったのを覚えてます。再探索という概念はなかったですけど。
バグではまってたんですが、ちょうどはまってた部分がLMRと同じ事を実現しようとしている部分だったので、LMRのコードが超!参考になりました(苦笑)。
山下さん、ありがとうー!
お陰様でとりあえず考えてたこと(reduction+re-search)は実現できました…。
で、後の問題は、これでちゃんと動くかどうか(苦笑)、です。
そう言えば、私は0.5手延長をOFFにしている(コード上には存在していて、iniファイルで有効に出来るのです)んですが、ONにしてみるのも試してみないといけないんだったなぁ…。
うーん、今日には荷物を送らないといけないのに、やること山積み。
しかも、今、徹夜明けで…これから、お休みなさい、です。
テストセットを流しながら眠ります(苦笑)。
横山さんのブログによると http://llama.logos.k.u-tokyo.ac.jp/~yokoyama/diary/
>購入したのはMac Pro, Quad Xeon 3.0GHz X 2CPUの構成。
Xeon3.0GHzですか。負けてる、無念・・・。
かなり購入を考えてたのですが、64bitのWindowsが簡単に走るのかどうか
心配だったのであきらめてました。
YSSも今回64bitで走らせるつもりなのですが、Win64にはインラインアセンブラが
使えなくなったようで、ハッシュのロックができなくなって焦りました。
YSSではハッシュ表の中の1byteをロック用に持ってるのですが、
InterlockedExchange()とかは32ビット単位でのアクセスなので
どうしようか悩んでいたのですが、結局下のような関数でロックを
かけてます。エンディアンに依存するのでちょっといやなのですが。
__inline void LockChar (volatile char *hPtr)
{
for (;;) {
// 構造体の char なので エンディアン依存!
unsigned char bit = _interlockedbittestandset((long*)hPtr, 0);
if ( bit==0 ) break;
while (*hPtr);
}
}
山下さんと同じ問題にあたって(インラインアセンブラが使えない)、仕方ないので、私はWindowsAPIのEnterCriticalSection()/LeaveCriticalSection()を使う作りに戻したんでしたね…。
本当は、x64用のアセンブラコードを書けばいいだけなのかな、と思いつつ(苦笑)。
ハッシュはロックしないものと思ってプログラムを作ってきました.しかも,アラインされた quadword の書き込みはアトミックであることも仮定しています.今になっていきなり不安になってきました.ものすごく不安になってきました...
RankCut は未だよく分かりません.なぜあの論文が AI 誌にアクセプトされたのか理解不能です.
Microsoft の x64 C/C++ コンパイラには x64 intrinsics があったはずです.
#include
__int64 _InterlockedExchange64(
__int64 * Target,
__int64 Value
);
YSSの場合、ロックをかけてないと
70局目くらいのテスト中にハッシュのデータが壊れて落ちたことがありました。
Bonanzaも危ないですね。
70局目が選手権の決勝にきますよ。
・・・いや、ま、冗談ですけど。
Craftyの仮に壊れてもXOR取って確認するから大丈夫、というあの方法?なら
問題ないような気がします。
YSSではハッシュにロックをかけると
4%から7%、詰将棋ばっかり読むときは10%ぐらい速度が低下するので
ロックしない構造はうらやましいです。
参加者は去年よりは2つ減って41チーム(一次22)のようですね。 しかし結局棚瀬さんは棚瀬将棋のままなのですか・・・。
http://live1.computer-shogi.org/wcsc17/
> ハッシュはロックしないものと思ってプログラムを作ってきました.
こちらは山下さんがコメントされている通りで…
> アラインされた quadword の書き込みはアトミックであることも仮定しています.
この仮定は多分問題ないと思います。
うさぴょんは、ハッシュからデータを取ってくるのに、Stack上に一旦コピーしてからとってきたデータの正当性チェックをしてるのでロックをかけなくても大丈夫なような気がするのに『臆病なので』ロックしてます(苦笑)。しかも、ハッシュテーブル全体に対してのロックなので、結構深刻に性能低下しているんじゃないかなー…。<怖いので計測したことがないのです(w。
YSS優勝おめでとうございます KCCは経済制裁なんでしょうか・・・
山下さん、優勝おめでとうございます。 頑張って来年こそアマ棋士卒業を!!
参加者、スタッフの皆さんお疲れ様でした。
3日間張り付いてましたがとても楽しかったです。
また参加したくなりました。やっぱり参加してナンボという気がします。
YSS優勝おめでとうございます。 白熱した戦いに疲れたのではないでしょうか。
今後の活躍にも期待しています。
棚瀬将棋は同点で2位なのは何故?
大会ルール第14条 より 順位は、引き分けを0.5勝0.5敗と換算した上で、次の各号に掲げる順に適用して決定する。
一 勝数の多い者を上位とする。
二 ソルコフ(すべての対戦相手の勝星の合計)の多い者を上位とする。
三 SB(負かした相手の勝星の合計)の多い者を上位とする。
四 ミディアム(負かした相手の勝星が最高と最低の2人を除いた相手の勝星の合計)の多いものを上位とする。
五 第一号から第四号までで同順位の者同士の対戦のみについて、DB(勝ち数-負け数)の多い者を上位とする。
六 シード順が上位の者を上位とする。
YSS優勝おめでとうございます。
ところで、激指戦、加藤幸男 氏戦等の検討が一段落しましたら、そろそろYSSベンチマークのより負荷のかかるバージョンのご検討をよろしくお願いいたします。
山下さん、おめでとうございます。みなさん、おつかれさまでした。 世界コンピュータ将棋選手権参加ソフトリンク集(下記URL)に
第17回世界コンピュータ将棋選手権参加ソフトを追加しました。
誤りや抜けがありましたらご連絡ください。
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
ソフト好きさん、丸電さん、tssさん、おせらさん、TETSUさん、ありがとうございます。
今年は勝てば優勝できる、という最終戦を迎えただけでかなり満足だったのですが
ほんとに優勝してしまい、あれという感じで未だに違和感があります。
どちらかというとBonanzaの連覇は阻止したい、という方がメインでした。
しかし、我ながらしぶといですね・・・。
下にYSSの読み筋の入った棋譜を置きました。
柿木将棋などでコメントを見ることが出来ます。
http://www32.ocn.ne.jp/~yss/csa17yss.lzh
>そろそろYSSベンチマークの
YSSベンチも古くなって並列化にも対応してないので近いうちに新しいものを出したいと思います。
2007年6月9日(土),10日(日)にCGF特別例会が開催されます。
場所は調布の電気通信大学です。
http://hp.vector.co.jp/authors/VA012620/
また、2007年6月から7月にかけて電気通信大学で
エンターテイメントと認知科学研究ステーション主催の
コンピュータ囲碁講習会 「これで作れる!コンピュータ囲碁」
が行われます。参加費などは無料です。
http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/CG-lec.html
決勝リーグができた第6回大会から、2次予選の進出者が決勝で どんな順位を取ったかを調べてみました。
2次予選 17 16 15 14 13 12 11 10 9 8 7 6回 平均順位
1位 3 8 6 4 6 4 3 1 2 6 1 2 3.8 優勝2回
2位 2 6 8 7 2 1 8 3 7 1 6 7 4.8 優勝2回
3位 5 4 2 6 7 7 4 6 4 3 5 5 4.8
4位 8 1 7 5 8 8 6 5 8 7 7 6 6.3 優勝1回
5位 7 7 5 8 5 5 2 8 6 8 8 8 6.4
順位1位はさすがに平均3.8位と一番成績がいいのですが、面白いことに
2位と3位はまったく同じ平均順位で、3位と4位の間に大きな差があるようです。
2次予選から優勝者が出たのは5回で、5/12=42%の確率。
特異なデータとしては
・第11回大会で予選5位から決勝2位になった金沢将棋
・第16回大会で予選4位から優勝したBonanza。
・第16回大会で予選1位から8位になった大槻将棋、
でしょうか。
YSS 棚瀬 激指 Bona 備後 TACO K-Sh 竜卵 勝敗引 SB 順位
YSS ○ × ○ ○ ○ ○ ○ 6-1-0 17 1
棚瀬将棋 × ○ ○ ○ ○ ○ ○ 6-1-0 16 2
激指 ○ × × ○ ○ ○ ○ 5-2-0 12 3
Bonanza × × ○ ○ ○ ○ ○ 5-2-0 11 4
備後将棋 × × × × ○ ○ ○ 3-4-0 5
TACOS × × × × × ○ ○ 2-5-0 6
K-Shogi × × × × × × ○ 1-6-0 7
竜の卵 × × × × × × × 0-7-0 8
6-1で並んでの優勝は
1994年の極2.1 (6-1、優勝)、森田将棋5.0(6-1、2位)
2003年のIS将棋(6-1、優勝)、YSS (6-1、2位)
以来3度目です。
今回は6-1で3つ並んで前回順位が適用、という味気ないパターンが
初めて適用されそうで心配でした。
結構長文になりました。 http://tanase.yasushi.googlepages.com/2007csa
棚瀬さんの自戦記拝見しました。 今後の予定として、棚瀬将棋(あくまで仮名称のつもり)らしく、
プログラムに名前をつける、とあったので、
東大将棋ファンの私もさっそく猿知恵を絞って考えてみました。
tanase.shogi.system.(棚瀬将棋システム)
略して、「tss」?
紛らわしい? そうですかだめですか。どうも失礼しました。(^^A
ちなみに商品名は「東大将棋」継続なのでしょうか?
ファンとして少し気になりました。
池さんの「コンピュータ将棋のアルゴリズム」のJava版、 「Java将棋のアルゴリズム」が新宿のヨドバシに
売っていたので買ってきました。
前作を持っていなくてJavaの方が得意な方にはお勧めです。
Java将棋のアルゴリズム―アルゴリズムの強化手法を探る
http://www.amazon.co.jp/dp/477751241X
Shotestの作者のJeffさんが撮った写真が公開されています。
CSA選手権の写真
http://www.box.net/public/24ry49x343#1:6528452
その他など
http://www.box.net/public/24ry49x343#main
将棋倶楽部24で、今、Yss-computer が指されているようです。 R2653 ですね。
奈良さん、観戦してくださってありがとうございます。 2700を超えて自分でも驚いています。
対局マシンの性能はどんな感じですか?
選手権と同じです。 Xeon 2.66GHz(Quad Core) x2 の8コアでメモリは512MB確保、
1手に18秒、基本深さは12手読み、という設定で指させてます。
Remi Coulomさんのインタビュー記事が出ています。
革新的なAI囲碁プログラム『Crazy Stone』
http://wiredvision.jp/news/200705/2007051121.html
2006年9月の英語の記事の日本語訳のようです。
原題の「AI Invades Go Territory」に比べると随分柔らかいタイトルになってます。
他には知人に教えてもらったのですが、Deep Blueの後継?として
Blue Geneというスーパーコンピュータが頑張っている、というお話しです。
(あまりDeep Blueは関係ないですが)
新たな科学技術の発見のためのエンジンとなったIBM Blue Gene
- IBMの生んだチェス・チャンピオン「Deep Blue」の子孫として -
http://www-06.ibm.com/jp/press/20070516001.html
北陸先端科学技術大学院大学オープンキャンパスのイベントとして TACOS対鈴木英春さんの公開対局を行うことになりました。
時間は5月26日(土)15:40〜17:00です。
お近くの方はぜひお越しください。
(下のURLで3.公開講座・公開イベント3)「コンピュータ将棋の最前線」
と書いてあるのがそうです)
英春さんからは堂々とかまいたちで来る宣言をいただきました。
http://www.jaist.ac.jp/opencampus2007/index.html
将棋倶楽部24で選手権で使ったマシンを使ってYSSのレーティングを 計算させてみました。
52局対戦させて、2744点で昨年(2508点)から236点アップになりました。
ハンドル:Yss-computer
現在R 2744点(6段) 最高R 2765点(6段) 2007/05/12 〜 2007/05/18
全52局 41勝11敗 勝率 0.78
CPU: Xeon X5355 2.66GHz(Quad Core) x2 全8コア。1手18秒。基本12手読み、ハッシュ512MB。
対局は全て早指し(持時間1分で切れたら30秒) 戦型は乱数で選択。
昨年と比較してマシンがCPU単体で1.12倍。4CPUから8CPUでの高速化を仮に1.3倍として1.4倍ほど
速いマシンを使ったことになります。
対局数は例年の52局です。
個人的な印象では少し点数が上がりすぎていると思います。
単純に勝率(昨年版に0.65)と速度向上からだと150点程度の上昇だと思っていたので。
王の安全度を過大に評価して、やや過激に攻める棋風に変わったのが対人間に
勝ちやすくなっているのかもしれません。
またYSSが穴熊に組まないようにした影響で相手もほとんど穴熊に組んでこなかったのも
要因の一つかもしれません。
最後になりますが、対戦していただいた皆様、どうもありがとうございました。m(_ _)m
グラフなどは下をご覧下さい。
http://www32.ocn.ne.jp/~yss/24rating.html
おぉ、想像以上に高い数値ですね。>R2744点
私個人の予想では、山下さんの予想した位の数字…昨年の2508点から150点アップ前後で、2700点に届かない、位を想像していました。
仮に、これから来年までにもこれ位伸びるのだとしたら、来年の選手権でYSSに勝ちたいと思ったら、R3000位必要ってことですか…空恐ろしい数字です…。
毎年52試合で打ち切っていますけど少し早すぎるんではないですか? 特に今年は41-11ということですから、もう少し勝率が落ちてくるところまでやらないと、全く同じプログラムでも来年52試合やったら100点くらいレーティングが上昇するんではないかと思います。
やはり現状の力を正しく推測するためには出来ればあと30試合くらいはやっていただきたいところですが・・。
過去のレーティングも大体その時点の実力よりも低めになっていると思います。
>毎年52試合で打ち切っていますけど少し早すぎるんではないですか?
私は、そうは思いません。
年々、確実にプログラムが強化されているのであれば、
そのプログラムに人間は、勝てなくなる、勝てない、わけですから、
レーティングも、それに応じて上昇率は上向きになっていきます。
>全く同じプログラムでも来年52試合やったら100点くらいレーティングが上昇するんではないかと
意味がありません。
来年も、確実にプログラムが強化されているのであれば、
レーティングは52局対戦でも、今年の236点よりアップすると、私は予想します。(^^;
何か私の意見を誤解をされているようですが、1年ごとの実力向上を見たい場合にはその時点の出来るだけ正確なレーティングを測定した方がいい、現時点の対戦相手、勝率から推測するにまだ安定していないんではないですか?ということです。 そうすると、仮に全く進歩がなかったとしてももう52試合やれば恐らく100点くらいレーティングが上昇して、あたかも進歩があったかのように見えてしまうのではないか、という意味です。
お分かりいただけたでしょうか?
何か私の意見も誤解をされているようですが、 例えば、
>もう少し勝率が落ちてくるところまでやらないと、
と、あと30試合やって、仮に勝率が落ちずに上がってしまい、レーティングが300点アップしたら、
それが確実に、正確なレーティングを測定した、とは言えないと私は思います。
>全く進歩がなかったとしてももう52試合やれば恐らく100点くらいレーティングが上昇して、
>あたかも進歩があったかのように見えてしまうのではないか、
そこまで疑えばきりがないですね。
まず、レーティングは絶えず変動するもので、正確なレーティングを測定する、のは無理です。
多くの対局数で確率は出ますが、そのレーティングや勝率で、勝利を保障するものなら、
選手権での対局にも、あれほどの緊張感は無いのではないですか。
>過去のレーティングも大体その時点の実力よりも低めになっていると思います。
これは年々、将棋倶楽部24全体の棋力が向上しているという仮説ですかね?
来年も、確実にプログラムが強化されているのであれば、
レーティングは同じ52局対戦でも、今年の236点よりアップすると、私は予想します。
もう少し勝率が落ちてくるところまでやらなくても、それでも目安にはなるという意味です。
実際、山下さんもそんな感じだと、私は妄想します。違ったら、すいません。(^^A
横からお邪魔します. 棚瀬さんはグラフのカーブを見てまだ早い(安定してない)とおっしゃってるんでしょう.
参考になるかどうか分かりませんが,CGOSの場合は80試合程度やらないと?が取れません
確かにグラフを見た感じだと、まだ安定してる、というには早いような気がします。 そもそも、2003年の時に、30局で止めるつもりが、まだ上がりそうだな、と
思って52局まで対戦させた記憶がありますし。
ただ、2006年の時は、自己対戦の結果でもほとんど強くなっていなかったので、
2005年の結果をそのまま延長してもOKだと思います。
そういう意味では52局程度で妥当?だったのかもしれません。
あと、挑戦を受けるだけにしてるので、自分より弱い相手との対戦が
多く、勝率も高めに出ていると思います。
今回、これだけ高いRを持った人は非常に少なくて、同じ人との対戦が
かなりあり、そういう意味でも信頼性にはかけるかもしれません。
(コンピュータに向き、不向きの差で)
これ以上のRを正確に測定するのは難しいような気もします。
tssさんには私の言っていることが全く理解されないようなのでもう止めたいところですが、
>まず、レーティングは絶えず変動するもので、正確なレーティングを測定する、のは無理です。
これについてだけ。
そんなことはよく分かっています。
24の場合一局を勝つか負けるかで32点の差が出るわけですから、上下100点の変動くらいは当たり前に起こります。
結局過去例えば30試合のレーティングの平均というような形でしか実力は測れないでしょう。
グラフの移動平均線みたいな感じです。
この移動平均線のカーブもまだ明らかに安定していないと言っているのです。
>これ以上のRを正確に測定するのは難しいような気もします。
今回は意外とYSSと近いレーティングの人との対戦が出来ていたようですけど、挑戦を受けるだけだと確かに2900点、3000点というラインはかなり難しいでしょうね。
24のレーティング計算法は400点差に近い対局では上位者がかなり損ですし。
24もELOを導入するといいと思うんですけどね。
現在の計算法では上位者がなかなか下位者との対戦を受けてくれないということになってしまいます。(700点差くらい以上離れている場合はELOと比べて逆に上位者が得になりますが)
参考までに(wikipediaで勉強しました)ELOではレーティング差X>=0に対して下位者の勝率を
1/(1+10^(X/400))と予測します。
400点差の場合下位者の勝率は9%くらいになり、上位者が負けた場合に失う点数は
K*(1-0.09)で、24のようにK=32の場合は29点くらいになります。
チェスの世界ではレーティング上位、対局数が多くて安定している場合に対してはより低いK(トップクラスが10、羽生さんの場合15が設定されています)を利用して変動を抑えているようです。
24の場合はこのシグモイド関数を直線で近似する簡易式を使っているのでどうしてもひずみが出てしまいます。
http://www.fide.com/ratings/tourarc.phtml?codt=22&field1=7000537
持ち時間、どのくらいに設定した?
棚瀬さんには私の言っていることが全く理解されないようなのでもう止めたいところですが、 暇つぶしに付き合いましょう。怒ったら、すいません。(^^;
棚瀬さんの言いたいこともわかっています。
まず、山下さんも
>これ以上のRを正確に測定するのは難しいような気もします。
と言っておられるように、山下さん自身は厳密に、正確なレーティングを測定する、つもりはないと
私は思っています。(きりがないの意)
毎年52試合での山下さんの対局基準は、
・選手権で使用のマシンで1手思考時間18秒。
・挑戦は受けるだけ。自分より弱い相手との対戦でも無頓着。
・対局数は毎年52試合程度。
以上でのレーティング変動値をだいたい目安に強化の割りを判断したもの。
山下さんとしては今年は強化に成功しており、
・自己対戦の結果でも強くなっている。
・選手権でも優勝できた。
ので、将棋倶楽部24でのレーティングでも上回っているはずだと推測し、
その結果が山下さんの予測したとおり満足な結果(それ以上?) を得ていることがわかります。
山下さん自身は厳密に、正確なレーティングを測定する、つもりはたぶんなく、
棚瀬さんは厳密に、正確なレーティングを測定するべき、との意見にズレがある、
との意味です。
事実、山下さんとしては、あと30試合すれば、もう少しレーティングが上がるかも? と
推測しているはずです。違ったら、すいません。(^^A
ですが、そうなっても、正確なレーティングを測定した、とは私は思えない。
山下さんにもそのつもりはないと思うし、
私個人、きりがないのと、今年はYSSの強化に成功していることはわかりました、って意味です。
私も山下さんも(たぶん)、棚瀬さんよりレーティング値に厳密さと拘りと執着を持ってないのです。
ほんとに棚瀬さんの言いたいことはわかっていますよ。(怒っとるんかなー)(^^;
棚瀬さん、ご自身で分かっているようですが、会話がかみあっていないから、もう止めた方がいいですね。 Aという主張に対し、非Aで反論するのではなく、tssさんは独立したBを主張しているので、反論しても無駄です。
レーティングの正確さを問題にしているのに、「上昇率が上向き」の話になっています。(レーティングが上向きではなく・・)
最後には、きりがないという話にすり替わっていますから、反論ではなく、独立した意見として述べるべきですね。
それに「棚瀬さんは厳密に、正確なレーティングを測定するべき、との意見」などと述べているようでは、
とても、棚瀬さんの言いたいことがわかっているとはいえませんね。
彼は「厳密性」ではなく、「安定性」の話をしているわけだから。
>>過去のレーティングも大体その時点の実力よりも低めになっていると思います。
>これは年々、将棋倶楽部24全体の棋力が向上しているという仮説ですかね?
これも、全くの不理解ですね。
過去のレーティングも、安定する前に対局を打ち切っているのではないか、という見解なのだから。
私も、棚瀬さんと同じような印象を受けていました。
それと同時に、tssさんがおっしゃるように
「山下さん自身は厳密に、正確なレーティングを測定する、つもりはたぶんなく」とも思っていました。
つまり、2つの独立した命題を両者が主張し続けても、無意味な議論です。
両方、真でありうるわけだから。
竜魔王さん
言葉遊びで人の上げ足を取るのはやめませんか。それこそ無意味です。
私は、棚瀬さんの「出来るだけ正確なレーティングを測定した方がいい」に対して、
又は、安定していない、不安定なので正確に欠ける、との解釈に
「厳密さ」(きびしく行う)を言ったまでです。
>過去のレーティングも、安定する前に対局を打ち切っているのではないか、という見解なのだから。
全くの不理解ですね。そうじゃないでしょう。
>>過去のレーティングも大体その時点の実力よりも低めになっていると思います。
とは、コンピュータ将棋のレーティングの過大評価に関して、数年後には冷静になりその時点の実力よりも低めになる。
との意見ではないですか。これに対して私は否定はしてません。
私は、
「現状の力を正しく推測するためには出来ればあと30試合くらいはやっていただきたいところですが」
のAという主張に対し、
「仮に、あと30試合やって、仮に勝率が落ちずに上がってしまい、レーティングが300点アップしたら、
それが、正確なレーティングを測定した、とは言えないよ」
と非Aで反論はしているつもりですが。その上で独立したBを主張しています。
実際に、レーティングが300点アップしたら、棚瀬さんはなんと言うのでしょう?
・最低100試合必要。
・勝率が下がるまで必要。
・100試合では足らない。もっともっと…
との意見は出るでしょう。
以上、無意味な返答これにて。
建設的な議論として、「出来るだけ正確なレーティングを測定するには? 」と疑問にもつ人が 議論してみてはどうですか。
又は、棚瀬さん自身が自ら率先して、出来るだけ正確なレーティングを測定するために、
将棋倶楽部24に参戦してみる手は。一番早い手です。
棚瀬さんの言う、ルールの欠点を利用して、2900点、3000点に挑戦して見るのも、おもしろい。
棚瀬さんも三年ほど将棋倶楽部24に参戦してレーティングを測定し、
その結果を公開してみては。
>言葉遊びで人の上げ足を取るのはやめませんか。それこそ無意味です。
議論なんて、しょせんは言葉遊びです。
そして、言葉遊びにはルールがあり、正しい反論がなされていなければ、それこそ無意味です。(笑)
>全くの不理解ですね。そうじゃないでしょう。
まあ、意見を述べたのは棚瀬さんであり、私が不理解である可能性は否定しませんが、
棚瀬さん自身ではない、あなたが、そんな自信たっぷりに言うことじゃないでしょう。(苦笑)
>「現状の力を正しく推測するためには出来ればあと30試合くらいはやっていただきたいところですが」
>のAという主張に対し、
>「仮に、あと30試合やって、仮に勝率が落ちずに上がってしまい、レーティングが300点アップしたら、
>それが、正確なレーティングを測定した、とは言えないよ」
>と非Aで反論はしているつもりですが。
それは、残念ながら非Aではないですねー。
「あと30試合やれば、結果に関わらず、正確なレーティングを測定したことになる」をBと定義しましょう。
あなたの反論は、非Bですね。
そして、棚瀬さんはBを主張しているわけではありません。
棚瀬さんの「出来れば」とか、「くらいはやっていただきたい」という日本語による
蓋然的表現を理解して、上げ足を取るのはやめましょう。(^^;
彼は「30試合やれば充分である」というような確定的表現はしていませんよ。
>・勝率が下がるまで必要。
個人的には、この考えを支持します。
もっとも対戦相手のRとの関係があるので、この考えも、もちろん不充分ではありますが・・。
ただ、こういう問題は、明確な答えが出るわけではないので、反論という形ではなく、
私はこう思う程度でないと、議論が成立しづらいでしょうね。
>>・勝率が下がるまで必要。
>個人的には、この考えを支持します。
あー、これ全然ダメだ。
R2700以上ともなると、ほとんど相手が下位ですね。(涙)
「最高Rを更新してから、10戦しても更新がなければ終了」なんてのを考えてみました。
10というのは、感覚的に決めた数字なので、不満ならXに変えて、適当な数字を入れてください。(笑)
すべて削除します。
> 持ち時間、どのくらいに設定した?
持ち時間15分で切れたら30秒と聞いています.
対局の中継をすることにいたしました。 5月26日午後3時40分開始予定です。
興味のある方はご観戦ください。
(今回は動画による中継はありません。棋譜のアップのみになります)
http://www.jaist.ac.jp/rccg/eishun/
ネットワークトラブルでホームページの方にあげられなくなりました 申し訳ないのですが2chの方に時折棋譜をあげさせていただきます.
棋譜を見せてもらったが、TACOSは善戦してる方だなって感じです。 30秒あるのなら、英春さんなら勝つだろうと予測はしてました。
戦型は、去年箱根で英春さんと対戦してるのですが、そのときの戦法を英春さんは使ってます。
英春流とみせかけて袖飛車に変化する。
英春流は、銀冠が基本なので銀は左方向に行く傾向が昔あって駒が守りの片寄って攻めがおろそかになるというバランス面での弱点があり、彼自身がそれに気づき補正したのでしょう。
プロ棋士の場合、勝ってもしょうがない将棋は緩めるのですが、英春さんのようなアマというか、くすぶりは生活がかかってますので緩める事はしないのです。
人間の脳は、年を取ると働きが悪くなり将棋は弱くなるのですが、英春さんの場合、審判長をつとめる等の引退はしているのですが、指導将棋等はやっていて、対局してみたところ、「腐っても鯛」というか「腐っても英春」と言った感じでまだボケてはないみたいです。
コンピュータ将棋の場合は、プロと対戦するのはいいけれど、実際は緩めてしまわれて正しい対戦結果にならないので、若いアマに時間を十分与えて対戦させた方が実際的に実力を知る上でいいのではないかと思います。
ここ2年間、選手権でのエキジビジョンをしてくださっている 加藤幸男さんが挑戦者の山田洋次アマ名人に2連勝して
タイトルを防衛されました。
強いですねぇ・・・。
加藤さんが初防衛 第30期朝日アマ将棋名人戦三番勝負
http://www.asahi.com/culture/update/0603/TKY200706030084.html
追記。
将棋倶楽部24のサイトで中継されていたようで棋譜が見れます。
1局目 http://www.shogidojo.net/amaren/asahi/2007asahi_1.html
2局目 http://www.shogidojo.net/amaren/asahi/2007asahi_2.html
東京、調布の電通大にて今週の土日に開催されます。 参加、見学は自由です。
また、参加も募集していますので、可能な方は
お気軽にご応募ください。
参加申し込み締め切り 2007年 6月 4日(月)
大会 2007年 6月 9日(土) 10:00-18:00
2007年 6月10日(日) 9:40-15:00
CGF特別例会のページ
http://hp.vector.co.jp/authors/VA012620/
ここ数年、コンピュータが詰を間違うケースが多くなってきたような 気がします。
優勝に絡んだとこでは、昨年のBonanza−激指の詰手順間違い、
今年のYSS−棚瀬将棋戦ではYSSは1手後の自玉の詰を読みきれていませんでしたし
棚瀬将棋はその長手数の詰を逃し、さらに9手詰をもうっかりする大錯覚。
結局人間が作っているものなので、ミスがあって当然、といえば当然なのですが、
だんだん難解な詰将棋を深い所で解かないといけないようになってきた、
というのもありそうです。
YSSの詰将棋は相変わらず脊尾さんの証明数のみをつかった方法なのですが、
ここ数年df-pnに変更しようとして挫折したりしてます。
理由は探索速度で、
例えばYSS−棚瀬戦の102手目、△68飛成以下の局面では
東大8 12万局面/s 3.1秒 38万局面(全て AthlonXP 2100+(1.73GHz)でテスト)
PN 64万局面/s 1.7秒 106万局面
df-pn 9万局面/s 10.6秒 96万局面(最適化してないので探索速度のみ参照)
PDS 8万局面/s 22.1秒 181万局面(最適化してないので探索速度のみ参照)
と、現在のPNに比べてdf-pnはかなり遅い数値になっています。
これはdf-pnが全てのノードで子局面を展開して証明数、反証数を
計算しないといけないのに対し、PNでは逃げる手の選択だけで済むためです。
もっとも、df-pnの方はほとんど最適化してないので
探索局面数や速度はもう少し上がると思うのですが、頑張っても速度は
2倍ぐらいにしかならないような気がします。
もっと難解な問題になってくると、東大8の方が速度、時間ともに完全に上回るのですが。
選手権で使ったXeon5355 2.66GHz(Quad Core) x2 での探索速度の効率を調べてみました。 8スレッドの10秒をのぞいてすべて自己対戦の1000局の結果です。
並列化していない版と、2倍〜5倍時間をかけたもの。
1手2秒 0.674 (推定値 0.670)
1手3秒 0.765 (推定値 0.754)
1手4秒 0.796 (推定値 0.805)
1手5秒 0.828 (推定値 0.838)
4スレッド (Opteron852 2.6GHz x4)
1手1秒 0.625 推定 1.65倍
1手4秒 0.658 推定 1.9 倍
8スレッド (Xeon X5355 2.66GHZ Quad Core x2)
1手1秒 0.669 推定 2.0 倍
1手4秒 0.693 推定 2.2 倍
1手10秒 0.701 推定 2.3 倍 (251局)
思考時間を2倍にすると、勝率が0.67になる、と仮定して
推定の倍率を出してます。
YSSでは4スレッドから8スレッドにしたときの高速化は
1手4秒の時で比較して、
1.9倍 -> 2.2倍 で 1.16倍程度にしかなっていないようです。
1手10秒と、もう少し考えさせれば、
1.9倍 -> 2.3倍 で 1.21倍程度、と少しましになります。
ただ、これは対局数が少ないので怪しいですが。
当初予想していた1.3倍程度に比べてかなり小さかったです。
YSSはルートでは並列化していない、などの欠点があるので
それを修正すればもう少し上がるかもしれません。
考えられるのは、
・rootで並列化する
・ハッシュのロックをしない構造に
・詰将棋も並列化させる
でしょうか。
効率化の推定に使った数値は、2年前に使った計算式で出してます。
4スレッドでの実質高速化
http://www.yss-aya.com/bbs_log/bbs2005.html#bbs177
思考時間の差 w= 1.00, 勝率 y=0.500, レート差= 0.0
思考時間の差 w= 1.65, 勝率 y=0.625, レート差= 88.9
思考時間の差 w= 1.90, 勝率 y=0.658, レート差=113.9
思考時間の差 w= 2.00, 勝率 y=0.670, レート差=123.0
思考時間の差 w= 2.20, 勝率 y=0.691, レート差=139.9
思考時間の差 w= 2.30, 勝率 y=0.701, レート差=147.8
思考時間の差 w= 3.00, 勝率 y=0.754, レート差=195.0
思考時間の差 w= 4.00, 勝率 y=0.805, レート差=246.0
思考時間の差 w= 5.00, 勝率 y=0.838, レート差=285.7
root での並列化は bonanza もやっていません.
基準深さ n の探索を終了させる場合は root で並列化したほうが良いと思うのですが,そうでない場合がほとんどどです.動作が複雑なわりに,効果は微妙だと思っています.
あら、Bonanzaもルートではやってないのですか。
棚瀬さんはrootで並列化もされていて、2,3秒とかの短い思考時間では
かなり効果的、と話されてましたし、Craftyのmain.c にあるコメントでも
> the parallel search has been modified so that it can now
> split the tree at the root, as well as at deeper nodes.
> this has improved the parallel search efficiency noticably
> while also making the code a bit more complex.
「並列化の効果が著しく改善された」とあるので、
結構効いてくるのではないかと思います。
YSSの8スレッドで実質3倍も速くなってないのはかなり悲しいので
ちょっと試してみるつもりです。
どうしても並列化関係は後回しになってしまうのですが・・・。
どうもやる気が起きません.そもそも思考に時間をかける理由は root で最善手が変わるからです.たくさん思考するために root で split しては本末転倒のような気がします.ちなみに,Crafty は root で有力な手が複数ある場合はスプリットしないハズです.
> 短い思考時間ではかなり効果的
こ,これは,いったい?! 棚瀬さんの日本語ではないです.
なんか僕の日本語のような気がしてますがw、rootで並列化すると早くloadが100%になるので簡単な問題に関してはかなり差が出てくるようです。 ただ最善手が入れ替わるケースは確かに微妙ですね。
Craftyのソース今見てみたんですがtreeの大きさが1番目の手の3分の1を超える手が1手以上ある場合には有力手が複数あるとみなしてルートでの並列化は行ってないということのようでした。
なるほど。
僕は全くこの辺考慮してなかったのであるいはトータルで見てあまりよくなかった可能性は大でした。
下は3年前のデータなのですが、基本深さ8の探索だと7から15%程度しか 最善手は変わりません。で基本深さ10ぐらいの探索だと、
最善手は10%程度しか切り替わらないのではないかと思います。
9割方変わらないなら、rootで100手あるとして、同期を100回取らないと行けないわけで、
効率が落ちるのかも、とか想像しています。
反復深化 最善手が切り替わった割合
2 -> 3, 2704/ 7826 (34.6%)
3 -> 4, 2185/ 7687 (28.4%)
4 -> 5, 1849/ 7619 (24.3%)
5 -> 6, 1463/ 7445 (19.7%)
6 -> 7, 1196/ 6548 (18.3%)
7 -> 8, 601/ 3856 (15.6%)
---------------------------
全体 9998/40981 (24.4%)
http://www32.ocn.ne.jp/~yss/depthper.png
深く読んでも棋力は変わらなくなる?
http://www.yss-aya.com/bbs_log/bk2004-2.html#bbs103
私には並列化の際にrootのみ特別扱いする理由がよくわからないのですが…。 どういう狙いでしょうか。
優先度制御のようなことをした方がいいのは理解できますが、root以外でもそれは同じですよね。
激指の場合はrootも内部ノードも等しく扱って分割してます。
ここでばしっと実験結果をお見せできればよかったんですが、すみません、また今度。