bakusyo_wara-f6054
1: 名無しさんがお送りします 2023/03/31(金) 16:10:54.824 ID:v1ME0xwxM.net
考えようぜ?

2: 名無しさんがお送りします 2023/03/31(金) 16:12:26.783 ID:v1ME0xwxM.net
誰も興味無い?

3: 名無しさんがお送りします 2023/03/31(金) 16:13:19.870 ID:v1ME0xwxM.net
とりあえずagent57という手法に注目してるのだけど

4: 名無しさんがお送りします 2023/03/31(金) 16:14:14.890 ID:v1ME0xwxM.net
俺ノートPCしか持ってなくてGPUも内蔵のものしかないからコスパ良く学習できる手法を取りたい

7: 名無しさんがお送りします 2023/03/31(金) 16:16:25.749 ID:zaQqN1q/0.net
学習の要素あるのか

9: 名無しさんがお送りします 2023/03/31(金) 16:17:57.063 ID:v1ME0xwxM.net
>>7
価格が完全にランダムに動くなら学習できない
でももし何らかの複雑な関係性があるなら学習可能

10: 名無しさんがお送りします 2023/03/31(金) 16:18:56.492 ID:zaQqN1q/0.net
発掘じゃなくて自動取引で利益得たいって話?

11: 名無しさんがお送りします 2023/03/31(金) 16:20:33.144 ID:v1ME0xwxM.net
そそ

引用元: https://mi.5ch.net/test/read.cgi/news4vip/1680246654/

6: 名無しさんがお送りします 2023/03/31(金) 16:16:05.918 ID:v1ME0xwxM.net
まず強化学習やるなら環境を定義しないとな

8: 名無しさんがお送りします 2023/03/31(金) 16:17:07.289 ID:v1ME0xwxM.net
ビットコの取引データは過去5年分くらいなら取引所から取得できる
こいつを加工して環境の状態としよう
つまり前処理ってやつだな

12: 名無しさんがお送りします 2023/03/31(金) 16:23:11.609 ID:CLi+36wv0.net
アビトラBOTの方が簡単で確実だよ
元本ないと利益もゴミだけど

15: 名無しさんがお送りします 2023/03/31(金) 16:29:09.551 ID:v1ME0xwxM.net
>>12
アビトラは試したけど儲かるどころか損した
ping早くないとちょっとの遅れで損する

13: 名無しさんがお送りします 2023/03/31(金) 16:23:48.121 ID:NO4RASsC0.net
意味がよくわからん

16: 名無しさんがお送りします 2023/03/31(金) 16:29:42.412 ID:v1ME0xwxM.net
>>13
勉強しろ

14: 名無しさんがお送りします 2023/03/31(金) 16:24:36.449 ID:rrLvwak80.net
どこまでの知識はあるの?

17: 名無しさんがお送りします 2023/03/31(金) 16:30:22.557 ID:v1ME0xwxM.net
>>14
とりあえず機械学習の本読んでpytorchを書いてみてるレベル
プログラミングは昔からやってる

18: 名無しさんがお送りします 2023/03/31(金) 16:32:52.073 ID:v1ME0xwxM.net
俺がちょっと調べたところによると、状態は時間ごとに区切るよりも価格の変動で区切る方が良いらしい
つまり1分ごとに価格を入力するよりかは価格が決まった幅以上動いたら入力するという感じ

19: 名無しさんがお送りします 2023/03/31(金) 16:36:44.698 ID:v1ME0xwxM.net
どういう環境にしたらいいかな

(価格、前回のイベントからの時間、前回からの出来高)

こんな感じか?

20: 名無しさんがお送りします 2023/03/31(金) 16:37:47.266 ID:v1ME0xwxM.net
せっかくニューラルネットワーク使うのにパラメータ3つってしょぼ過ぎるよな
もっと増やすか

21: 名無しさんがお送りします 2023/03/31(金) 16:39:22.600 ID:AXz36sze0.net
なんで強化学習?

22: 名無しさんがお送りします 2023/03/31(金) 16:40:46.376 ID:v1ME0xwxM.net
>>21
強化学習以外にやりようがないからね

23: 名無しさんがお送りします 2023/03/31(金) 16:41:21.616 ID:AXz36sze0.net
はあ?

26: 名無しさんがお送りします 2023/03/31(金) 16:44:51.031 ID:v1ME0xwxM.net
>>23
深層強化学習最強の現代でそれ以外の方法をお知りのようなら教えて頂きたいよ

24: 名無しさんがお送りします 2023/03/31(金) 16:41:51.748 ID:cXMp5Gdfa.net
とりあえずhohetoさんとUKIさんろAlpacaジャパンのtomoさんをフォローしとけよ

29: 名無しさんがお送りします 2023/03/31(金) 16:45:19.808 ID:v1ME0xwxM.net
>>24
コピートレードにはあまり興味はないんだ

32: 名無しさんがお送りします 2023/03/31(金) 16:47:09.379 ID:cXMp5Gdfa.net
>>29
こういうふうにデータ公開してくれるから考えるのに役立つかなと思ったんだがな
https://note.com/hht/n/nc0caf98477db

33: 名無しさんがお送りします 2023/03/31(金) 16:49:12.020 ID:v1ME0xwxM.net
>>32
あー、こういうのは有用かもしれんね
けどこれ含めAIに自力で学習してもらおう

25: 名無しさんがお送りします 2023/03/31(金) 16:44:09.600 ID:v1ME0xwxM.net
市場の「勢い」とか「雰囲気」的なものを感じ取れるといいな
入力のパラメータとして直近1秒、1分、3分、5分…の平均出来高や平均価格上昇を入れるのはどうだろう

27: 名無しさんがお送りします 2023/03/31(金) 16:44:59.517 ID:uWvWRMH70.net
勢いや雰囲気なら移動平均線見れば分かるだろ

30: 名無しさんがお送りします 2023/03/31(金) 16:46:00.363 ID:v1ME0xwxM.net
>>27
AIはグラフ見たって分からん

28: 名無しさんがお送りします 2023/03/31(金) 16:45:11.812 ID:cXMp5Gdfa.net
モメンタムって難しいって聞くけどどうなんだろうね

31: 名無しさんがお送りします 2023/03/31(金) 16:46:33.874 ID:v1ME0xwxM.net
あまりテクニカル指標は用いるつもりはないな

34: 名無しさんがお送りします 2023/03/31(金) 16:49:16.210 ID:cXMp5Gdfa.net
アルパカの人は機械学習とか投資ロジックのいろはを無料で公開したり
無料のディスコードで勉強会やったりしてるからそっちのほうが回答あるかなと思ってね

35: 名無しさんがお送りします 2023/03/31(金) 16:50:28.502 ID:KulshrRU0.net
機械学習についても話してるのか、それは太っ腹だな

37: 名無しさんがお送りします 2023/03/31(金) 17:00:01.152 ID:KulshrRU0.net
とりま環境決めよう

(1)現在の価格[$]
浮動小数点数1つで表す

(2)直近の価格の変動率
沢山の浮動小数点数で表す
以下の期間の平均を入れる
1s,5s,10s,30s,1m,3m,5m,10m,20m,40m,1h,1.5h,3h,
5h,12h,1d,2d,4d,1w,2w,3w,1month,2month

(3)直近の出来高の平均
沢山の浮動小数点数で表す
上の期間だけ入れる

38: 名無しさんがお送りします 2023/03/31(金) 17:02:41.597 ID:KulshrRU0.net
RNNを使えばこんなに変動率は要らないかもな
つーか価格を入力するより前回のイベントからの変動幅を入れるべきだな…
あと自分のポジも入れるべきだろうか

39: 名無しさんがお送りします 2023/03/31(金) 17:04:29.156 ID:KulshrRU0.net
イベントをトリガーする幅は何ドルがいいかな
20ドルくらいか?

40: 名無しさんがお送りします 2023/03/31(金) 17:05:38.234 ID:KulshrRU0.net
ポジもとりあえず突っ込むか
で、不要なパラメータは埋め込み関数で無視してもらおう

41: 名無しさんがお送りします 2023/03/31(金) 17:07:01.106 ID:KulshrRU0.net
状態はひとまずおいておく
次は報酬を決めよう

42: 名無しさんがお送りします 2023/03/31(金) 17:08:36.850 ID:KulshrRU0.net
報酬は利確時の利益でいいと思うなぁ個人的には
報酬は疎になるけど、agent57を採用すれば内発的報酬も加わるので学習が進まない事は回避出来そう

43: 名無しさんがお送りします 2023/03/31(金) 17:09:10.724 ID:KulshrRU0.net
はい次
次はエージェントの行動を決めよう

44: 名無しさんがお送りします 2023/03/31(金) 17:11:24.282 ID:KulshrRU0.net
エージェントの行動

(1)ホールド
何もしない
(2)資産のn%でロング
n=10,20,…,90,100
(3)資産のn%でショート
n=10,20,…,90,100

レバは掛けないっつー事でいいかね
どうしよ

45: 名無しさんがお送りします 2023/03/31(金) 17:13:10.622 ID:KulshrRU0.net
レバ掛けてもいいけど強制ロスカありにするか?
強制ロスカ食らったら報酬を負のデカい値にすりゃ何とかなるかな…むずい

46: 名無しさんがお送りします 2023/03/31(金) 17:19:05.095 ID:KulshrRU0.net
いややっぱレバは2倍までとかにするか
上限決めないとロング連発して賭けに出るとかやりそうだし

47: 名無しさんがお送りします 2023/03/31(金) 17:21:04.510 ID:KulshrRU0.net
つーか行動が多いと学習が進まなくなる可能性ありそう
行動はもっと減らそう
n=10,30,50
これでいい

48: 名無しさんがお送りします 2023/03/31(金) 17:30:08.377 ID:KulshrRU0.net
環境の状態を再考


(1)前回のイベントからの変動幅[$]
浮動小数点数1つで表す

(2)直近の価格の変動率
沢山の浮動小数点数で表す
以下の期間の平均を入れる
1s,5s,10s,30s,1m,3m,5m,10m,20m,40m,1h,1.5h,3h,
5h,12h,1d,2d,4d,1w,2w,3w,1month,2month

(3)直近の出来高の平均
沢山の浮動小数点数で表す
上の期間だけ入れる

(4)現在の価格[$]

(5)自分のポジション
購入価格[$]と数量[%]、含み益[$]の組で表す
複数ポジションある場合は統合して入力

49: 名無しさんがお送りします 2023/03/31(金) 17:31:53.207 ID:KulshrRU0.net
行動に関して思ったのは、NNの出力を各行動に対してone-hotにするより
その時々で最適なポジションの数量を1つの浮動小数点数で出してくれた方が良くねぇかって事だな
離散化はNNとは別にやればいいかも

50: 名無しさんがお送りします 2023/03/31(金) 17:44:36.602 ID:KulshrRU0.net
さっそくプログラム書くか

なんかコメント書いていってくれると嬉しい(´・ω・`)
名前
コメント