データサイエンスフェスティバルに参加しました #dsfes
株式会社スタートトゥデイが主催するデータサイエンスフェスティバルに参加しました。
データサイエンスフェスティバルとは
コンテストではファッションECサイト「ZOZOTOWN」での閲覧履歴を利用し、顧客グループごとに各商品の閲覧率及び購入率を予測するモデルを
最優秀チームには100万円、
また、参加賞として最終スコア上位50チームかつ、
本日7月31日より「データサイエンスフェスティバル」を開催 | 株式会社スタートトゥデイ
参加から提出まで
参加したきっかけは、クーポン券目当てでした。時間をかければ確実に5万円はもらえるだろうと思っていたので。
そこで、会社の同期3人を誘って4人で挑戦!
でも、よく考えると4人で出て分けると1人あたりの賞金が減ってしまうので、結局2チームに別れて挑戦しました。
詳しい手法などは参加規約上言ってはいけない気がするので、ここでは言いません。
それなりにデータ量があって、メモリに読み込もうとすると2Gくらいになった気がします。
久しぶりにデータ分析っぽいことしてみたら手元のPCじゃけっこうきつくて、研究室時代の計算機環境の偉大さを実感している
— Takayuki Hasegawa (@hase1031) 2014, 8月 24
そして、これをきっかけに新しいPCを買いました。背中を押してくれてありがとう。笑
全期間の閲覧率、購入率を出すプログラムだけ作って、終了2週間前くらいに4人で集まってプログラミング。
この日、数時間やっただけで10位以内になったのでここで終了!
この後、ほとんど何もやらずにいたら、結局25位でタイムアップ。5万円分のクーポン券ゲットです!
もう一方のチームはというと… 74位。残念でした。笑
実はもっと複雑な手法に個人的に取り組んでいたのですが、試しにSpark使ってたらSparkを学ぶの楽しくなっちゃって、結局あきらめたという裏話も。。。
クラスタ環境じゃなくてローカル環境でやってたので、あまり利点活かせなかったのが残念な感じでした。
表彰式当日
無事50位以内になれたということで、表彰式にやってきました。
場所は、椿山荘ホテル。「つばきさんそう」ではなく「ちんざんそう」と読むらしいです。
会場に入ってみると… 豪華!!!
ただの会議室でやるのかと思ってたら、結婚式が開かれるような会場でした。
お金のかけかたハンパないです。
そして、司会は… 新井恵理那さん!とても美人!
画像をあげて何か言われると嫌なのでご勘弁を… いやまじで美人でした。
取締役の話が終わったら、プレゼンが開始。
上位5人のプレゼンは、みんな同じ発想に基いていました。
難しいことはやってなくて、スタートトゥデイ的にはこれで良かったのかな〜?と思ってしまいました。
結局トップは、数理システムの人でした。
最後は、懇親会!
懇親会では、話した人が東大の大学院生ばかりで、東大トークや修論トークしたりしてました。笑
ご飯はとても豪華で美味しかったです。
クーポン券とお土産の靴下。ありがとうございました。
最後に感想
こういうコンテストはどんどんやって欲しいと思っています。
ネットフリックスのコンテストも、ゾゾタウンのコンテストも、一個人としてはこういう取り組み大好きです!
他の会社もやってみてください!
(色々言われると面倒くさいので一部感想を削除しました)