ScalaMatsuri 2014に参加してきた
9/6, 7にサイバーエージェントで行われたScalaのカンファレンス、その名もScalaMatsuriに参加してきました。
今回は、発表者 & 微妙な準備委員 & スポンサーとして立場での参加でした。
(先に断っておくと、このブログでは自分たちの発表内容には触れません)
ScalaMatsuriが始まるまで
最初に「微妙な準備委員」と書いていますが、実は当初、弊社の会場で開催する予定だったため、その窓口としての関わりでした。
窓口担当になって、準備委員のMTGに途中から顔を出すようになったのですが、最初はScala歴1年にも満たない自分がこんなことやっていていいのだろうか、有名な人たくさんいるからコワイとか思っていました。が、逆に考えるとこんなすごい人達と関われる機会があるなんて、なんてラッキーなんだとも思いました。scalaz, scalikejdbc 作ってる人たちと会うことなんてScala始めた当初は考えてもいませんでした。
実際にはそれほど話したりできたわけではありませんでしたが、良い経験になりました。
また、途中でサイバーエージェントさんに会場変更することになっても、迅速に対応して頂いて、スタッフの皆さまにはとても感謝しています。
あと、発表することになった経緯としては、DDD大好きおじさんが「You発表しちゃいなよ」みたいなノリで言ってきたので、それにのせられて申し込んだというのがきっかけでした。
実際、発表資料を準備するにあたり、いろいろな下調べを通じて、Scalaや自分たちのシステムへの理解がより一層深まって、やっぱり定期的に発表する機会設けるの大事だなーと感じました。
ScalaMatsuri当日
前日のノベルティ準備などはお手伝いしたのですが、当日はやることがなかったので普通の参加者として参加しました。
行ってみると、思った以上に人がいてびっくり!Scalaってこんなに人気あったんですね!
小田好先生の話とか聞ける機会は滅多にないのでとても良かったです。
これだけ有名な人たちをゲストとして招けるスタッフの人脈もすごいと思いますし、やっぱり日本のコミュニティも世界から重要視されてるんだなと感じました。
参加してて1番すごいと思ったのは、Sparkのデモでした。あれはやばい。
写真撮っとけば良かったのですが、Databricksのクローズドβの製品らしく、ブラウザ上でSparkを書いて、その結果をリアルタイムで可視化して見える製品でした。
きっとSparkをバックエンドで閉じさせないように、完成された分析ツールとしてのSparkをDatabricksは提供しようとしてるんじゃないかと思います。
あれはやく使ってみたいなー!
自分たちの発表はというと、うけもとれたし、質疑も活発だったので聴衆には伝えたいことが伝えられたかなと思います。
懇親会でも、「あの発表聞きました。ちょっとあそこ詳しく教えて欲しいんですけど…」とか「とっても面白かったです。アンケートに書いておきました」とか言ってくれる人が複数いて、とても嬉しかったです。
まだまだ未熟ですが、誰かの役にたてたなら、それでいいかなーっと。詳しいところは、他のやばい人たちに聞いてください。笑
最後に
発表や準備委員として活動する機会を与えてくれた弊社、チームメンバーには感謝してます。
この経験をこれからプロダクトをより良くするために使ったり、Scalaコミュニティの発展に活かせていけたらと思います。
スタッフの皆さま、お疲れ様でした!とても楽しかったです!
参加してくれた皆様もありがとうございました!
JAXA OPEN API COMPETITION に参加してきた
JAXAが提供するAPI利用したコンテストに参加してきました。
コンテストへの参加を決める
会社の同期が宇宙好きで、彼がこのコンテストを見つけたのがきっかけ。
個人的にもデータを扱ったアプリを作りたかったし、JAXAが提供するデータにも興味があったので、参加をきめました。(このときはどんなデータが提供されるか知らなかった)
その後、未来科学館でデータの説明があったのですが、データの種類が、降水量、土壌水分量、積雪深、海上風速、海面水温という何とも言えないデータで、かつ1年分しかないということで、参加をやめようかと思ったことは内緒にしておきます。
アプリの開発をする
最初は2人でブレインストーミングしながらアイデアを出していきました。
ヨットが早く進める航路を求めるだとか、渡り鳥のルートを推定するだとか、魚の移動ルートだとか、くだらないアイデアから実現できそうにないアイデアまでありましたが、最終的に、どの植物がどこで育つのかがわかるように2地点間の類似度を求めて可視化するというアプリに決めました。
もともと、私が農業が好きなので、押したというのはあります。笑
開発はというと、フロントエンドはもう1人に任せて、バックエンドを担当しました。
恥ずかしながら、初めてのRuby & Railsで、Railsの手軽さを感じながらの開発でしたね。
「gem, rake やばい、何も分からなくても進む、まるでソーシャルゲームのようだ」といった感じで。笑
ちなみに、類似度はコサイン類似度でグラフの類似性をスコア化しました。
この距離が向いているかどうかは別として、手軽に書けるので選びました。
コンテストで発表する
スライドはもう1人に作ってもらって、発表もほとんどやってもらいました。
実は、発表の直前の組が全く同じことをやっていて、2人して「やばい、帰りたい(´;ω;`)」って言ってました。。。
しかも、その前の組が賞をもらっていて、審査員も大差ないと言っていたので、ちょっと残念でした。
でも、会社の先輩がわざわざ見に来てくれていて、よかったと言ってくれたので、良しとしてます!!!
参加して、発表するということを最後までやったことも重要だったと思います。
これは、その先輩がとってくれた写真(わたしはタイトル言っただけで後方待機してます)
あと、プレゼン資料をSlideShareにあげときました。
スライドにあるURLはこのブログを見ている頃には見れなくなっているかもしれないのでご注意を。
最後に
賞は取れなかったけれど、良い経験が出来たと思います。
よかったら、作ったアプリは見れるうちにポチポチしてみてください。
ワトソン本を読んだ
本は以下の通り。
IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる
ワトソンとは
IBM 質問応答システム“ワトソン”がクイズ番組に挑戦! - Japan から引用させてもらいます。
ワトソンは、質問応答技術の更なる向上を目的に、自然言語処理技術をさらに進化させることを目的に設計されました。「ジョパディ!」で出題されるバラエティーに富んだ複雑な問題に対して、100万冊の本を読むのに相当する自然言語で書かれた情報の断片を分析し、短時間で最も適した解答を導き出す分析コンピューティング・システムです。
「ジョパディ!」は、歴史、文学から科学など幅広いジャンルを扱うクイズ番組として全米で親しまれています。出場者は短時間のうちに正確な解答を返すために、質問に含まれる微妙な意味、風刺や謎掛けなどの複雑な要素の分析をしなければなりません。本来、人間とは異なり、自然言語を正確に理解することのできないコンピューターにとっては大きな挑戦であり、質問応答技術の進歩に貢献できる格好のチャンスでもありました。
ワトソンは、システム設計と分析において技術を進歩させました。瞬時に複雑な質問文を解析して正しい解答を導かねばならないため、ワトソンのソフトウェアは、大量のタスクを処理できるよう最適化されたIBMのPOWER7サーバーで動作します。このシステムには、リアルタイムで情報を分析しながら莫大な量の並列タスクとデータを処理するという特殊な要求を満たすため、独自の技術が数多く取り入れられています。ワトソンは、Linuxが稼働する「IBM Power 750サーバー」のラック10本分、総メモリー容量15TB、総プロセッサー・コア数は2,880個で構成されており、インターネットには接続されていない完全に自己完結したシステムです。
ワトソンの研究開発プロジェクトは、非構造データ分析、自然言語処理、ワークロード最適化システムの設計分野におけるテクノロジーを前進させました。ワトソンを支える技術は、今後より迅速で正確な医療診断支援、潜在的な薬物間相互作用の検査、弁護士や裁判官による過去の判例の参照、金融分野の仮説シナリオと法令順守など、さまざまな分野への応用が期待されています。
本で面白かった点について
一番おもしろかったのは、第7章 人工知能研究の現状とゆくえ でした。
以下、書かれていたことをピックアップして紹介します。
人工知能は、科学の多くの分野同様、はるか昔に実用主義と理想主義の2陣営に分かれ、今日に至っているらしいです。
理想主義から見れば、ワトソンは所詮統計分析マシンで、限界がある。
AIには「考え、知り、学ぶ」マシンを開発するという輝くような夢があり、ワトソンはそれには当てはまらない。
いろいろな意味でワトソンは知能が低い。統計データを巧みに扱えるだけで、実質、何も知らない。
そんな欠点だらけのワトソンが、もし、効果的で万能の知識マシンであると評価されてしまったら、これはもう別路線を行くAI技術の終焉を意味しかねない。
そんな声が出てきていたようです。
しかしながら、理想を実現するためには、かなりの年月が必要になってしまうとアポロ計画と比較しながら紹介されています。
ケネディ大統領がアポロ計画を宣言したとき、既に基本的な科学研究はほぼ全て出揃っていて、あとは必要なあれこれを寄せ集めて、適切な規模に拡大し、宇宙性を組み立てて空に打ち上げるだけでよかった。
それに比べると、AI研究はガリレオの時代であり、まだニュートンまで行っていない。
大きな目標である人間の思考のリバースエンジニアリングとなると、まだまだ膨大な時間と努力が必要になる。
だからこそ、ワトソンは現実路線をいくしかなかった、とされています。
この現実路線を行く例としてGoogleが挙げられています。
2005年に行われた機械翻訳のコンテストで、アラビア語や中国語の専門家が一人もいないGoogleが他を圧倒した。
「言語のニュアンスなど忘れろ、すべてを数学でやれ。」
そんな潮流が生まれた、と。
私は現在ではそれが主流になっているように感じます。
言語のニュアンスなど忘れろは言い過ぎかもしれませんが、現在の自然言語処理のトップカンファレンスでは統計の知識が不必要な論文はほとんどありません。
それだけ統計が大事にな要素になってきています。
しかし、これはジレンマであるとの忠告がなされています。
この潮流はAIの理想からは離れてしまう。なぜなら、マシンは本質的に無知のままだからです。
映画に出てくるようなAIが登場するのはいつになるのか… すぐには難しそうですね…
まとめ
人工知能の研究をする人は、読んで損のない内容になっています。
ぜひ読んでください!ためになりました!!
VAIOのメモリを4GBから8GBにした
4年前に買ったVAIOのメモリを8GBにした。
パソコンのメモリが足りなくて困るのは久しぶりだ。新しいノートパソコン買うしかないな。。。
— Takayuki Hasegawa (@hase1031) 2013, 11月 23
本当は古いので新しいノートパソコンを買えばいいのだが、もったいなく感じメモリを増やすことに決め、さっそく購入した。
購入したメモリは、TranscendのDDR3が4GB×2で約8000円。
VAIOの型番は、 VGN-Z73FB。初期で2GB×2のメモリが入っている。上限は8GBらしい。
さっそくパソコンの裏を空けて、見てみた。
ハイニックスのメモリが入ってた。
これをとってから、買ったTranscendのメモリを入れる。
斜めから入れると奥まで入る。
特に2枚めはちょっと押しこむ必要があるけど、奥まで入っていれば大丈夫。
パソコンのメモリを確認してみると…
8GBになってた!よかった!
(低スペックとか言わないで!)
これで気軽にIntelliJを使ったり、Scalaのビルドができるぞ!
気胸になりました
気胸で1週間ほど入院してました。
胸の痛みで病院へ
週初めに左胸に痛みが出始め、週末にヒルズの病院へ。
ちょっと走ると左胸が痛むんですが、これって気胸ですか?
— Takayuki Hasegawa (@hase1031) 2013, 10月 8
最初は気胸か狭心症かなと思いつつ、循環器内科に見てもらった。
色々調べてもらった結果、レントゲンで気胸とわかり、水は溜まっていないとのこと。
医者からは「大きい病院を紹介するから、これからタクシーで行ってください」と言われ、電車で最寄り駅に向かうことにする(だってタクシー高いもん)。
ここでのお会計6,500円にまず絶句。
しかし、中度だと言われたので、病院にきて良かった。
まさに気胸だった。病院きて良かった。
— Takayuki Hasegawa (@hase1031) 2013, 10月 12
あっという間に入院
それから東京都済生会中央病院に行き、土日なので救急窓口へ。
レントゲンを見た瞬間、「入院しましょうね」と言われ、その場でドレーンを胸に入れられる。
入院しろって言われた…
— Takayuki Hasegawa (@hase1031) 2013, 10月 12
ここまでのスピードが圧倒的すぎて、自分でも実感がなかった。笑
30分くらいで脇腹に穴があき、もう病室に移動。けっこう痛い状態。
医者からは、「ブラがあるなら手術を薦めます。気胸の再発率は40%と高く、特に中度以上の人は再発しなくても手術したほうがいい。手術をすると再発率は実質1%くらいまで抑えられる。」
手術と言われても、それで入院期間が伸びるのもやだし、CTをとってから決めることに。
結局、CTをとってみたら、ブラっぽい円形が確認できるらしく、再度親を交えて説明される。
色々、リスクに関する説明をされ、脅されてちょっと怖かったが、再発するのは嫌(気胸は放って置くと命に関わる病気)なので、手術をしてもらうことを決断。
心の中では、手術代が心配だったが、命に代えられないと思い、聞くのをやめた。笑
初めての手術
手術前は、手術を初めてだったので、最初は怖かった。
でも、よくよく考えると全身麻酔でいつの間にか終わるので、術後のことを心配し始めた。
尿管っていうのがいまいち想像できなくて、それだけが嫌だった。
手術室はラジオがかかっていて、お医者さんも意外と堅苦しくなく、麻酔を入れるまで雑談してた。
麻酔を入れた3秒後くらいにはもう意識はなくて、いつの間にか終わっていた。
術後の部屋での会話。
自分「早く終わったんですね(2時間でおわっていたので)」
医者「すぐにブラは見つかったよ。意識は大丈夫そうだね。これがブラですよ。」
自分「ぼやけてて見えないっす」
医者「いま見ないともう見ることないなー。じゃあ、病室に移動しようか」
こんな感じ。
病室で、親がブラの写真を見せてくれたけど、肺に白くて丸い泡っぽいのが付いていた。
よりあえず上手く行ってよかったという感想。
術後の体調
術後は1日中起きちゃいけないとのことで、横になってた。
同じ方向しか向けないので、腰がいたいし、汗もかいて痒みもやばかった。
熱も出たり出なかったりで安定しない体調でした。
術後1日目にはドレーンもとって、尿管もとれた。
術後2日目には退院できることになった。
レントゲンを見る限り、空気漏れはしてなさそうだということで、傷口の痛みをかなりあるものの、自分の意志で退院することにした。
次の日から会社に行こうと思っていたけれども、熱が出たのでこの週はずっと休むことにし、今に至る。
ちなみに心配の種だった手術台はやっぱり高かった。笑
退院した。海外旅行と同じくらいのお金を失った。
— Takayuki Hasegawa (@hase1031) 2013, 10月 17
来週から
社会復帰します。
まだまだちょっとした動きで左胸が痛いけど、職業柄動かないので大丈夫だと思っている。
入院している間は、上司がゆっくり休むように指示してくれたし、同期はお見舞いしに来てくれて、感謝している。
来週からは違うチームにJoinすることになっているし、心機一転がんばろう!
言語処理学会の若手奨励賞をもらった
どうも、最近Javascriptしか書いてない長谷川です。
この度、3 月の言語処理学会で発表した論文で若手奨励賞を受賞しました。
お世話になった皆様に深く御礼申し上げます。
言語処理学会(NLP2013)に参加した
これで国内で発表した論文全て(3/3)で賞をいただいたことになります。
非常にありがたく、先生方には感謝するばかりです。
最近、私はACLの発表資料作成や論文誌の査読コメント反映で土日を使っている非リアな生活を送っています。
なぜ発表資料を作っているのかというと、お金の目処が付いたことで、私もブルガリアに発表しに行けることになったからです。(∩´∀`)∩ワーイ
この件に関しては会社の人や教授に迷惑をかけてしまいました。感謝の一言です。
本当は、週末は遊んだり、Javascriptの勉強に費やさなきゃいけないところですが、来週いっぱいまではアカデミアに捧げます!
この機会に、プログラムも整理してるので、自信があったら github にでもあげてみようかなと思ったりもしてます。
次にブログを書くときはソフィアの写真をたくさんあげることでしょう(´∀`*)ウフフ
WWW2013のリンクを一部集めてみた
WWW2013のホームページを見てみると、タイトルにPDFへのリンクが貼られていなかったので、一部だけタイトルとURLを集めてみた。
SoCo: A Social Network Aided Context-Aware Recommender System
http://www2013.org/proceedings/p781.pdf
No country for old members: User lifecycle and linguistic change in online communities (Best paper nominee)
http://www2013.org/proceedings/p307.pdf
From Query to Question in One Click:
Suggesting Synthetic Questions to Searchers
http://www2013.org/proceedings/p391.pdf
Perception and Understanding of Social Annotations in
Web Search
http://www2013.org/proceedings/p403.pdf
Probabilistic Group Recommendation
via Information Matching
http://www2013.org/proceedings/p495.pdf
Dissecting the Evolution of the New OSN in its First Year
http://www2013.org/proceedings/p483.pdf
The Cost of Annoying Ads
http://www2013.org/proceedings/p459.pdf
WTF: The Who to Follow Service at Twitter
http://www2013.org/proceedings/p505.pdf
Mining Expertise and Interests from Social Media
http://www2013.org/proceedings/p515.pdf
Web Usage Mining with Semantic Analysis
http://www2013.org/proceedings/p561.pdf
Organizational Overlap on Social Networks
and its Applications
http://www2013.org/proceedings/p571.pdf
Unsupervised Sentiment Analysis with Emotional Signals
http://www2013.org/proceedings/p607.pdf
What Is the Added Value of Negative Links
in Online Social Networks?
http://www2013.org/proceedings/p727.pdf
Modeling/Predicting the Evolution Trend of OSN-based
Applications
http://www2013.org/proceedings/p771.pdf
Group Chats on Twitter
http://www2013.org/proceedings/p225.pdf
Is This App Safe for Children? A Comparison Study
of Maturity Ratings on Android and iOS Applications
http://www2013.org/proceedings/p201.pdf
On Participation in Group Chats on Twitter
http://www2013.org/proceedings/p165.pdf
Reactive Crowdsourcing
http://www2013.org/proceedings/p153.pdf
Distributed Large-scale Natural Graph Factorization
http://www2013.org/proceedings/p37.pdf
Gender Swapping and User Behaviors
in Online Social Games
http://www2013.org/proceedings/p827.pdf
Hierarchical Geographical Modeling of User Locations
from Social Media Posts
http://www2013.org/proceedings/p25.pdf
Multi-Label Learning with Millions of Labels:
Recommending Advertiser Bid Phrases for Web Pages
http://www2013.org/proceedings/p13.pdf
Two Years of Short URLs Internet Measurement:
Security Threats and Countermeasures
http://www2013.org/proceedings/p861.pdf
The FLDA Model for Aspect-based Opinion Mining:
Addressing the Cold Start Problem
http://www2013.org/proceedings/p909.pdf
Iolaus: Securing Online Content Rating Systems
http://www2013.org/proceedings/p919.pdf
Ad Impression Forecasting for Sponsored Search
http://www2013.org/proceedings/p943.pdf
On Cognition, Emotion, and Interaction Aspects of Search
Tasks with Different Search Intentions
http://www2013.org/proceedings/p931.pdf
Latent Credibility Analysis
http://www2013.org/proceedings/p1009.pdf
Predicting Group Stability in Online Social Network
http://www2013.org/proceedings/p1021.pdf
Efficient Community Detection in Large Networks using
Content and Links
http://www2013.org/proceedings/p1089.pdf
Trade Area Analysis using User Generated Mobile
Location Data
http://www2013.org/proceedings/p1053.pdf
Learning Joint Query Interpretation and Response Ranking
http://www2013.org/proceedings/p1099.pdf
Pricing Mechanisms for Crowdsourcing Markets
http://www2013.org/proceedings/p1157.pdf
A Predictive Model for Advertiser Value-Per-Click in
Sponsored Search
http://www2013.org/proceedings/p1179.pdf
Question Answering on Interlinked Data
http://www2013.org/proceedings/p1145.pdf
Truthful Incentives in Crowdsourcing Tasks
using Regret Minimization Mechanisms
http://www2013.org/proceedings/p1167.pdf
Whom to Mention: Expand the Diffusion of Tweets by
@ Recommendation on Micro-blogging Systems
http://www2013.org/proceedings/p1331.pdf
Content-Aware Click Modeling
http://www2013.org/proceedings/p1365.pdf
Is It Time For a Career Switch?
http://www2013.org/proceedings/p1377.pdf
Google+ Ripples:
A Native Visualization of Information Flow
http://www2013.org/proceedings/p1389.pdf
From Cookies to Cooks: Insights on Dietary Patterns via
Analysis of Web Usage Logs
http://www2013.org/proceedings/p1399.pdf
Wisdom in the Social Crowd: an Analysis of Quora
http://www2013.org/proceedings/p1341.pdf
Predicting Advertiser Bidding Behaviors in Sponsored
Search by Rationality Modeling
http://www2013.org/proceedings/p1433.pdf
Predicting Positive and Negative Links in Signed Social
Networks by Transfer Learning
http://www2013.org/proceedings/p1477.pdf
Mining Acronym Expansions and Their Meanings
Using Query Click Log
http://www2013.org/proceedings/p1261.pdf
Groundhog Day: Near-Duplicate Detection on Twitter
http://www2013.org/proceedings/p1273.pdf
When Relevance is not Enough:
Promoting Diversity and Freshness in
Personalized Question Recommendation
http://www2013.org/proceedings/p1249.pdf
DIGTOBI: A Recommendation System for Digg Articles
using Probabilistic Modeling
http://www2013.org/proceedings/p691.pdf
Predicting Purchase Behaviors from Social Media
http://www2013.org/proceedings/p1521.pdf
Anatomy of a Web-Scale Resale Market:
A Data Mining Approach
http://www2013.org/proceedings/p1533.pdf
Questions about Questions: An Empirical Analysis of
Information Needs on Twitter
http://www2013.org/proceedings/p1545.pdf