ScalaMatsuri 2014に参加してきた

9/6, 7にサイバーエージェントで行われたScalaのカンファレンス、その名もScalaMatsuriに参加してきました。

今回は、発表者 & 微妙な準備委員 & スポンサーとして立場での参加でした。

(先に断っておくと、このブログでは自分たちの発表内容には触れません)

 

ScalaMatsuriが始まるまで

 最初に「微妙な準備委員」と書いていますが、実は当初、弊社の会場で開催する予定だったため、その窓口としての関わりでした。

窓口担当になって、準備委員のMTGに途中から顔を出すようになったのですが、最初はScala歴1年にも満たない自分がこんなことやっていていいのだろうか、有名な人たくさんいるからコワイとか思っていました。が、逆に考えるとこんなすごい人達と関われる機会があるなんて、なんてラッキーなんだとも思いました。scalaz, scalikejdbc 作ってる人たちと会うことなんてScala始めた当初は考えてもいませんでした。

実際にはそれほど話したりできたわけではありませんでしたが、良い経験になりました。

また、途中でサイバーエージェントさんに会場変更することになっても、迅速に対応して頂いて、スタッフの皆さまにはとても感謝しています。

 

あと、発表することになった経緯としては、DDD大好きおじさんが「You発表しちゃいなよ」みたいなノリで言ってきたので、それにのせられて申し込んだというのがきっかけでした。

実際、発表資料を準備するにあたり、いろいろな下調べを通じて、Scalaや自分たちのシステムへの理解がより一層深まって、やっぱり定期的に発表する機会設けるの大事だなーと感じました。

 

ScalaMatsuri当日

前日のノベルティ準備などはお手伝いしたのですが、当日はやることがなかったので普通の参加者として参加しました。

行ってみると、思った以上に人がいてびっくり!Scalaってこんなに人気あったんですね!

http://instagram.com/p/sn-WDPO_Hn/

ScalaMatsuri二日目きた

 

小田好先生の話とか聞ける機会は滅多にないのでとても良かったです。

これだけ有名な人たちをゲストとして招けるスタッフの人脈もすごいと思いますし、やっぱり日本のコミュニティも世界から重要視されてるんだなと感じました。

参加してて1番すごいと思ったのは、Sparkのデモでした。あれはやばい。

写真撮っとけば良かったのですが、Databricksのクローズドβの製品らしく、ブラウザ上でSparkを書いて、その結果をリアルタイムで可視化して見える製品でした。

きっとSparkをバックエンドで閉じさせないように、完成された分析ツールとしてのSparkをDatabricksは提供しようとしてるんじゃないかと思います。

あれはやく使ってみたいなー!

 

自分たちの発表はというと、うけもとれたし、質疑も活発だったので聴衆には伝えたいことが伝えられたかなと思います。

懇親会でも、「あの発表聞きました。ちょっとあそこ詳しく教えて欲しいんですけど…」とか「とっても面白かったです。アンケートに書いておきました」とか言ってくれる人が複数いて、とても嬉しかったです。

まだまだ未熟ですが、誰かの役にたてたなら、それでいいかなーっと。詳しいところは、他のやばい人たちに聞いてください。笑

 

最後に

発表や準備委員として活動する機会を与えてくれた弊社、チームメンバーには感謝してます。

この経験をこれからプロダクトをより良くするために使ったり、Scalaコミュニティの発展に活かせていけたらと思います。

スタッフの皆さま、お疲れ様でした!とても楽しかったです!

参加してくれた皆様もありがとうございました!

 

JAXA OPEN API COMPETITION に参加してきた

JAXAが提供するAPI利用したコンテストに参加してきました。

JAXA OPEN API COMPETITION

 

コンテストへの参加を決める

会社の同期が宇宙好きで、彼がこのコンテストを見つけたのがきっかけ。

個人的にもデータを扱ったアプリを作りたかったし、JAXAが提供するデータにも興味があったので、参加をきめました。(このときはどんなデータが提供されるか知らなかった)

その後、未来科学館でデータの説明があったのですが、データの種類が、降水量、土壌水分量、積雪深、海上風速、海面水温という何とも言えないデータで、かつ1年分しかないということで、参加をやめようかと思ったことは内緒にしておきます。

 

アプリの開発をする

最初は2人でブレインストーミングしながらアイデアを出していきました。

ヨットが早く進める航路を求めるだとか、渡り鳥のルートを推定するだとか、魚の移動ルートだとか、くだらないアイデアから実現できそうにないアイデアまでありましたが、最終的に、どの植物がどこで育つのかがわかるように2地点間の類似度を求めて可視化するというアプリに決めました。

もともと、私が農業が好きなので、押したというのはあります。笑

開発はというと、フロントエンドはもう1人に任せて、バックエンドを担当しました。

恥ずかしながら、初めてのRuby & Railsで、Railsの手軽さを感じながらの開発でしたね。

「gem, rake やばい、何も分からなくても進む、まるでソーシャルゲームのようだ」といった感じで。笑

ちなみに、類似度はコサイン類似度でグラフの類似性をスコア化しました。

この距離が向いているかどうかは別として、手軽に書けるので選びました。

 

コンテストで発表する

スライドはもう1人に作ってもらって、発表もほとんどやってもらいました。

実は、発表の直前の組が全く同じことをやっていて、2人して「やばい、帰りたい(´;ω;`)」って言ってました。。。

しかも、その前の組が賞をもらっていて、審査員も大差ないと言っていたので、ちょっと残念でした。

でも、会社の先輩がわざわざ見に来てくれていて、よかったと言ってくれたので、良しとしてます!!!

参加して、発表するということを最後までやったことも重要だったと思います。

 

これは、その先輩がとってくれた写真(わたしはタイトル言っただけで後方待機してます)

f:id:hase1031:20140303001209j:plain

 

 

あと、プレゼン資料をSlideShareにあげときました。

スライドにあるURLはこのブログを見ている頃には見れなくなっているかもしれないのでご注意を。

 

最後に

賞は取れなかったけれど、良い経験が出来たと思います。

 よかったら、作ったアプリは見れるうちにポチポチしてみてください。

 

ワトソン本を読んだ

本は以下の通り。

IBM 奇跡の“ワトソン”プロジェクト: 人工知能はクイズ王の夢をみる 

 

ワトソンとは

IBM 質問応答システム“ワトソン”がクイズ番組に挑戦! - Japan から引用させてもらいます。

 ワトソンは、質問応答技術の更なる向上を目的に、自然言語処理技術をさらに進化させることを目的に設計されました。「ジョパディ!」で出題されるバラエティーに富んだ複雑な問題に対して、100万冊の本を読むのに相当する自然言語で書かれた情報の断片を分析し、短時間で最も適した解答を導き出す分析コンピューティング・システムです。

 「ジョパディ!」は、歴史、文学から科学など幅広いジャンルを扱うクイズ番組として全米で親しまれています。出場者は短時間のうちに正確な解答を返すために、質問に含まれる微妙な意味、風刺や謎掛けなどの複雑な要素の分析をしなければなりません。本来、人間とは異なり、自然言語を正確に理解することのできないコンピューターにとっては大きな挑戦であり、質問応答技術の進歩に貢献できる格好のチャンスでもありました。

ワトソンは、システム設計と分析において技術を進歩させました。瞬時に複雑な質問文を解析して正しい解答を導かねばならないため、ワトソンのソフトウェアは、大量のタスクを処理できるよう最適化されたIBMのPOWER7サーバーで動作します。このシステムには、リアルタイムで情報を分析しながら莫大な量の並列タスクとデータを処理するという特殊な要求を満たすため、独自の技術が数多く取り入れられています。ワトソンは、Linuxが稼働する「IBM Power 750サーバー」のラック10本分、総メモリー容量15TB、総プロセッサー・コア数は2,880個で構成されており、インターネットには接続されていない完全に自己完結したシステムです。

ワトソンの研究開発プロジェクトは、非構造データ分析、自然言語処理、ワークロード最適化システムの設計分野におけるテクノロジーを前進させました。ワトソンを支える技術は、今後より迅速で正確な医療診断支援、潜在的な薬物間相互作用の検査、弁護士や裁判官による過去の判例の参照、金融分野の仮説シナリオと法令順守など、さまざまな分野への応用が期待されています。

 

 本で面白かった点について

一番おもしろかったのは、第7章 人工知能研究の現状とゆくえ でした。

以下、書かれていたことをピックアップして紹介します。

 

人工知能は、科学の多くの分野同様、はるか昔に実用主義と理想主義の2陣営に分かれ、今日に至っているらしいです。

理想主義から見れば、ワトソンは所詮統計分析マシンで、限界がある。

AIには「考え、知り、学ぶ」マシンを開発するという輝くような夢があり、ワトソンはそれには当てはまらない。

いろいろな意味でワトソンは知能が低い。統計データを巧みに扱えるだけで、実質、何も知らない。

そんな欠点だらけのワトソンが、もし、効果的で万能の知識マシンであると評価されてしまったら、これはもう別路線を行くAI技術の終焉を意味しかねない。

そんな声が出てきていたようです。 

 

しかしながら、理想を実現するためには、かなりの年月が必要になってしまうとアポロ計画と比較しながら紹介されています。

ケネディ大統領がアポロ計画を宣言したとき、既に基本的な科学研究はほぼ全て出揃っていて、あとは必要なあれこれを寄せ集めて、適切な規模に拡大し、宇宙性を組み立てて空に打ち上げるだけでよかった。

それに比べると、AI研究はガリレオの時代であり、まだニュートンまで行っていない。

大きな目標である人間の思考のリバースエンジニアリングとなると、まだまだ膨大な時間と努力が必要になる。

だからこそ、ワトソンは現実路線をいくしかなかった、とされています。

 

この現実路線を行く例としてGoogleが挙げられています。

2005年に行われた機械翻訳のコンテストで、アラビア語や中国語の専門家が一人もいないGoogleが他を圧倒した。

「言語のニュアンスなど忘れろ、すべてを数学でやれ。」

そんな潮流が生まれた、と。

私は現在ではそれが主流になっているように感じます。

言語のニュアンスなど忘れろは言い過ぎかもしれませんが、現在の自然言語処理のトップカンファレンスでは統計の知識が不必要な論文はほとんどありません。

それだけ統計が大事にな要素になってきています。

 

しかし、これはジレンマであるとの忠告がなされています。

この潮流はAIの理想からは離れてしまう。なぜなら、マシンは本質的に無知のままだからです。

映画に出てくるようなAIが登場するのはいつになるのか… すぐには難しそうですね…

 

まとめ

人工知能の研究をする人は、読んで損のない内容になっています。

ぜひ読んでください!ためになりました!!

 

VAIOのメモリを4GBから8GBにした

4年前に買ったVAIOのメモリを8GBにした。

本当は古いので新しいノートパソコンを買えばいいのだが、もったいなく感じメモリを増やすことに決め、さっそく購入した。

購入したメモリは、TranscendのDDR3が4GB×2で約8000円。

f:id:hase1031:20131126221134j:plain 

f:id:hase1031:20131126221153j:plain

 

VAIOの型番は、 VGN-Z73FB。初期で2GB×2のメモリが入っている。上限は8GBらしい。

さっそくパソコンの裏を空けて、見てみた。

f:id:hase1031:20131126221210j:plain

 

ハイニックスのメモリが入ってた。

これをとってから、買ったTranscendのメモリを入れる。

斜めから入れると奥まで入る。

f:id:hase1031:20131126221221j:plain

 

特に2枚めはちょっと押しこむ必要があるけど、奥まで入っていれば大丈夫。

f:id:hase1031:20131126221248j:plain

 

パソコンのメモリを確認してみると…

f:id:hase1031:20131126221236j:plain

 

8GBになってた!よかった!

(低スペックとか言わないで!) 

 

これで気軽にIntelliJを使ったり、Scalaのビルドができるぞ!

 

 

 

気胸になりました

気胸で1週間ほど入院してました。

 

胸の痛みで病院へ

週初めに左胸に痛みが出始め、週末にヒルズの病院へ。

最初は気胸狭心症かなと思いつつ、循環器内科に見てもらった。

色々調べてもらった結果、レントゲンで気胸とわかり、水は溜まっていないとのこと。

医者からは「大きい病院を紹介するから、これからタクシーで行ってください」と言われ、電車で最寄り駅に向かうことにする(だってタクシー高いもん)。

ここでのお会計6,500円にまず絶句。

しかし、中度だと言われたので、病院にきて良かった。

 

あっという間に入院

それから東京都済生会中央病院に行き、土日なので救急窓口へ。

レントゲンを見た瞬間、「入院しましょうね」と言われ、その場でドレーンを胸に入れられる。

ここまでのスピードが圧倒的すぎて、自分でも実感がなかった。笑

 

30分くらいで脇腹に穴があき、もう病室に移動。けっこう痛い状態。

医者からは、「ブラがあるなら手術を薦めます。気胸の再発率は40%と高く、特に中度以上の人は再発しなくても手術したほうがいい。手術をすると再発率は実質1%くらいまで抑えられる。」

手術と言われても、それで入院期間が伸びるのもやだし、CTをとってから決めることに。

結局、CTをとってみたら、ブラっぽい円形が確認できるらしく、再度親を交えて説明される。

色々、リスクに関する説明をされ、脅されてちょっと怖かったが、再発するのは嫌(気胸は放って置くと命に関わる病気)なので、手術をしてもらうことを決断。

心の中では、手術代が心配だったが、命に代えられないと思い、聞くのをやめた。笑

 

初めての手術

手術前は、手術を初めてだったので、最初は怖かった。

でも、よくよく考えると全身麻酔でいつの間にか終わるので、術後のことを心配し始めた。

尿管っていうのがいまいち想像できなくて、それだけが嫌だった。

 

手術室はラジオがかかっていて、お医者さんも意外と堅苦しくなく、麻酔を入れるまで雑談してた。

 麻酔を入れた3秒後くらいにはもう意識はなくて、いつの間にか終わっていた。

術後の部屋での会話。

自分「早く終わったんですね(2時間でおわっていたので)」

医者「すぐにブラは見つかったよ。意識は大丈夫そうだね。これがブラですよ。」

自分「ぼやけてて見えないっす」

医者「いま見ないともう見ることないなー。じゃあ、病室に移動しようか」

こんな感じ。

病室で、親がブラの写真を見せてくれたけど、肺に白くて丸い泡っぽいのが付いていた。

よりあえず上手く行ってよかったという感想。

 

術後の体調

術後は1日中起きちゃいけないとのことで、横になってた。

同じ方向しか向けないので、腰がいたいし、汗もかいて痒みもやばかった。

熱も出たり出なかったりで安定しない体調でした。

 

術後1日目にはドレーンもとって、尿管もとれた。

術後2日目には退院できることになった。

レントゲンを見る限り、空気漏れはしてなさそうだということで、傷口の痛みをかなりあるものの、自分の意志で退院することにした。

次の日から会社に行こうと思っていたけれども、熱が出たのでこの週はずっと休むことにし、今に至る。

ちなみに心配の種だった手術台はやっぱり高かった。笑

 

 

 来週から

社会復帰します。

まだまだちょっとした動きで左胸が痛いけど、職業柄動かないので大丈夫だと思っている。

入院している間は、上司がゆっくり休むように指示してくれたし、同期はお見舞いしに来てくれて、感謝している。

来週からは違うチームにJoinすることになっているし、心機一転がんばろう!

言語処理学会の若手奨励賞をもらった

どうも、最近Javascriptしか書いてない長谷川です。

 

この度、3 月の言語処理学会で発表した論文で若手奨励賞を受賞しました。

お世話になった皆様に深く御礼申し上げます。

言語処理学会(NLP2013)に参加した

 これで国内で発表した論文全て(3/3)で賞をいただいたことになります。

非常にありがたく、先生方には感謝するばかりです。

 

最近、私はACLの発表資料作成や論文誌の査読コメント反映で土日を使っている非リアな生活を送っています。

なぜ発表資料を作っているのかというと、お金の目処が付いたことで、私もブルガリアに発表しに行けることになったからです。(∩´∀`)∩ワーイ

この件に関しては会社の人や教授に迷惑をかけてしまいました。感謝の一言です。

 

本当は、週末は遊んだり、Javascriptの勉強に費やさなきゃいけないところですが、来週いっぱいまではアカデミアに捧げます!

この機会に、プログラムも整理してるので、自信があったら github にでもあげてみようかなと思ったりもしてます。

 

次にブログを書くときはソフィアの写真をたくさんあげることでしょう(´∀`*)ウフフ

 

WWW2013のリンクを一部集めてみた

WWW2013のホームページを見てみると、タイトルにPDFへのリンクが貼られていなかったので、一部だけタイトルとURLを集めてみた。

 

SoCo: A Social Network Aided Context-Aware Recommender System

http://www2013.org/proceedings/p781.pdf

 

No country for old members: User lifecycle and linguistic change in online communities (Best paper nominee)

http://www2013.org/proceedings/p307.pdf

 

From Query to Question in One Click:

Suggesting Synthetic Questions to Searchers

http://www2013.org/proceedings/p391.pdf

 

Perception and Understanding of Social Annotations in

Web Search

http://www2013.org/proceedings/p403.pdf

 

Probabilistic Group Recommendation

via Information Matching

http://www2013.org/proceedings/p495.pdf

 

Google+ or Google-?

Dissecting the Evolution of the New OSN in its First Year

http://www2013.org/proceedings/p483.pdf

 

The Cost of Annoying Ads

http://www2013.org/proceedings/p459.pdf

 

WTF: The Who to Follow Service at Twitter

http://www2013.org/proceedings/p505.pdf

 

Mining Expertise and Interests from Social Media

http://www2013.org/proceedings/p515.pdf

 

Web Usage Mining with Semantic Analysis

http://www2013.org/proceedings/p561.pdf

 

Organizational Overlap on Social Networks

and its Applications

http://www2013.org/proceedings/p571.pdf

 

Unsupervised Sentiment Analysis with Emotional Signals

http://www2013.org/proceedings/p607.pdf

 

What Is the Added Value of Negative Links

in Online Social Networks?

http://www2013.org/proceedings/p727.pdf

 

Modeling/Predicting the Evolution Trend of OSN-based

Applications

http://www2013.org/proceedings/p771.pdf

 

Group Chats on Twitter

http://www2013.org/proceedings/p225.pdf

 

Is This App Safe for Children? A Comparison Study 

of Maturity Ratings on Android and iOS Applications 

http://www2013.org/proceedings/p201.pdf

 

On Participation in Group Chats on Twitter

http://www2013.org/proceedings/p165.pdf

 

Reactive Crowdsourcing

http://www2013.org/proceedings/p153.pdf

 

Distributed Large-scale Natural Graph Factorization

http://www2013.org/proceedings/p37.pdf

 

Gender Swapping and User Behaviors

in Online Social Games

http://www2013.org/proceedings/p827.pdf

 

Hierarchical Geographical Modeling of User Locations

from Social Media Posts

http://www2013.org/proceedings/p25.pdf

 

Multi-Label Learning with Millions of Labels:

Recommending Advertiser Bid Phrases for Web Pages

http://www2013.org/proceedings/p13.pdf

 

Two Years of Short URLs Internet Measurement:

Security Threats and Countermeasures

http://www2013.org/proceedings/p861.pdf

 

The FLDA Model for Aspect-based Opinion Mining:

Addressing the Cold Start Problem

http://www2013.org/proceedings/p909.pdf

 

Iolaus: Securing Online Content Rating Systems

http://www2013.org/proceedings/p919.pdf

 

Ad Impression Forecasting for Sponsored Search

http://www2013.org/proceedings/p943.pdf

 

On Cognition, Emotion, and Interaction Aspects of Search

Tasks with Different Search Intentions

http://www2013.org/proceedings/p931.pdf

 

Latent Credibility Analysis

http://www2013.org/proceedings/p1009.pdf

 

Predicting Group Stability in Online Social Network

http://www2013.org/proceedings/p1021.pdf

 

Efficient Community Detection in Large Networks using

Content and Links

http://www2013.org/proceedings/p1089.pdf

 

Trade Area Analysis using User Generated Mobile 

Location Data

http://www2013.org/proceedings/p1053.pdf

 

Learning Joint Query Interpretation and Response Ranking

http://www2013.org/proceedings/p1099.pdf

 

Pricing Mechanisms for Crowdsourcing Markets

http://www2013.org/proceedings/p1157.pdf

 

A Predictive Model for Advertiser Value-Per-Click in

Sponsored Search

http://www2013.org/proceedings/p1179.pdf

 

Question Answering on Interlinked Data

http://www2013.org/proceedings/p1145.pdf

 

Truthful Incentives in Crowdsourcing Tasks

using Regret Minimization Mechanisms

http://www2013.org/proceedings/p1167.pdf

 

Whom to Mention: Expand the Diffusion of Tweets by

@ Recommendation on Micro-blogging Systems

http://www2013.org/proceedings/p1331.pdf

 

Content-Aware Click Modeling

http://www2013.org/proceedings/p1365.pdf

 

Is It Time For a Career Switch?

http://www2013.org/proceedings/p1377.pdf

 

Google+ Ripples: 

A Native Visualization of Information Flow 

http://www2013.org/proceedings/p1389.pdf

 

From Cookies to Cooks: Insights on Dietary Patterns via

Analysis of Web Usage Logs

http://www2013.org/proceedings/p1399.pdf

 

Wisdom in the Social Crowd: an Analysis of Quora

http://www2013.org/proceedings/p1341.pdf

 

Predicting Advertiser Bidding Behaviors in Sponsored

Search by Rationality Modeling

http://www2013.org/proceedings/p1433.pdf

 

Predicting Positive and Negative Links in Signed Social

Networks by Transfer Learning

http://www2013.org/proceedings/p1477.pdf

 

Mining Acronym Expansions and Their Meanings

Using Query Click Log

http://www2013.org/proceedings/p1261.pdf

 

Groundhog Day: Near-Duplicate Detection on Twitter

http://www2013.org/proceedings/p1273.pdf

 

When Relevance is not Enough:

Promoting Diversity and Freshness in

Personalized Question Recommendation

http://www2013.org/proceedings/p1249.pdf

 

DIGTOBI: A Recommendation System for Digg Articles

using Probabilistic Modeling

http://www2013.org/proceedings/p691.pdf

 

Predicting Purchase Behaviors from Social Media

http://www2013.org/proceedings/p1521.pdf

 

Anatomy of a Web-Scale Resale Market:

A Data Mining Approach

http://www2013.org/proceedings/p1533.pdf

 

Questions about Questions: An Empirical Analysis of

Information Needs on Twitter

http://www2013.org/proceedings/p1545.pdf