先月末からの約1週間、アイルランドのダブリンのトリニティカレッジで開催されたSIGIRに参加してきました。トリニティカレッジは16世紀に出来た大学だそうで、とても歴史を感じる建物が多く、この時期は観光シーズンなのか、学内を案内するツアーが30分おきぐらいの間隔で、それぞれ20人程度の観光客を引き連れて学内のあちこちで見かけられました。気温は摂氏17度~22度程度でとても心地よく、朝は少し肌寒い感じでした。リセプションは『黒ルビーのギネスビール』で有名な、ギネスの工場跡(現在は観光向けコース)で行われました。一方、バンケットは8万人以上を収容できるクロークパーク・スタジアム内のディナー会場で行われました。
学会では、Modern Information Retrievalの名著で有名なRicardo Baeza-Yates先生をはじめ、この分野の有名人が結構参加していました。IBM Watson研究所からkey note speaker
として招待講演されていたJohn R SmithさんのRiding the Multimedia Big Data Waveは
面白く、満員の会場で「マルチメディアのビッグデータをどう扱うか」を力説していました。専門用語になりますが、内容的には、TRECVIDに参加した経験から、Semantic “faceted” learningの重要性と、ビッグデータを扱う場合の上手な階層化やpruningが性能向上にとても重要であるという話でした。トークの最後には、IBMとコロンビア大学の共同研究の成果の話を添えて、ちゃかり宣伝していました。
学会での発表を幾つかピックアップして聞いた範囲では、ざっくりと以下のようなメッセージを感じ取りました。リストの最後のメッセージはどんな学会でも当てはまるかと思います。
- テキスト処理でストップワードを作る場合は、分野に応じて準備せよ
- トピックとは=Probabilistic Distribution of Words (LDA, pLSA等はこの例)と思え
- 関連文献としては、ACM SIGIRのほか、ACM CIKM, IEEE ICDM, CLEF, ECIR, ACL, WWW, CVPRなどを、論文投稿時に必ずチェックすべし
- 口頭発表で採録されたグループがどんなデータを使って研究していたかをチェックすべし
以下は、SIGIR2013の会場周辺で撮影した写真です。
右下の右から2番目の人がBaeza-Yates先生です。なお、会議の様子は
http://www.flickr.com/photos/sigir2013/にも掲載されているようです。