NTTとNTTレゾナント、共同実験でブログから映画の評判を抽出
NTTとNTTレゾナントは12月18日、NTTレゾナントのポータルサイト「goo」の実験サイト「gooラボ」で、映画がブログ上で、どのような評価やイメージを持たれているかを知ることができるサービス「オピニオンReader for 映画」の共同実験を開始したと発表した。実験は12月18日から1年間の予定で行う。
サービスはNTTサイバーソリューション研究所が開発した「意見抽出技術」と「意見分類技術」を活用。「意見抽出技術」は文章の文末が主観的な記述で表記されている場合に限り文を抽出する技術。2社が行った独自調査では、日本語で筆者が意見を表現するのは文末部分であることが判明、そのため同技術を使って文の終わりの語句に注目し、意見を集めることにした。
例えば、「美しい」という表現がブログ中に複数含まれていた場合、「その湖は美しい」という文であれば、その「美しい」は主観的記述で意見として抽出する。一方、「美しい湖がある村に行った」という文章では「美しい」という主観的記述が形容詞的に使用されているだけで、ブログの筆者の伝えたいのは「行った」という出来事であると判断、意見として抽出しない。
これらにより、引用意見や説明などを除外することが可能で、ブログ筆者の意見のみを集めることができる。同時にブログ記事がどの映画について書かれているかの分析も行い、上映している映画などについての意見を抽出するため、高い精度でブログ上での評判を知ることができるという。
さらに、作品を公平に比較するために、意見を抽出するブログ記事の数に上限を設定したり、情報源の偏りを防止するため、ブログ記事から意見を抽出する文章の数にも上限を設定するといった工夫も施した。
一方、「意見分類技術」は抽出した意見を映画に合った項目別で的確に整理・分類する技術。例えば、「とても愉快でした」という記述は「楽しい」という映画のイメージに集計、「女優がピカイチだった」という記述は「出演者が好評」という項目に集計する。
「オピニオンReader for 映画」では、こうして集めた意見を、上映している作品などについて、記事数を考慮した上で好評の評判の割合が高い順にランキング表示する「評判ランキング表示」、「楽しい」「暖かい」などのイメージワードの意見が多い順にランキング表示する「イメージワードランキング表示」といった機能でユーザーに提供する。
そのほか、評判とイメージワードのランキングの一部をサイトのトップ画面に表示したり、映画の評判とイメージワードを抽出したブログから、該当する意見文の一部を表示したりする機能も提供。また、表示する映画について、映画情報コンテンツの「goo映画」と相互で作品情報や評判などを参照できるようにした。
NTTは、今回の実験で必要な技術を提供。実験終了後は評価とフィードバックを行うことで、技術展開や商用サービスでの機能の有用性などを検証し、次の技術開発に活かす。一方、NTTレゾナントは、実験終了後の商用サービス移行に視野に、利用動向やユーザーの意見を確認しながらビジネスとしての可能性を評価・検討していく方針。