ニフティ、スパムブログのフィルタリング技術を開発
ニフティ(和田一也社長)は3月26日、社内研究機関「ニフティ研究所」が、アフィリエイトや特定サイトへの誘導などを目的とした「スパムブログ」を自動的に判別できるフィルタリング技術を開発したと発表した。
ニフティ研究所では、スパムブログを大きく「自動生成系」と「アダルト系」の2つに分類。さらに、「自動生成系」は、「引用スパム」「アフィリエイトスパム」「ワードサラダ」「自動マルチポスト」の4つ、「アダルト系」は「わいせつ記事」「出会い系」「ワンクリック詐欺」の3つに分類・定義し、複数のフィルタリング技術を組み合わせることで、こうしたスパムブログの特性に合わせた最適なフィルタリングを可能にした。また同時に、これらのスパムブログを自動的に判別・フィルタリングできる技術を開発した。
ニフティでは、今回開発したスパムブログフィルタリング技術を利用し、同社のブログ評判分析サービス「BuzzPulse(バズパルス)」で、国内の約9割強のブログ、4.5億記事を対象に、ブログ記事中に占めるスパムブログ率や、その種類などを調査。07年10月?08年2月の各月ごとに、それぞれ約10万記事をサンプリングして調べたところ、平均で約40%がスパムブログという結果となった。なお、開発したスパムフィルタリング技術は、「BuzzPulse」とオンラインサービス「BuzzSeeQer(バズシーカー)」に盛り込む予定。
ニフティ研究所では、スパムブログを大きく「自動生成系」と「アダルト系」の2つに分類。さらに、「自動生成系」は、「引用スパム」「アフィリエイトスパム」「ワードサラダ」「自動マルチポスト」の4つ、「アダルト系」は「わいせつ記事」「出会い系」「ワンクリック詐欺」の3つに分類・定義し、複数のフィルタリング技術を組み合わせることで、こうしたスパムブログの特性に合わせた最適なフィルタリングを可能にした。また同時に、これらのスパムブログを自動的に判別・フィルタリングできる技術を開発した。
ニフティでは、今回開発したスパムブログフィルタリング技術を利用し、同社のブログ評判分析サービス「BuzzPulse(バズパルス)」で、国内の約9割強のブログ、4.5億記事を対象に、ブログ記事中に占めるスパムブログ率や、その種類などを調査。07年10月?08年2月の各月ごとに、それぞれ約10万記事をサンプリングして調べたところ、平均で約40%がスパムブログという結果となった。なお、開発したスパムフィルタリング技術は、「BuzzPulse」とオンラインサービス「BuzzSeeQer(バズシーカー)」に盛り込む予定。