News

TransMedia Tech Lab 博士課程学生程凡さんが国際会議 IIAI AAI 2025-Winter にて Competitive Paper Award を受賞

2025.12.21

東京工科大学コンピュータサイエンス学部 TransMedia Tech Lab に所属する博士課程の 程 凡(Cheng Fan)さん が、国際会議 IIAI AAI 2025-Winter においてCompetitive Paper Award(上位論文賞) を受賞しました。

本賞は、投稿論文の中でも 特に独創性・理論的貢献・将来性が高い研究 に対して授与されるものであり、本研究の学術的価値が国際的に高く評価されたことを示しています。


■ 受賞論文概要

Beyond Frequency: An Entropy–Jensen–Shannon Framework for Condition-Specific Word Extraction

本研究は、テキストデータにおいて、「どの条件(カテゴリ)に、どの単語が本質的に特徴的なのか」を、頻度に依存せずに抽出・可視化する新しい情報理論的手法を提案しています 

従来広く用いられてきた TF-IDF や PMI などの手法は、

  • 頻度の高い一般語(ストップワード)が上位に残りやすい

  • クラス間の関係構造を捉えにくい

    といった課題を抱えていました。

これに対し本研究では、

  • ラベル条件付き確率分布に基づくエントロピー(Shannon entropy)

    → 単語が特定の条件にどれだけ集中しているかを定量化

  • Jensen–Shannon 距離

    → クラス間の語彙分布の「形の違い」を測定・可視化

を統合した Entropy–JS フレームワークを提案しています。

この枠組みにより、

  • ストップワードリストに依存せず

  • パラメータやデータ量の変化にも頑健で

  • 条件特有の語とクラス間構造を同時に理解可能

という、解釈性に優れた単語抽出と分析を実現しました。


■ 実験結果と評価

20 Newsgroups データセットを用いた実験では、

  • rec.sport.hockey クラスにおいて

    nhl, bruins などが

    約98%の確率で特定クラスに集中する低エントロピー語として抽出

  • サンプリング率や平滑化係数を変えても

    順位安定性(Spearman@20 > 0.9)を一貫して維持

  • TF-IDF や PMI とは異なる語集合を抽出しつつ、

    χ² 検定とは統計的に有意な整合性を確認

するなど、本手法がに有効であることが示されました。一方で、本手法は分類精度向上を直接目的とするものではなく、説明性・分析・知識発見に特化した基盤技術である点も明確に位置付けられています。


■ 今後の展望と意義

Entropy–JS は、

  • 社会科学における言説分析

  • マーケティングにおける顧客属性別語彙分析

  • 医療・ヘルスケア分野のテキスト解釈

  • Explainable AI(XAI)パイプラインへの統合

など、幅広い分野への応用が期待される基礎技術です。

今回の Competitive Paper Award 受賞は、TransMedia Tech Lab における 理論性と解釈性を重視したデータ分析研究が国際的にも高く評価されたことを示す重要な成果です。