宗岡 康太
静岡大学 情報学部 情報科学科 4年 / 狩野研究室 (行動情報学科)
自然言語処理 (NLP)、とくに大規模言語モデルの忘却 (LLM Unlearning) や機械論的解釈可能性 (Mechanistic Interpretability) に興味があります。
interests
- 自然言語処理 (NLP)
- LLM Unlearning
- 機械論的解釈可能性
- 拡散言語モデル
- 表現空間の構造解析
research (まだまだ途上です)
忘却応答による表現構造マッピング
Unlearning-Mapping
忘却操作に対するモデルの応答パターンを介入プローブとして使い、層ごとの特徴・概念ネットワークの可視化や多言語間の差異の分析に取り組んでいます。
拡散言語モデルの構造的可逆性
Unlearning-Bidirectual-Architecture
拡散言語モデルを忘却操作だけで自己回帰モデルに戻せるかという問いのもと、双方向参照経路の選択的除去や経路分解の実験を行っています。詳細はGitHubをご覧ください。
訓練不要の語彙合成
VocabSynth
(これはUnlearningではないですが) 追加学習なしで既存トークンの埋め込みから複合概念を表す仮想トークンを合成できないか試しています。詳細はGitHubをご覧ください。
projects
2026春季 国内大会 自然言語処理部門 (JSAI2026) (2026年 6月8日~12日)
人狼ゲームをLLM (エージェント) にプレイさせ、勝率や発話の人間らしさなどを競う大会に出場し、5人村・人手評価の部門で1位を受賞しました (チーム Oxymoron)。詳細については大会ページをご覧ください。
日本テレビ様との国会審議分析 (2026年 4月11日)
衆議院予算委員会の質疑応答をLLMで多軸評価し、回避表現の検出や政策領域の分類を行いました。分析結果は日本テレビ様の報道番組に提供しています。詳細については研究室ページをご覧ください。
tools
先行研究調査時のハルシネーション抑制Skills、Hooks
prior-art-review
Coding Agentが研究提案や実験計画を出す前に、関連研究を一次資料まで遡って、必ず具体的な記載まで確認させるためのSkillsやHooksを公開しています。詳細はGitHubをご覧ください。
certification
応用情報技術者試験 (AP) (2022年春季 合格)
高校在学中に受験しました。なつかしいです。