論文 arXiv 発表: 2026-04-27

回転を学習する:逐次モデリングのための時間的・意味的ロータリーエンコーディング

Learning to Rotate: Temporal and Semantic Rotary Encoding for Sequential Modeling

著者: Hailing Cheng, Daqi Sun, Xinyu Lu

要約

Transformerアーキテクチャでは、Rotary Positional Embedding(RoPE)の回転多様体(rotation manifold)は離散的な順序インデックスのみで構成される固定構造として扱われてきた。本論文はこの回転空間がアテンション機構における見落とされた第二の表現次元であると主張する。複素数の実軸と虚軸のアナロジーで説明すれば、トークン埋め込みが意味的(実)成分(トークンが何を意味するか)を担う一方、回転が動的(虚)成分(他のトークンとの関係性)を担うという枠組みを提唱する。具体的な実装としてSIREN-RoPEを提案し、連続タイムスタンプ・周期的時間パターン・カテゴリメタデータをSINEN(Sinusoidal Representation Network)のデュアルブランチ構造で回転次元に注入する。大手ソーシャルネットワークの本番規模ニュースフィードデータセットを用いた生成型推薦モデルでの評価では、計算コストのオーバーヘッドをほぼ増やさず、キャリブレーションおよびランキング指標の一貫した改善が示されたとしている。

筆者コメント

RoPEはSu et al.(2021年)以来、位置情報の符号化手法として広く普及しているが、その回転空間を学習可能なシグナル条件付き空間として扱うという発想は斬新と見られる。従来のALiBiやXPosなどの位置エンコーディング改良研究が主に実数空間の修正に留まっていたのに対し、本研究は回転多様体そのものを表現の独立な次元として捉え直している点が概念的に興味深い。ただし、評価が自社(大手ソーシャルネットワーク)の推薦システムという非公開データセットに限定されており、再現性の観点からは懸念が残る。NLPや一般的なシーケンスモデリングタスクでの汎用的な有効性が未検証の状態でありアブストラクトの範囲では「proof of concept」との記述に留まっている点は注意が必要だ。日本語テキストへの適用を考えると、日本語の時系列ドキュメント(ニュース・SNS投稿等)においても連続タイムスタンプや周期パターンの注入は有効な可能性があるが、形態素レベルの埋め込みとの相性や語順の特性との関係を別途検証すべきと考えられる。実務応用としては推薦・検索ランキング系のユースケースが最も適合しやすいと見られ、計算オーバーヘッドが小さい点は産業界にとって魅力的だろう。

※ このコメントは本サイト独自のものです。論文・記事の公式見解ではありません。

#coding#benchmark

同じカテゴリの記事