WorldRhythm：民族音楽学の原理に基づく異文化リズム生成の統一フレームワーク

要旨

本論文では、統一アーキテクチャ内で10の異なる音楽文化にわたるリズムパターンを生成するルールベースのアルゴリズムフレームワーク、WorldRhythmを紹介する。単一の文化的伝統に焦点を当てるか、西洋偏重のデータセットに依存する機械学習に頼る既存のアプローチとは異なり、WorldRhythmは4層の役割階層を採用し、文化固有の優先度マトリクスと独自のリズム概念のための専門エンジンを組み合わせている。このシステムは、西アフリカのポリリズム、アフロキューバンのクラーベ、ジャワのガムラン、バリのコテカン、インドのターラ、バルカンのアクサクの伝統に関する民族音楽学研究を、パラメータ化された解釈可能な生成システムに統合している。本論文では、フレームワークのコアアーキテクチャ、アルゴリズムプロセス、理論的基盤について説明する。

キーワード：リズム生成、計算民族音楽学、異文化音楽、インターロックパターン、ポリリズム、アルゴリズム作曲

1. 序論

計算リズム生成は主に西洋のポピュラー音楽スタイルに焦点を当ててきた。Groove MIDIデータセットやMagentaのドラム転写コーパスなどの主要な公開データセットは、ロック、ポップ、ファンク、ジャズを含む西洋のジャンルでほぼ完全に構成されている。最近の研究（Mehta et al., 2024）は100万時間以上のオーディオデータセットを分析し、86%がグローバルノースの音楽に集中し、93%の研究者が主に西洋音楽を研究していることを発見した。GrooVAEやDrum RNNなどの機械学習アプローチは、表現力豊かなドラム演奏生成で成功しているが、主にこれらの西洋中心のデータセットで訓練されており、文化固有のリズム原則の明示的なモデリングが欠けている。

いくつかの計算システムが非西洋音楽の伝統に個別に取り組んでいる：CompMusicプロジェクト（バルセロナUPF）はカルナータカ音楽とヒンドゥスターニー音楽のデータセットとターラ検出システムを開発した；Toussaintの研究に基づくユークリッドリズムジェネレーターは広く実装されている；そして様々なガムランアルゴリズム作曲システムが存在する。しかし、これらの取り組みは通常、単一の伝統を対象としている。さらに、タブラとムリダンガムの転写のための計算システムは約93%の精度を達成しており、特定の伝統のモデリングの実現可能性を示している。

民族音楽学研究は世界中の洗練されたリズムシステムを記録してきた。これには西アフリカ音楽のタイムライン概念、アフロキューバン伝統のクラーベ、ジャワガムランのコロトミック構造、バリ音楽のコテカンインターロック、インド古典音楽のターラサイクル、バルカン民俗音楽のアクサク非対称拍子が含まれる。しかし、これらの概念が単一の生成フレームワーク内で統一されることは稀であった。

WorldRhythmは、複数の音楽伝統の構造原則を尊重するリズムパターンを生成する、パラメータ化されたルールベースのシステムを提供することでこのギャップを埋める。このフレームワークは解釈可能で制御可能であり、民族音楽学文献に基づいている。

2. システムアーキテクチャ

2.1 4層役割階層

WorldRhythmは、複数の打楽器伝統で観察される機能的階層化に触発された4層の役割システムを採用している：

Timeline（タイムライン）：西アフリカのアンサンブルのベルパターンやキューバ音楽のクラーベに類似したリズムの参照フレームワーク。この層は他の層が組織化する時間的アンカーを提供する。

Foundation（ファンデーション）：疎で安定したパターンを特徴とする低周波の骨格層。これは、西アフリカ音楽のドゥヌンバやブラジルサンバのスルドなど、ほとんどの伝統におけるバスドラムに対応する。

Groove（グルーヴ）：インターロック関係を通じてFoundationと相互作用する補完的な充填層。この層は他の層が残したリズム空間を占める。

Lead（リード）：装飾と即興のための最も柔軟な層で、西アフリカ音楽のジャンベやキューバ音楽のキントなどのリードドラムに対応する。

2.2 スタイル優先度マトリクス

サポートされる10のスタイルは、それぞれ4つの役割に対して16ポジションの優先度マトリクスを定義する。優先度値は0.0から1.0の範囲で、各ポジションにオンセットを配置する確率重みを表す。

サポートされるスタイル：
- 西アフリカ（12/8ベルパターン）
- アフロキューバン（ソンクラーベ3-2）
- ブラジル（サンバ）
- バルカン（アクサク）
- インド（ティーンタールターラ）
- ガムラン（コロトミック）
- ジャズ（スウィング）
- エレクトロニック（フォーオンザフロア）
- ブレイクビーツ（シンコペーション）
- テクノ（ミニマル）

各スタイルは、役割ごとの密度範囲と、層が互いを回避すべきか補完すべきかを指定するインターロックルールも定義する。

2.3 インターロック機構

2つの主要なインターロック戦略が実装されている：

回避：ある層を生成する際、別の指定された層が既にオンセットを持つポジションは確率重みが減少する。回避強度はスタイルごとにパラメータ化され、0.0（回避なし）から1.0（完全回避）の範囲である。

補完：ある層が別の層が残したギャップを優先的に埋め、リズム的対話を作り出す。これは西アフリカとガムランスタイルで特に強い。

3. コアアルゴリズム

3.1 パターン生成プロセス

主な生成アルゴリズムは以下のように進行する：

ステップ1：スタイルと役割の選択
- 入力：スタイルインデックス、役割タイプ、パターン長、密度、バリエーション

ステップ2：優先度マッピング
- 四捨五入補間を使用して16ポジション優先度配列をターゲットパターン長にマッピング
- 結果：ポジション固有の確率重み

ステップ3：スケルトン生成（Foundationのみ）
- Foundation役割に対して、強拍ポジションでスケルトンビートを生成
- 第1拍：95%の確率
- 第3拍：70-85%の確率（スタイル依存）

ステップ4：重み付きポジション選択
- 利用可能なポジションから累積確率を計算
- 優先度重みに比例してポジションをランダムに選択
- 目標密度に達するまで繰り返す

ステップ5：インターロック調整
- 回避が有効な場合、占有ポジションの重みを減少
- 補完が有効な場合、ギャップポジションの重みを増加

ステップ6：ベロシティ割り当て
- 優先度重みからの基本ベロシティ（0.25 + 重み × 0.5）
- 強拍ボーナス（+0.2）
- ランダム変動（プラスマイナス0.12）
- 有効範囲にクランプ（0.2から1.0）

3.2 ヒューマナイズプロセス

パターン生成後、ヒューマナイズは文化固有のタイミング変動を適用する：

ステップ1：スタイルタイミングプロファイルの取得
- 基本分散（例：西アフリカ22ms、ジャズ12ms、テクノ2ms）
  （Polak & London 2014、Friberg & Sundström 2002、Danielsen et al. 2015に基づく）
- 役割乗数（Timeline：0.2-0.5、Lead：1.2-1.5）

ステップ2：BPM依存スウィング比の計算
- 低速テンポ：高いスウィング（約68%）
- 高速テンポ：ストレートに近づく（約54%）
- カーブタイプはスタイルによって異なる（ジャズは指数型、西アフリカはプラトー型）

ステップ3：マイクロタイミングオフセットの適用
- オフビートポジションにスウィングオフセット
- スタイル分散範囲内のランダムオフセット

ステップ4：ゴーストノート挿入
- ポジション重みと既存オンセットへの近接性に基づく確率
- ベロシティ：通常の25-32%（Matsuo & Sakaguchi 2024、Cheng et al. 2022）

4. 専門エンジン

WorldRhythmは、優先度マトリクスだけでは適切に表現できない文化固有のリズム概念のための5つの専門エンジンを含む。

4.1 IramaEngine（ジャワ密度レベル）

ジャワガムランの5段階イラマシステムを実装：
- Lancar：密度乗数0.25
- Tanggung：密度乗数0.5
- Dados：密度乗数1.0
- Wiled：密度乗数1.5
- Rangkep：密度乗数2.0

このエンジンは各イラマレベルに適したコロトミック構造（ゴング句読点パターン）も生成する。

4.2 KotekanEngine（バリインターロック）

厳密なPolos-Sangsihインターロックペアを生成：
- Nyog cag：厳密な交互
- Norot：先行パターン
- Kotekan telu：3音共有
- Kotekan empat：4音分割

Tenzer（2000）に由来する理論的検証基準を含む：補完性（80%以上）、連続性（60%以上）、バランス（60%以上）。これらの閾値は、経験的に検証された知覚閾値ではなく、民族音楽学文献からの構造的制約を表す。これらの基準を満たさないパターンは、理論的要件を満たすよう自動的に修正される。

4.3 PolymeterEngine（複数サイクル重畳）

異なる長さの同時サイクルを管理：
- グローバル同期点のための最小公倍数を計算
- 各役割の位相を独立して追跡
- 複数のリセット動作をサポート（完全リセット、位相保持、漸進的同期）
- 16ステップパターンを任意のサイクル長にマッピング

4.4 CallResponseEngine（対話構造）

スタイル固有のプロファイルを持つコールレスポンスペアを生成：
- コールタイプ：フレーズ、アクセント、ブレイク、シグナル
- レスポンスタイプ：エコー、アンサー、ユニゾン、レイヤード
- 履歴に基づく次のコールポジションの動的予測
- 重複防止を伴うクロスバーレスポンス処理

4.5 AsymmetricGroupingEngine（アクサク拍子）

非対称ビートグルーピングを処理：
- 7/8：2+2+3、2+3+2、3+2+2
- 9/8：2+2+2+3、2+2+3+2、2+3+2+2
- 11/8：2+2+3+2+2
- グループ境界に整列したアクセントパターン
- 標準4/4パターンから非対称拍子へのマッピング

5. 理論的基盤

システム設計は確立された民族音楽学研究に基づいている：

タイムライン理論（Kubik, 2010）：アンサンブル組織の参照フレームワークとしての非対称タイムラインの概念がTimeline層設計に影響を与えた。

アフリカのポリリズム（Arom, 1991）：インターロックと補完的リズム構造の原則が回避と補完メカニズムに影響を与えた。注意すべきは、Aromの研究はタイムラインパターンが最も顕著な西アフリカではなく、中央アフリカ（アカピグミー、バンダリンダ）に焦点を当てていることである。原則は適用可能だが、これらの地域間で具体的な実践は異なる。

ジャズのマイクロタイミング（Benadon, 2006）：BPM依存スウィング比と表現的タイミングに関する研究がヒューマナイズシステムに影響を与えた。

ユークリッドリズム（Toussaint, 2005）：パルス間のオンセットの数学的分布が重み付き選択アルゴリズムに影響を与えた。

コテカン理論（Tenzer, 2000）：Polos-Sangsihインターロック原則がKotekanEngineの設計に影響を与えた。

6. 議論

WorldRhythmはいくつかの点で既存のアプローチと異なる：

統一フレームワーク：単一の伝統を対象とするシステムとは異なり、WorldRhythmは単一のアーキテクチャ内で10の異なる文化スタイルを処理する。

ルールベースアプローチ：大規模なデータセットを必要とする機械学習システムとは異なり、WorldRhythmは民族音楽学分析から導出されたパラメータ化されたルールを使用し、解釈可能性と制御性を提供する。

専門エンジン：独自のリズム概念（イラマ、コテカン、ポリメーター、コールレスポンス、アクサク）は、汎用メカニズムによる近似ではなく、専用のアルゴリズム処理を受ける。

パラメータ化：文化固有の特性は、暗黙的な学習表現ではなく、調整可能なパラメータ（優先度重み、インターロック強度、タイミング分散）を通じて捕捉される。

制限には、ピッチ情報の抽象化（システムはリズムパターンのみを生成）、連続的な文化的実践の離散パラメータへの還元、リアルタイム適応型インタラクションの欠如が含まれる。

検証の範囲：現在の実装は構造的正確性を達成している。これは生成されたパターンが民族音楽学文献に記録された数学的・形式的原則に準拠していることを意味する。文化的真正性（パターンが専門家によってスタイル的に適切と知覚的に認識されるかどうか）には、まだ実施されていない別個の知覚評価研究が必要である。専門エンジン（例：KotekanEngine）の検証メカニズムは、経験的に導出された知覚基準ではなく、理論的制約を強制する。

7. 結論

WorldRhythmは、民族音楽学原理に基づく異文化リズム生成の統一フレームワークを提示する。4層役割階層、スタイル固有の優先度マトリクス、インターロックメカニズム、ヒューマナイズプロセス、独自のリズム概念のための専門エンジンを組み合わせることで、システムは多様な音楽伝統の構造原則を尊重するパターンを生成する。

このフレームワークは、主に西洋音楽や単一の文化伝統に焦点を当ててきた既存のリズム生成研究のギャップを埋める。今後の作業には、代表される伝統の音楽家との知覚評価、追加の文化への拡張、メロディとハーモニー生成システムとの統合が含まれる。

参考文献

Arom, S. (1991). African Polyphony and Polyrhythm: Musical Structure and Methodology. Cambridge University Press.

Benadon, F. (2006). Slicing the Beat: Jazz Eighth-Notes as Expressive Microrhythm. Ethnomusicology, 50(1), 73-98.

Cheng, T.Z., Creel, S.C., & Iversen, J.R. (2022). How Do You Feel the Rhythm: Dynamic Motor-Auditory Interactions Are Involved in the Imagination of Hierarchical Timing. Journal of Neuroscience, 42(3), 500-512.

Danielsen, A., et al. (2015). Effects of instructed timing and tempo on snare drum sound in drum kit performance. Journal of the Acoustical Society of America, 138(4), 2301-2316.

Friberg, A., & Sundström, A. (2002). Swing Ratios and Ensemble Timing in Jazz Performance: Evidence for a Common Rhythmic Pattern. Music Perception, 19(3), 333-349.

Kubik, G. (2010). Theory of African Music. University of Chicago Press.

Matsuo, H., & Sakaguchi, Y. (2024). Effects of Rhythm and Accent Patterns on Tempo-Keeping Property of Finger Tapping. i-Perception. DOI: 10.1177/20592043241276959

Polak, R., & London, J. (2014). Timing and Meter in Mande Drumming from Mali. Music Theory Online, 20(1).

Tenzer, M. (2000). Gamelan Gong Kebyar: The Art of Twentieth-Century Balinese Music. University of Chicago Press.

Toussaint, G. (2005). The Euclidean Algorithm Generates Traditional Musical Rhythms. Proceedings of BRIDGES: Mathematical Connections in Art, Music and Science, 47-56.

Mehta, A., et al. (2024). Missing Melodies: AI Music Generation and the Need for Diverse Training Data. arXiv preprint.

付録：スタイルパラメータ概要

西アフリカ
- スウィング：0.62（Friberg & Sundström 2002）
- Timeline密度：40-55%
- Foundation密度：8-15%
- タイミング分散：22ms（Polak & London 2014）
- インターロック：強い回避、強い補完

アフロキューバン
- スウィング：0.58
- Timeline密度：30-35%（クラーベ）
- Foundation密度：25-35%
- タイミング分散：16ms
- インターロック：回避なし、強い補完

ガムラン
- スウィング：0.50（ストレート）
- Timeline密度：20-30%
- Foundation密度：5-10%
- タイミング分散：12ms
- インターロック：独立層、GrooveとLead間のコテカン

ジャズ
- スウィング：0.65（BPM依存：低速0.68、高速0.54；Friberg & Sundström 2002）
- Timeline密度：35-45%
- Foundation密度：12-25%
- タイミング分散：12ms（Friberg & Sundström 2002）
- インターロック：対話的、固定ルールなし

エレクトロニック
- スウィング：0.50（ストレート）
- Timeline密度：50-65%
- Foundation密度：25%（フォーオンザフロア）
- タイミング分散：5ms（EDMヒューマナイズ研究）
- インターロック：なし（グリッドロック）

テクノ
- スウィング：0.50（ストレート）
- Timeline密度：60-75%
- Foundation密度：25%（フォーオンザフロア）
- タイミング分散：2ms
- インターロック：なし
