jax.ops.segment_sum

jax.ops.segment_sum#

jax.ops.segment_sum(data, segment_ids, num_segments=None, indices_are_sorted=False, unique_indices=False, bucket_size=None, mode=None)[原始碼]#

計算陣列區段內的總和。

類似於 TensorFlow 的 segment_sum

參數:

data (ArrayLike) – 包含要加總的值的陣列。
segment_ids (ArrayLike) – 一個整數 dtype 陣列，指示要加總的 data 區段 (沿其前導軸)。值可以重複，並且不需要排序。
num_segments (int | None | None) – 選填，一個非負整數值，指示區段的數量。預設值設定為支援 segment_ids 中所有索引的最小區段數，計算方式為 max(segment_ids) + 1。由於 num_segments 決定輸出的尺寸，因此必須提供靜態值才能在 JIT 編譯的函式中使用 segment_sum。
indices_are_sorted (bool) – segment_ids 是否已知已排序。
unique_indices (bool) – segment_ids 是否已知沒有重複項。
bucket_size (int | None | None) – 將索引分組到儲存桶中的大小。segment_sum 會在每個儲存桶上分別執行，以提高加法的數值穩定性。預設值 None 表示不進行儲存桶分組。
mode (lax.GatherScatterMode | None | None) – jax.lax.GatherScatterMode 值，描述應如何處理超出範圍的索引。依預設，範圍 [0, num_segments) 之外的值會被捨棄，並且不會計入總和。

回傳值:

形狀為 (num_segments,) + data.shape[1:] 的陣列，表示區段總和。

回傳型別:

Array

範例

簡單的一維區段總和

>>> data = jnp.arange(5)
>>> segment_ids = jnp.array([0, 0, 1, 1, 2])
>>> segment_sum(data, segment_ids)
Array([1, 5, 4], dtype=int32)

使用 JIT 需要靜態 num_segments

>>> from jax import jit
>>> jit(segment_sum, static_argnums=2)(data, segment_ids, 3)
Array([1, 5, 4], dtype=int32)

jax.ops.segment_sum

目錄

jax.ops.segment_sum#