Intl.Segmenter 物件現已納入基準

您現在可以使用 Intl.Segmenter敬上 適用於依語言代碼區分的文字區隔,將字串拆成字詞、語句 圖形或圖形

瀏覽器支援

  • Chrome:87。
  • Edge:87。
  • Firefox:125。
  • Safari:14.1。

資料來源

許多非拉丁語系語言,例如中文和日文 請勿使用空格來分隔字詞。因此,使用 JavaScript split() 將文字分割成字詞的方法,傳回錯誤結果。

使用Intl.Segmenter Intl.segmenter() 建構函式; 傳入 localegranularity 等選項,這可 值為 "grapheme""word""sentence"。下列 範例會為日文建立新的 Intl.Segmenter 物件,以分割字詞。

const segmenter = new Intl.Segmenter('ja-JP', { granularity: 'word' });

呼叫 segment()敬上 方法為包含文字字串的 Intl.Segmenter 物件方法 會傳回可疊代:

const segments = segmenter.segment(str);
console.table(Array.from(segments));

請參閱使用 Intl.Segmenter API

在 JavaScript 中使用 Intl.Segmenter 的國際文字區隔 還有其他範例,包括如何將 Intl.Segmenter 與表情符號搭配使用。