読者です 読者をやめる 読者になる 読者になる

語学と多言語学習のメモブログ

外国語の勉強法と,各種言語に独学で入門するための動画まとめです。

ベトナム語の一音節を解析し,母音と子音の構造を抽出するアルゴリズム(自動処理の手順ステップ)

ベトナム語の1音節を解析する手順を,アルゴリズムとして掲載する。


ある一つの1音節の単語について,

  • 全体を声母と韻母に分解。
  • 韻母を,介母音+主母音+末子音 に分解。

という処理を自動化するための,手順の流れ。

アルゴリズム

// 声母の取得
if( 1文字目は子音 ){
 // 音節が子音で始まるケース
 
 1文字目から子音の連続を最大3文字目まで,声母として保存。
  ※ここで,語頭の「gi」は,2文字の子音とみなす。

 以後,子音の連続の後部分のみを解析対象にセットし直す。
}
else
{
 声母なし。
}

// 韻母の分析
if( 1~2文字目が介母音の7パターンに該当 ){
 // 韻母が介母音で始まるケース
 1文字目を,介母音として保存。// uかo
 2文字目を,主母音として保存。 // 単母音
 3文字目以降を末子音として保存。 // 末母音も含む
 解析の終了。
}
else
{
 介母音なし。

 // 複合母音の取得
 if( 1~2文字目が複合母音の7パターンに該当 ){
  // 韻母が複合母音で始まるケース
  1~2文字目を,主母音として保存。
  3文字目以降を末子音として保存。 // 末母音も含む
  解析の終了。
 }
 else
 {
  // 韻母が単母音で始まるケース
  1文字目を,主母音として保存。
  2文字目以降を末子音として保存。 // 末母音も含む
  解析の終了。  
 }
}

このアルゴリズムを内部設計書として利用すれば,

ベトナム語を自然言語処理するためのソフトウェア・プログラムを開発する助けになるだろう。

参照資料

音節内の各要素の意味については,下記を参照。

ベトナム語の1単語は一音節で,音の構造は「声母(頭子音)+韻母」に分解。韻母は「介母音+主母音+末子音」という組み合わせ (PDFの図表あり) - 語学と多言語学習のメモブログ
http://tagengo-gakushuu.hatenablog.jp/entry/2016/02/27/%E3%83%99%E3%83%88%E3%...

  • ベトナム語の,一つの音節をどのように「子音と母音に分解」できるか? 以下では,ベトナム語の発音を習得しやすいように,音節の構造を詳しく解説する。 ダウンロード可能なPDFの図表付き。


また,主母音には声調符号が付与されるので,

その符号を見れば声調も自動判定できる。

主母音に声調符号を付与した際の全パターンの一覧表は下記を参照。

ベトナム語の母音アルファベットの「全パターン一覧表」。声調符号と発音記号・読み方つきで全文字を整理したまとめ - 語学と多言語学習のメモブログ
http://tagengo-gakushuu.hatenablog.jp/entry/2016/02/25/%E3%83%99%E3%83%88%E3%...

  • ベトナム語の母音アルファベットの「全パターン一覧表」(声調符号付き)。