使用方法
Utsuho を使うと、半角・全角の正規化と、ひらがな・カタカナの相互変換を明示的に行えます。 各変換は個別の Converter クラスとして提供されています。
半角から全角への変換
from utsuho import HalfToFullConverter
text = "キョウトシ サキョウク ギンカクジチョウ 2"
converted = HalfToFullConverter().convert(text)
print(converted)
# キョウトシ サキョウク ギンカクジチョウ 2
全角から半角への変換
from utsuho import FullToHalfConverter
text = "キョウトシ サキョウク ギンカクジチョウ 2"
converted = FullToHalfConverter().convert(text)
print(converted)
# キョウトシ サキョウク ギンカクジチョウ 2
ひらがなからカタカナへの変換
from utsuho import HiraganaToKatakanaConverter
text = "きょうとし さきょうく ぎんかくじちょう 2"
converted = HiraganaToKatakanaConverter().convert(text)
print(converted)
# キョウトシ サキョウク ギンカクジチョウ 2
カタカナからひらがなへの変換
from utsuho import KatakanaToHiraganaConverter
text = "キョウトシ サキョウク ギンカクジチョウ 2"
converted = KatakanaToHiraganaConverter().convert(text)
print(converted)
# きょうとし さきょうく ぎんかくじちょう 2
半角・全角変換の設定
WidthConverterConfig を使うと、半角・全角変換の際に、カタカナ以外の文字をどこまで正規化するかを制御できます。
from utsuho import HalfToFullConverter, WidthConverterConfig
config = WidthConverterConfig(
ascii_symbol=False,
ascii_digit=False,
ascii_alphabet=False,
)
text = "ギンカクジ 2F"
converted = HalfToFullConverter(config).convert(text)
print(converted)
# ギンカクジ 2F
設定可能な項目は次の通りです。
パラメーター |
デフォルト値 |
説明 |
|---|---|---|
|
|
句読点を変換するかどうか。 |
|
|
鉤括弧を変換するかどうか。 |
|
|
中黒を変換するかどうか。 |
|
|
長音記号を変換するかどうか。 |
|
|
スペースを変換するかどうか。 |
|
|
ASCII 記号を変換するかどうか。 |
|
|
ASCII 数字を変換するかどうか。 |
|
|
ASCII アルファベットを変換するかどうか。 |
|
|
全角から半角への変換時にウェーブダッシュを変換するか。 |
注釈
現在の公開 API では、歴史的な理由により corner_brucket という名前の引数を使用しています。