ウェブサイト多言語化「WOVN.io」に「高精度住所翻訳」機能--住所をローマ字表記化

河部恭紀 (編集部)

2023-08-17 11:27

 Wovn Technologiesは8月17日、ウェブサイト多言語化ソリューション「WOVN.io」の新機能「高精度住所翻訳」を発表した。

 高精度住所翻訳は、ウェブサイトに含まれる住所表記を自動かつ高精度でローマ字表記に切り替える。一般的に、住所を翻訳(ローマ字表記化)することは、諸外国ごとに表記の順番が異なる背景もあり、作業の手間や工数を必要とする。機械翻訳に任せたとしても、日本には同音異字の地名が多数存在するため、意図した通りに翻訳されず、誤訳や表記揺れが発生してしまうケースがあるという。

 今回の機能開発により、ウェブサイト内の住所表記に対し、形態素解析を用いた独自のアルゴリズムで、Wovn Technologies保有のマスターデータから対象となる住所のローマ字表記を自動で抽出・適用できるようになった。

 例えば、「三田」という地名には、「みた」「さんだ」「みつだ」などの読み方がある。高精度住所翻訳では、住所表記が「港区三田」の場合は「Mita」を、「兵庫県三田市」の場合は「Sanda」を適用させる。また「長野県長野市南長野県町」という複雑な住所であっても、区切りとなる箇所を判定し、「Nagano-ken Nagano-shi Minaminagano Agatamachi」と正確にローマ字で表現できる。

 また、都道府県名から始まり番地で終わる一般的な住所表記だけでなく、都道府県のみの表記や「〇〇(地名)支店」などの場合もローマ字表記を適用させることができる。なお、同音異字のある地名が単体で記載されている場合には、マスターデータ内で登録数が最も多いローマ字表記が適用されるという。

 想定される活用シーンとして、賃貸などの不動産サイト、多店舗展開している小売店サイトや宿泊予約サイト、飲食・観光業界などの情報サイトを同社は挙げ、取り扱い物件や運営施設の住所表記が数多く存在するためと理由を説明する。

画像1

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

マイナンバーカードの利用状況を教えてください

NEWSLETTERS

エンタープライズ・コンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]