クラウド型音声認識サービスAmiVoice Cloud

掲載開始日:2012/12/10

キーボードからタッチパネルへと入力デバイスの主役が変わってきましたが、一方でさらにその先の技術も着々と進んでいます。なかでも最も有力なのが音声認識技術を活用した“音声入力”。
すでにスマートフォンやパソコンには搭載されており、家電やカーナビなど様々な方面にも広がっています。また、民生用だけでなく、産業用途としてもハンズフリーや入力の手間や時間が低減できるなど業務効率化に役立つ技術として活用する例も増えてきています。
そんな音声入力と音声認識技術についてアドバンスト・メディア(東京都豊島区)に聞きました。

クラウド型音声認識サービス AmiVoice Cloud

今回紹介する技術と製品

クラウド型音声認識サービス AmiVoice Cloud

AmiVoice Cloudは、声の特徴をクラウド環境へ送り、クラウド環境で音声認識処理を行えるプラットフォームです。分散型音声認識(DSR)方式で高速・高精度の音声認識を、SSL通信によるセキュアな通信環境で利用できます。

この記事で紹介した製品の関連資料がダウンロードできます。

世界トップレベルの音声認識技術を搭載した『AmiVoice』
コールセンターや議事録作成など多方面に展開

クラウド事業部 営業部
坂口 毅雄 営業部長

スマートフォンを筆頭に声でコントロールできるハードウェアが増えてきており、テレビやエアコン、掃除機まで音声で電源のON/OFF、チャンネルやモードの変更などができる製品が流通しています。どんな環境でも誰もが操作できるユーザーインターフェイスが強く求められ、音声認識についての関心・認知が急速に高まりつつあります。当社はそうした環境のなかで、スマートフォンやタブレット端末、専用端末など様々なデバイスに対し、音声認識エンジン『AmiVoice』を提供しています。

AmiVoiceは、世界トップレベルの音声認識技術を搭載した最先端の音声認識エンジンで、ビジネスや日々の生活に密着した多種多様なサービスに展開しています。コールセンターの通話内容を音声認識でテキスト化しCRM分析に役立てたり、医療現場の電子カルテの作成補助、議会の会議の議事録作成など、さまざまな場面にすでに導入され、KDDIの声でスマートフォンを操作できるサービス「おはなしアシスタント」などにも採用されています。

業界・業種・用途に最適な専用辞書で処理スピードを高速化。使えば使うほど賢くなる。

音声認識の基本的な仕組み

言語モデルとルールグラマ

言語モデルとルールグラマ

当社の最大の強みは、googleやAppleのSiriのような幅広いユーザーが様々な用途で活用する大規模な音声認識辞書(大語彙辞書)だけでなく、業界や業種などの専門用語の音声認識辞書を保有していること、さらに独自に目的に応じた音声認識辞書・エンジンの構築が行えることです。
辞書は語彙数が多ければ多いほど良いと思われがちですが、使う用途が明確な場合は、その用途に合わせた専用辞書の方が音声認識の結果に誤認識が少なく、高精度の認識結果が得られます。語彙数が多ければ正しい語彙を探すだけでも時間がかかり、スピードも精度も安定しません。逆に専門辞書であれば語彙が限られてくるので処理スピードが早く、ストレスなく使うことができます。
さらに、業界特有の用語や言い回しもカバーし、もし語彙が不足していれば、新たに登録でき、使えば使うほどブラッシュアップ出来るというメリットがあります。

クラウド型音声認識『AmiVoice Cloud』サービスを本格稼働!

いま進めているのはクラウド型の音声認識サービス『AmiVoice Cloud』です。ネットワークを通じて声をクラウド環境に送って音声認識ができるプラットフォームで、音声認識アプリを機器に組み込むだけで、短期間で容易に音声認識サービスの提供が可能になります。

民生用ではスマートフォンやテレビ、カーナビ等のデジタル機器の音声操作や、ロボットの操作や対話、WEBサイトに組み込めば情報入力や検索などが音声ででき、業務用では営業日報や作業報告書などの入力や、企業サーバー内の商品情報や顧客情報、資料などの検索時の入力や操作も音声で可能になります。
導入実績としては、様々ありますが、自社iPhoneアプリの「音声認識メール クラウド」は45万DL(2012月9月末現在)を超えるなど、音声認識が普及期を迎えたことを強く感じます。

当社では、自社で音声認識アプリケーションを開発するための開発キットを提供しているほか、受託でのアプリ開発も行っており、音声認識を活かした機能やサービスの開発をサポートしています。

AmiVoice Cloudを使った対話型サービス例

本格的な普及期を迎えた音声認識技術
製造、物流、流通分野にも需要拡大に期待

音声認識の活用は、民生用に留まらず、製造、物流、流通分野でも積極的に導入が進んでいます。これは、音声認識技術が仕事の効率化や、作業者の負担を軽減するといった効果をもたらしている事が注目され、有効な技術だという認識が広まったからだといえます。
製造、物流、流通業界において音声認識技術を使うメリットは、手を使わずにデータエントリーが行えるハンズフリーが実現できることや、耳で聴いて目(視点)は作業に集中できるアイズフリーが実現できる事が挙げられます。
例えば、倉庫内のピッキングや仕分けなど動きながらの作業に音声認識を使うことでハンズフリーとアイズ(視線)フリーの状態を作り出すことで、業務のスピードアップやミス低減に役立ちます。
また、手を使う検査作業でも、その作業を止めることなく声にて検査結果の入力を行うことができ作業効率を上げることが可能です。

声を発して操作・入力するという方法が浸透しきっていないので、声で操作する行為を作業者が恥ずかしがってしまうというハードルもありますが、これから携帯電話やスマートフォンなどで音声入力や操作が広まっていけばそういう意識もなくなり、より音声認識の需要が伸びていくと思っています。

音声認識技術も本格的な普及期に来ています。機器への組込みやサービスも含め、一家に一台AmiVoiceが使われている環境づくりに向けて全力を尽くしたいと思っています。

計測データの入力作業の効率化事例

この記事で紹介した製品の関連資料がダウンロードできます。

  • Twitterボタン

取扱会社

株式会社アドバンスト・メディア

AmiVoice(R) を組み込んだ音声認識ソリューションの企画・設計・開発を行う「ソリューション事業」 AmiVoice(R) を組み込んだアプリケーション商品を提供する「ライセンス事業」 企業内のユーザーや一般消費者へのサービスにAmiVoice(R) を提供する「サービス事業」

クラウド型音声認識サービスAmiVoice Cloudへのお問い合わせ

[必須] ご要望

[必須] 動機

お問い合わせ内容(400文字以内)

あと文字入力できます。

はじめてイプロスをご利用の方はじめてイプロスをご利用の方

イプロス会員になると、情報掲載の企業に直接お問い合わせすることができます。

イプロス会員の方

メールアドレス
パスワード

※お問い合わせの際、以下の出展者へご連絡先(会社名、部署名、所在地、氏名、TEL、FAX、メールアドレス)が通知されます。

株式会社アドバンスト・メディア


  • 金属ワッシャー大増量!総合カタログ最新版 進呈
  • 危険性流体のサンプリングを手作業で行っていませんか?

最近チェックした情報

クリップ

気になる製品・カタログ・企業などがあったらクリップに保存しておくと便利です。