AQUEST Text To Speech Technology
MENU
AQUEST

ニュースリリース

小型IoT機器向け、省メモリの日本語テキスト音声合成ミドルウェアを開発

2018年8月24日
株式会社アクエスト

音声合成技術開発を行う株式会社アクエスト(本社:神奈川県横浜市、代表取締役社長:山崎信英)は、 日本語音声合成エンジン「AquesTalk」(注1)をベースに、 省メモリで動作する漢字仮名混じりテキストからの音声合成ミドルウェア「(仮称) AquesTalk-KM」を開発し、8月27日に提供を開始します。

日本語解析処理のデータ構造や使用するメモリの管理方法を改良して、 辞書データをSDメモリーカードやSPIフラッシュメモリなどの比較的低速な外部メモリに配置可能にし、 処理に必要なRAMサイズを、従来の10MBから22KBへと大幅に削減しました。
これにより、大容量の外付けRAMが不要になり、マイクロコントローラの内蔵RAMだけで 漢字仮名混じりのテキストからの音声合成が可能となりました。
また、8 DMIPSと少ないCPU負荷で動作するため、ローエンドのマイクロコントローラ1つで、音声合成をしながら画面表示するといった並列処理が可能です。

今回開発したミドルウェアによって、 クラウド型の音声合成を使用できない、例えばLPWA通信のIoT機器においても、 低コストで音声合成機能を実装できるようになります。

AquesTalk-KMターゲット・構成

2018年8月27日に、組み込み機器の開発メーカーを対象に、今回開発の音声合成ミドルウェア「AquesTalk-KM」のライセンス提供を開始します。
使用するCPUアーキテクチャやメモリサイズ等の動作環境に応じて、カスタマイズも行います。
また、評価用にESP32上に実装したライブラリ「AquesTalk ESP32」をオンライン提供します。

仕様

ミドルウェア名 (仮称) AquesTalk-KM
入力 UTF-8形式の日本語テキストまたは音声記号列
CPU Arm Cortex-M0 同等以上
処理量 8 DMIPS
RAM 22KB
ROM 80KB
外部ROM 5MB以上のSPIシリアルフラッシュメモリまたはSDカードメモリ
OS 不要

* アーキテクチャはARMv7-M, 規則合成部はAquesTalk picoを使用。数値はアーキテクチャ・構成により変動します。


(注1) AquesTalkは、2006年にリリース以降、のべ数百万台の組み込み機器に実装されている音声合成ミドルウェアです。

本件のお問い合わせ先:infoaqata-quest.com

※ Arm および Cortex は、ARM Limitedの商標または登録商標です。
※ ESP32は、Espressif Systems社のIoT向けマイクロコントローラです。