iPhone:音声認識はiOS SDKで利用可能ですか?
-
27-10-2019 - |
質問
siriで使用されている「テキストへのスピーチ」と「テキスト」APIがiOS 5またはiOS 6 SDKでアクセス可能であるかどうかを知っていますか?
私は調査しましたが、ドキュメントでそれについて何も見つかりませんでしたので、それがSDKに含まれていない場合、市場に「Siri」品質の図書館はありますか?
解決
SiriはまだAPI形式では利用できませんが、uitextfieldまたはuitextareaは、スピーチツーテキストに組み込みオプションを使用するように決定できます。
他のヒント
でOpenearsをチェックしてください: http://www.politepix.com/openears 私はそれを実験的に使用しましたが、うまくいきました。プリセットの語彙を非常によく認識します。単語を認識する前に1/2秒ほどの少しの一時停止があり、多くの声(混雑したレストラン)がある環境で混乱しますが、適度に静かな環境では、うまく機能していることがわかりました。
iOS 10は新しい音声認識APIを紹介します - SFSpeechRecognizer
.
SiriはiPhone 4Sのベータ版としてのみ利用できますが、計画がすべてのiOS 5有能なデバイスに拡散するかどうかはわかりません。音声認識のためのオープンソースライブラリを手に入れるのは難しいです。調べることができます ニュアンス(ドラゴン) 開発者ゲートウェイ ここ.
また、ispeechのチェックアウトをお勧めします テキストからスピーチ と 音声認識 API。彼らはすでにあなたがそれをあなたのアプリに多くのトラブルなしで含めることを許可しており、実際にはSiriが持っているものよりも少し良いです。 Siriの大きな強みはNLPであり、基礎となるスピーチ技術ではありません。
Siriはまだ開発者が利用できません。
孤立した単語(または小さなフレーズ)認識のためにSDKを作成しました、Ceedvocal SDK。私たちはそれを私たち自身のアプリVocaliaで使用します。しかし、それは無料ではありません(ただし、無料試用版があります)、詳細情報は次のとおりです。 http://www.creaceed.com/ecedvocal
音声認識には、Openearsを使用できます(http://www.politepix.com/openears/)オフラインで動作し、精度が良好です。OpenearsはiPhoneまたはiPadアプリで自由に使用できます。はいOpenearsは、テキスト関数にスピーチを処理します。
iOS 10の後、使用できます
speech.framework
使用するのは非常に簡単です。クラスにスピーチをインポートするだけです
import Speech
let speechRecogizer = SFSpeechRecognizer(locale: Locale.init(identifier: "en-US"))! //locale whatever you want to use
let recognitionRequest = SFSpeechAudioBufferRecognitionRequest()
let recognitionTask:SFSpeechRecognitionTask = speechRecogizer.recognitionTask(with: recognitionRequest, resultHandler: { (result, error) in
print(result?.bestTranscription.formattedString) //here you can get your text
})
確認することもできます https://github.com/pkrupa94/speechmanager それのための。