Usando a API AT&T Speech to Text com Python
-
21-12-2019 - |
Pergunta
Estou tentando usar a API de fala para texto da AT&T.Até agora, posso obter o token de acesso
def get_access_token(client_id, client_secret):
headers = {'Content-Type': 'application/x-www-form-urlencoded', 'Accept': 'application/json'}
data = {'client_id': client_id, 'client_secret': client_secret, 'scope': 'SPEECH',
'grant_type': 'client_credentials'}
response = requests.post(oauth_url, data=data, headers=headers)
return response.text
Até agora, é isso que tenho para enviar o arquivo de áudio para obter a resposta json:
def get_text_from_file(file, access_token):
headers = {'Authorization': 'Bearer ' + access_token, 'Accept': 'application/json', 'Content-Type': 'audio/wav',
'X-SpeechContext': 'Generic', 'Connection': 'Keep-Alive'}
Mas não tenho certeza de como enviar o arquivo.Alguém pode ajudar?
Solução
Foi isso que acabei de fazer, usando a biblioteca de solicitações e alguns outros recursos que colocarei no link abaixo
import json
import requests
class ATTSpeech:
CLIENT_ID = "SOME"
CLIENT_SECRET = "ID"
TOKEN = None
def __init__(self, *args, **kwargs):
self.get_token()
def get_token(self):
# Get Access Token via OAuth.
# https://matrix.bf.sl.attcompute.com/apps/constellation-sandbox
response = requests.post("https://api.att.com/oauth/token", {
"client_id": self.CLIENT_ID,
"client_secret": self.CLIENT_SECRET,
"grant_type": "client_credentials",
"scope": "SPEECH,STTC"
})
content = json.loads(response.content)
self.TOKEN = content["access_token"]
def text_from_file(self, path):
with open(path, 'rb') as f:
response = requests.post("https://api.att.com/speech/v3/speechToText",
headers = {
"Authorization": "Bearer %s" % self.TOKEN,
"Accept": "application/json",
"Content-Type": "audio/wav",
"X-SpeechContext": "Generic",
}, data=f)
content = json.loads(response.content)
return content
https://sites.google.com/site/brssbrss/attspeechapi
http://changejasper.blogspot.com/2014/06/making-jasper-use-at-speech-api.html
O uso é parecido com o abaixo, supondo que você salvou este arquivo como ATTEngine
from ATTEngine import ATTSpeech
a = ATTSpeech()
a.text_from_file('/Users/issackelly/Desktop/here.wav')
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow