Usando a API AT&T Speech to Text com Python

https://stackoverflow.com//questions/23039101

21-12-2019
|

Pergunta

Estou tentando usar a API de fala para texto da AT&T.Até agora, posso obter o token de acesso

def get_access_token(client_id, client_secret):
headers = {'Content-Type': 'application/x-www-form-urlencoded', 'Accept': 'application/json'}

data = {'client_id': client_id, 'client_secret': client_secret, 'scope': 'SPEECH',
        'grant_type': 'client_credentials'}

response = requests.post(oauth_url, data=data, headers=headers)
return response.text

Até agora, é isso que tenho para enviar o arquivo de áudio para obter a resposta json:

def get_text_from_file(file, access_token):
headers = {'Authorization': 'Bearer ' + access_token, 'Accept': 'application/json', 'Content-Type': 'audio/wav',
           'X-SpeechContext': 'Generic', 'Connection': 'Keep-Alive'}

Mas não tenho certeza de como enviar o arquivo.Alguém pode ajudar?

Solução

Foi isso que acabei de fazer, usando a biblioteca de solicitações e alguns outros recursos que colocarei no link abaixo

import json
import requests

class ATTSpeech:
    CLIENT_ID = "SOME"
    CLIENT_SECRET = "ID"
    TOKEN = None

    def __init__(self, *args, **kwargs):
        self.get_token()


    def get_token(self):
        # Get Access Token via OAuth.
        # https://matrix.bf.sl.attcompute.com/apps/constellation-sandbox
        response = requests.post("https://api.att.com/oauth/token", {
            "client_id": self.CLIENT_ID,
            "client_secret": self.CLIENT_SECRET,
            "grant_type": "client_credentials",
            "scope": "SPEECH,STTC"
        })
        content = json.loads(response.content)
        self.TOKEN = content["access_token"]


    def text_from_file(self, path):

        with open(path, 'rb') as f:
            response = requests.post("https://api.att.com/speech/v3/speechToText",
                headers = {
                    "Authorization": "Bearer %s" % self.TOKEN,
                    "Accept": "application/json",
                    "Content-Type": "audio/wav",
                    "X-SpeechContext": "Generic",
            }, data=f)
        content = json.loads(response.content)
        return content

https://sites.google.com/site/brssbrss/attspeechapi

http://changejasper.blogspot.com/2014/06/making-jasper-use-at-speech-api.html

O uso é parecido com o abaixo, supondo que você salvou este arquivo como ATTEngine

from ATTEngine import ATTSpeech
a = ATTSpeech()
a.text_from_file('/Users/issackelly/Desktop/here.wav')

Licenciado em: CC-BY-SA com atribuição

Não afiliado a StackOverflow