使网站将文本转换为音频[Google Cloud Text to Speech API]

时间:2019-12-29 00:50:01

标签: google-cloud-platform text-to-speech google-cloud-speech google-text-to-speech

我是编码的初学者。我想使用Google Cloud Text to Speech API创建一个简单的网站。

  1. 带有文本框的网站
  2. 您在文本框中输入文本,然后单击“转换为音频”按钮
  3. 您可以将由Google云文本制作的mp3文件下载到语音api

我已经读过Google Cloud Text to Speech API's official site,但是找不到解决方法。

我的搜索方式类似于“开发一个将文本转换为音频的网站”。 我找到了这个网站。 Creating an HTML Application to Convert Text Files to Audio Files 但是,它不符合我的要求。

您能给我任何信息来建立一个将文本转换为音频的网站吗?

谢谢。

真诚地,Kazu

我已经在Google合作实验室制作了一个python程序。我想在网站上做同样的事情。

from google.colab import drive
drive.mount('/content/drive')

!cp ./drive/'My Drive'/credential.json ./credential.json
import os
os.environ["GOOGLE_APPLICATION_CREDENTIALS"]="credential.json"
f= open("text.ssml","w+")
f.write('<speak><prosody rate="slow">hello world</prosody></speak>')
f.close()
!pip install google-cloud-texttospeech
#!/usr/bin/env python
from google.cloud import texttospeech
client = texttospeech.TextToSpeechClient()
with open('text.ssml', 'r') as f:
    ssml = f.read()
    input_text = texttospeech.types.SynthesisInput(ssml=ssml)
voice = texttospeech.types.VoiceSelectionParams(language_code='en-US', name="en-US-Wavenet-A")

audio_config = texttospeech.types.AudioConfig(audio_encoding=texttospeech.enums.AudioEncoding.MP3)
response = client.synthesize_speech(input_text, voice, audio_config)
with open('output.mp3', 'wb') as out:
    out.write(response.audio_content)
    print('Audio content written to file "output.mp3"')
from google.colab import files
files.download('output.mp3')

2 个答案:

答案 0 :(得分:1)

为了实现您想要的功能,就像您所说的那样,编码新手是研究GCP文本到语音API。好的第一步是遵循Using client libraries text-to-speech上的快速入门教程。

根据您对输入框的要求,将文本转换为音频。您需要遵循在GCP上部署应用程序的一般准则。 Serve Machine Learning Model on App Engine Flexible Environment

因此,基本上,您的步骤将是训练模型并通过App引擎部署进行服务,或者部署将带有json负载的请求发送到文本语音API的应用程序。但是您需要做很多阅读工作。希望这会有所帮助。

答案 1 :(得分:0)

如果您希望灵活地处理多个 TTS(文本到语音)提供程序(我们至少有 4 个)并增强语音发现,您可能需要查看 www.api.audio 这是一个示例 https://docs.api.audio/recipes/create-engaging-newscast