Unity中使用Genshinvoice.top API实现语音合成

本文介绍了如何使用Genshinvoice.top API在Unity中实现语音合成，并提供了完整的代码示例。

1. 准备工作

确保你的项目已引入UnityWebRequest模块。
注册Genshinvoice.top账号并获取API密钥。

2. 代码示例

using System;
using System.Collections;
using System.Xml.Linq;
using UnityEngine;
using UnityEngine.Networking;

public class GenshinTextToSpeech : TTS
{
    #region 参数定义
    /// <summary>
    /// Genshin配置项
    /// </summary>
    /// <summary>
    /// 朗读的角色
    /// </summary>
    [Header("朗读声音设置")]
    public string speaker = "胡桃";
    /// <summary>
    /// 音频格式
    /// </summary>
    [Header("音频格式设置")]
    public string format = "wav";
    /// <summary>
    /// 音频长度
    /// </summary>
    [Header("音频长度设置")]
    public float length = 1f;
    /// <summary>
    /// 噪声
    /// </summary>
    [Header("噪声设置")]
    public float noise = 0.5f;
    /// <summary>
    /// 噪声权重
    /// </summary>
    [Header("噪声权重设置")]
    public float noisew = 0.9f;
    /// <summary>
    /// 声调比例
    /// </summary>
    [Header("声调比例设置")]
    public float sdp_ratio = 0.2f;

    #endregion

    private void Awake()
    {
        m_PostURL = "https://genshinvoice.top/api";
    }

    /// <summary>
    /// 语音合成
    /// </summary>
    /// <param name="_msg"></param>
    /// <param name="_callback"></param>
    public override void Speak(string _msg, Action<AudioClip> _callback)
    {
        StartCoroutine(GetVoice(_msg, _callback));
    }

    /// <summary>
    /// 语音合成，返回合成文本
    /// </summary>
    /// <param name="_msg"></param>
    /// <param name="_callback"></param>
    public override void Speak(string _msg, Action<AudioClip, string> _callback)
    {
        StartCoroutine(GetVoice(_msg, _callback));
    }

    /// <summary>
    /// restful api语音合成
    /// </summary>
    /// <param name="_msg"></param>
    /// <param name="_callback"></param>
    /// <returns></returns>
    private IEnumerator GetVoice(string _msg, Action<AudioClip> _callback)
    {
        stopwatch.Restart();
        //发送报文
        string textToSpeechRequestBody = GenerateTextToSpeech(speaker, _msg, format, length, noise, noisew, sdp_ratio);

        using (UnityWebRequest speechRequest = new UnityWebRequest(m_PostURL, "POST"))
        {
            byte[] data = System.Text.Encoding.UTF8.GetBytes(textToSpeechRequestBody);
            speechRequest.uploadHandler = (UploadHandler)new UploadHandlerRaw(data);
            speechRequest.downloadHandler = (DownloadHandler)new DownloadHandlerAudioClip(speechRequest.uri, AudioType.WAV);

            yield return speechRequest.SendWebRequest();

            if (speechRequest.responseCode == 200)
            {
                AudioClip audioClip = DownloadHandlerAudioClip.GetContent(speechRequest);
                _callback(audioClip);
            }
            else
            {
                Debug.LogError("语音合成失败: " + speechRequest.error);
            }
        }

        stopwatch.Stop();
        Debug.Log("Genshin语音合成耗时：" + stopwatch.Elapsed.TotalSeconds);
    }

    /// <summary>
    ///  restful api语音合成，返回合成文本
    /// </summary>
    /// <param name="_msg"></param>
    /// <param name="_callback"></param>
    /// <returns></returns>
    private IEnumerator GetVoice(string _msg, Action<AudioClip, string> _callback)
    {
        stopwatch.Restart();
        //发送报文
        string textToSpeechRequestBody = GenerateTextToSpeech(speaker, _msg, format, length, noise, noisew, sdp_ratio);

        using (UnityWebRequest speechRequest = new UnityWebRequest(m_PostURL, "POST"))
        {
            byte[] data = System.Text.Encoding.UTF8.GetBytes(textToSpeechRequestBody);
            speechRequest.uploadHandler = (UploadHandler)new UploadHandlerRaw(data);
            speechRequest.downloadHandler = (DownloadHandler)new DownloadHandlerAudioClip(speechRequest.uri, AudioType.WAV);
            Debug.Log("传参的值是：" + textToSpeechRequestBody);
            yield return speechRequest.SendWebRequest();

            if (speechRequest.responseCode == 200)
            {
                AudioClip audioClip = DownloadHandlerAudioClip.GetContent(speechRequest);
                _callback(audioClip, _msg);
            }
            else
            {
                Debug.LogError("语音合成失败: " + speechRequest.error);
            }
        }

        stopwatch.Stop();
        Debug.Log("Genshin语音合成耗时：" + stopwatch.Elapsed.TotalSeconds);
    }

    /// <summary>
    /// 报文格式转换
    /// </summary>
    /// <param name="speaker"></param>
    /// <param name="msg"></param>
    /// <param name="format"></param>
    /// <param name="length"></param>
    /// <param name="noise"></param>
    /// <param name="noisew"></param>
    /// <param name="sdp_ratio"></param>
    /// <returns></returns>
    public string GenerateTextToSpeech(string speaker, string msg, string format, float length, float noise, float noisew, float sdp_ratio)
    {
        string urlParams = string.Format("?speaker={0}&text={1}&format={2}&length={3}&noise={4}&noisew={5}&sdp_ratio={6}", speaker, msg, format, length, noise, noisew, sdp_ratio);
        string url = m_PostURL + urlParams;

        return url;
    }
}

public class TTS : MonoBehaviour
{
    protected string m_PostURL;
    protected System.Diagnostics.Stopwatch stopwatch = new System.Diagnostics.Stopwatch();

    public virtual void Speak(string _msg, Action<AudioClip> _callback) { }
    public virtual void Speak(string _msg, Action<AudioClip, string> _callback) { }
}

3. 使用示例

using UnityEngine;

public class Example : MonoBehaviour
{
    public GenshinTextToSpeech genshinTTS;

    private void Start()
    {
        string text = "Hello World!";
        genshinTTS.Speak(text, OnSpeakComplete);
    }

    private void OnSpeakComplete(AudioClip audioClip)
    {
        AudioSource audioSource = gameObject.AddComponent<AudioSource>();
        audioSource.clip = audioClip;
        audioSource.Play();
    }
}

4. 说明

代码中使用UnityWebRequest发送POST请求到Genshinvoice.top API接口。
GenerateTextToSpeech方法生成请求参数。
Speak方法封装了语音合成过程，并提供了两种回调函数：
- OnSpeakComplete(AudioClip audioClip)：合成完成后调用，返回音频剪辑。
- OnSpeakComplete(AudioClip audioClip, string msg)：合成完成后调用，返回音频剪辑和合成文本。

5. 注意事项

使用Genshinvoice.top API需要遵守其使用协议。
代码示例仅供参考，请根据实际需求进行修改和补充。

希望本示例能够帮助您在Unity中实现语音合成功能！