Qt语音输入转文字：使用Google Cloud Speech-to-Text

Qt中实现语音输入转文字功能

在Qt中，没有内置的直接将语音输入转换为文字的功能。要实现语音输入转文字，你需要使用第三方的语音识别服务或库，例如Google Cloud Speech-to-Text。

使用Google Cloud Speech-to-Text实现语音输入转文字

以下是使用Google Cloud Speech-to-Text服务实现语音输入转文字的步骤：

获取Google Cloud API密钥： - 访问Google Cloud Console (https://console.cloud.google.com) 并创建一个项目。 - 在项目中启用Cloud Speech-to-Text API。 - 创建一个服务账号并下载JSON格式的密钥文件。
安装Google Cloud Speech-to-Text库： - 使用以下命令安装Google Cloud Speech-to-Text C++客户端库： bash sudo apt-get install libgoogle-cloud-speech-v1

编写Qt代码： - 以下是一个示例代码，演示如何使用Google Cloud Speech-to-Text实现语音输入转文字：


class SpeechRecognizer : public QObject    {        Q_OBJECT

public:        explicit SpeechRecognizer(QObject *parent = nullptr)            : QObject(parent)        {            m_networkManager = new QNetworkAccessManager(this);

        // 设置Google Cloud Speech-to-Text API的认证密钥            m_apiKey = 'YOUR_API_KEY';        }

    // 开始语音输入转文字        void startSpeechRecognition(const QString &audioFilePath)        {            // 读取音频文件            QFile audioFile(audioFilePath);

        if (audioFile.open(QIODevice::ReadOnly)) {                QByteArray audioData = audioFile.readAll();                audioFile.close();

            // 发送音频数据进行语音识别                sendAudioData(audioData);            }            else {                qDebug() << 'Failed to open audio file: ' << audioFile.errorString();            }        }

signals:        // 语音输入转文字完成信号        void speechRecognitionResult(const QString &result);

private slots:        void onNetworkReply(QNetworkReply *reply)        {            if (reply->error() == QNetworkReply::NoError) {                QByteArray response = reply->readAll();                QJsonDocument jsonResponse = QJsonDocument::fromJson(response);                QJsonObject jsonObject = jsonResponse.object();

            // 解析识别结果                if (jsonObject.contains('results')) {                    QJsonArray resultsArray = jsonObject.value('results').toArray();

                if (!resultsArray.isEmpty()) {                        QString result = resultsArray.at(0).toObject().value('alternatives').toArray().at(0).toObject().value('transcript').toString();                        emit speechRecognitionResult(result);                    }                }            }            else {                qDebug() << 'Error occurred during speech recognition: ' << reply->errorString();            }

        reply->deleteLater();        }

private:        void sendAudioData(const QByteArray &audioData)        {            // 创建请求            QNetworkRequest request;            request.setUrl(QUrl('https://speech.googleapis.com/v1/speech:recognize?key=' + m_apiKey));            request.setHeader(QNetworkRequest::ContentTypeHeader, 'application/json');

        // 构建请求数据            QJsonObject requestData;            requestData['config'] = QJsonObject {                {'encoding', 'LINEAR16'},                {'sampleRateHertz', 16000},                {'languageCode', 'en-US'}            };            requestData['audio'] = QJsonObject {                {'content', QString(audioData.toBase64())}            };

        // 发送POST请求            QNetworkReply *reply = m_networkManager->post(request, QJsonDocument(requestData).toJson());

        // 连接网络响应信号            connect(reply, &QNetworkReply::finished, [=]() {                onNetworkReply(reply);            });        }

    QNetworkAccessManager *m_networkManager;        QString m_apiKey;    };    ```

- 在上述示例代码中：        - 将 `'YOUR_API_KEY'` 替换为你的 Google Cloud API 密钥。        - 确保音频文件存在于指定的路径。        - 可以根据需要修改音频编码、采样率和语言代码等参数。

- 在主函数中使用 `SpeechRecognizer` 类来实现语音输入转文字的功能：

```cpp    #include <QCoreApplication>    #include 'speechrecognizer.h'

int main(int argc, char *argv[])    {        QCoreApplication a(argc, argv);

    SpeechRecognizer recognizer;

    // 连接信号槽，接收语音输入转文字结果        QObject::connect(&recognizer, &SpeechRecognizer::speechRecognitionResult, [](const QString &result) {            qDebug() << 'Speech Recognition Result: ' << result;        });

    // 开始语音输入转文字，传入音频文件路径        recognizer.startSpeechRecognition('audio.wav');

    return a.exec();    }    ```

编译运行程序: - 编译并运行程序，程序将读取音频文件，将其发送到 Google Cloud Speech-to-Text 服务进行识别，并将识别结果打印到控制台。

总结

通过使用 Google Cloud Speech-to-Text 服务，你可以轻松地在 Qt 应用程序中实现语音输入转文字功能。