uni-app语音转文字功能demo(小程序同声翻译开箱即用)

以下是一个简单的uni-app实现语音转文字的示例代码。请注意,这个示例仅提供了核心功能,并且需要你有一个有效的百度AI开发者ak。




<template>
  <view>
    <button @click="startRecognize">开始转写</button>
    <button @click="stopRecognize">停止转写</button>
    <view v-if="result">
      转写结果:{{ result }}
    </view>
  </view>
</template>
 
<script>
export default {
  data() {
    return {
      recorder: null,
      recorderInitResult: null,
      result: ''
    };
  },
  methods: {
    startRecognize() {
      const that = this;
      uni.authorize({
        scope: 'scope.record',
        success() {
          that.recorder = uni.getRecorderManager();
          that.recorder.onStop((res) => {
            that.recorderInitResult = res;
            that.sendRequest(res);
          });
          const options = {
            duration: 60000,
            sampleRate: 16000,
            numberOfChannels: 1,
            encodeBitRate: 960000,
            format: 'aac'
          };
          that.recorder.start(options);
        },
        fail() {
          uni.showModal({
            content: '无法获取录音权限',
            showCancel: false
          });
        }
      });
    },
    stopRecognize() {
      if (this.recorder) {
        this.recorder.stop();
      }
    },
    sendRequest(res) {
      const that = this;
      uni.uploadFile({
        url: 'https://vop.baidu.com/server_api', // 你的语音识别服务地址
        filePath: res.tempFilePath,
        name: 'sound',
        header: {
          'Content-Type': 'application/x-www-form-urlencoded',
          'token': '你的百度AI开发者ak'
        },
        formData: {
          'rate': 16000,
          'channel': 1,
          'token': '你的百度AI开发者ak',
          'cuid': 'user001',
          'dev_pid': 1537
        },
        success(uploadFileRes) {
          const result = JSON.parse(uploadFileRes.data);
          that.result = result.result[0];
        },
        fail(uploadFileErr) {
          console.log(uploadFileErr);
        }
      });
    }
  }
};
</script>

在这个示例中,我们首先通过getRecorderManager获取录音管理器,然后开始录音。录音结束后,我们将录音文件上传到服务器,并使用百度AI的语音识别服务进行转写。转写结果会显示在页面上。

请注意,你需要替换urltokencuid为你自己的服务信息。dev_pid是语言编码,根据需要可以更改,1537是中文。

这个示例只是一个基本的实现,你可能需要根据你的实际需求进行更多的调整和优化。

最后修改于:2024年08月10日 13:42

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日