Web Speech API 提供语音识别与合成功能,通过 SpeechRecognition 实现语音转文字,需用户触发并处理权限;使用 SpeechSynthesis 将文字转语音,可设置语言、语速等参数,适合辅助阅读等场景。

Web Speech API 提供了浏览器端的语音识别和语音合成功能,让你可以通过 JavaScript 实现语音输入与文字朗读。它包含两个主要部分:SpeechRecognition(或 SpeechRecognitionAlternative)用于语音识别,SpeechSynthesis 用于语音合成。下面介绍如何使用它们。
语音识别功能允许用户通过说话,将声音内容实时转换成文本。目前该功能在 Chrome 和 Edge 等基于 Chromium 的浏览器中支持较好。
使用步骤如下:
调用 start() 方法后,浏览器会请求麦克风权限。用户说完话后,onresult 会触发并返回最终文本。
语音合成功能可以让网页“朗读”指定的文字,适用于辅助阅读、语音提醒等场景。所有现代浏览器都基本支持 SpeechSynthesis。
使用方式更简单:
你还可以通过 speechSynthesis.getVoices() 获取可用的发音人列表,并为 utterance.voice 赋值来选择不同声音。
// 获取所有语音(可能需要延迟加载)在真实项目中需要注意以下几点:
基本上就这些。Web Speech API 使用简单,适合快速集成基础语音功能。只要注意兼容性和用户体验,就能做出实用的语音交互功能。
以上就是如何用Web Speech API实现语音识别与合成?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号