首页技术总结正文内容

基于Speech SDK开发中英文混合朗读程序

技术总结

更新时间：2024-12-23 02:19:06 73

admin 管理员组

文章数量: 887021

2024年1月4日发(作者：世界疫情最新数据消息美国)

基于Speech SDK开发中英文混合朗读程序

摘要中英文混合朗读一直是个难点，本文在分析Microsoft Speech SDK中英文引擎的基础上，提出了根据文本类型实时切换中英文引擎的方法，在Visual C++6.0中实现了一个示例程序。

关键词 Speech SDK；中英文混合朗读；Visual C++

1 Speech SDK简介

语音识别(SR)和语音合成(TTS)一直是计算机应用的热点，如果你想在Windows平台上开发具有语音识别和语音合成功能的应用程序，使用Microsoft Speech SDK是较好的选择。现在许多应用程序的语音识别和语音合成部分，例如金山词霸，就是在此基础上开发的。

Microsoft Speech SDK是微软公司推出的支持语音应用程序开发的工具包，其最新版本是5.1，可以在微软的网站免费下载，如果要支持中文，还要下载相应的Language Pack。下载后先安装Speech SDK，再安装简体中文语言包，这样你的计算机就具有中英文语音能力了。

下面介绍在Visual C++6.0中如何利用Speech SDK开发中英文全文朗读的程序。

2 SpVoice类介绍

SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎，从而实现朗读功能。 SpVoice类有以下主要属性：

Voice：表示发音类型，相当于进行朗读的人，包括Microsoft Mary，Microsoft Mike，Microsoft Sam和Microsoft Simplified Chinese四种。其中前三种只能读英文，最后一种可以读中文，也可以读英文，但对于英文单词只能将其包括的各个字母逐一朗读出来。下面的程序中我们将会想办法解决这个问题。

Rate：语音朗读速度，取值范围为-10到+10。数值越大，速度越快。

Volume：音量，取值范围为0到100。数值越大，音量越大。

SpVoice有以下主要方法：

Speak：完成将文本信息转换为语音并按照指定的参数进行朗读，该方法有Text和Flags两个参数，分别指定要朗读的文本和朗读方式（同步或异步等）。

Pause：暂停使用该对象的所有朗读进程。该方法没有参数。

Resume：恢复该对象所对应的被暂停的朗读进程。该方法没有参数。

3 建立工程并导入类型库

建立一个名字为mytts的MFC AppWizard(exe) 工程，在step1里面选择Dialog Based，在step2里面把Automation选项勾上。其它的选默认值。

查找，将其拷贝到工程的res 目录，打开 MFC ClassWizard，选择 Automation

页，单击按钮"Add Class…"，选择"From a type library…"，选中""文件，这时系统会出现 confirm Classes 对话框，询问将要导入的类，我们全部选中。

4 增加控件

给对话框IDD_MYTTS_DIALOG增加控件，结果如图1所示。

图1 程序界面

5 编写代码

这里只说明关键的代码，完整代码可参考源文件。

1) 对话框的初始化

这里主要完成语音对象的速度，音量等基本参数的设置。

BOOL CMyttsDlg：：OnInitDialog()

{

……

CLSIDFromProgID(L"e"，&CLSID_ SpVoice)；

Dispatch(CLSID_SpVoice)； //创建一个对象

pDisp = voice.m_lpDispatch；

HRESULT hr = pDisp->QueryInterface(CLSID_SpVoice，(void**)&voice.m_lpDispatch)；

if (hr == S_OK) { pDisp->Release()；}

else { Dispatch(pDisp，TRUE)；} //关联对象与接口

e(0)；//设置速度

ume(100)；//设置音量

voiceList=ces(NULL，NULL)； //读取语音列表：

……

m_Text="你好How are you"；//设置要阅读的初始文本

UpdateData(FALSE)；

……

}

2) 阅读按钮的代码

这部分代码是本程序的核心，主要解决的问题是实现中英文引擎的实时切换。实现方法是这样：依次处理文本中的每个字符，判断该字符的中英文类型，若其类型与前面的字符一致，继续处理后面的字符。直到发现一个字符与前面字符的类型不一致时，将前面的字符读出来（当然要根据字符类型设置相应的引擎），然后再处理后面的字符。具体代码如下：

void CMyttsDlg：：OnBtnRead()

{

long i，len；

char curr；

CString str；

int flagPre，flagCur；

int icnt，first；

UpdateData(TRUE)；

len=m_gth()；

flagPre=iChn；icnt=0；first=0；

for (i=0；i

{

curr=m_(i)；

if (curr==' ') flagCur=flagPre；//如果是空格，标志不变

else

{

if ((curr>='A' && curr<='Z') || (curr>='a' && curr<='z')) flagCur=iEng；//如果是英文字母，标志设为0

else flagCur=iChn；//否则标志设为3

}

if (flagCur==flagPre) icnt++；

else

{

if (icnt!=0) //字符类型变化，读出前面的文本

{

Voice((flagPre))；

str=m_(first，icnt)；

(str，1)；

}

flagPre=flagCur；first=i；icnt=1；

}

//读出最后一段文本

Voice((flagPre))；

str=m_(first，icnt)；

(str，1)；

}

6 总结

本文给出了一种根据文本类型实时切换Microsoft Speech SDK的中英文引擎的方法，程序在Windows 2000和Visual C++6.0环境中调试通过。读者可以在此基础上添加其它功能。

参考文献

[1] 毕晓君，静广宇，徐先锋．利用TTS技术实现文本文件的语音合成[J]．自动化技术与应用，2004，23(9)：49-51

[2] 徐雨明．在VFP中调用MSTTS技术实现英文语音输出的方法[J]．电脑编程技巧与维护，2001(1)：17，24

[3] 陈再良，沈海澜．基于MSTTS英文朗读功能的实现[J]．计算机时代，2002(4)：34-35

本文标签：语音朗读字符类型文本

版权声明：本文标题：基于Speech SDK开发中英文混合朗读程序内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.freenas.com.cn/jishu/1704372876h456677.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

发表评论

全部评论 0

暂无评论

技术交流 – FreeNAS中文网

基于Speech SDK开发中英文混合朗读程序

更多相关文章

python 键盘输入立刻反应_win10系统，为什么键盘输入字符后得停顿一下，鼠标点击才有效 例如在wor...

win10语音语言服务器,win10系统：朗读女语音库（发音人）安装方法说明

linux编辑文件命令nano,Linux nano命令使用详解：字符终端文本编辑器

Python调用腾讯API合成语音

如何查看电脑操作系统及系统类型

vue 启动项目时浏览器自动启动的四个方案（三种类型）。

电脑开机出现奇怪字符_windows7系统开机出现乱码原因及解决方法

计算机专业毕业设计题目大全——各种类型系统设计大全

服务启动类型：自动、自动(延时启动)、手动、禁用

windows服务中的登录身份和启动类型设置及本地系统账户、本地服务账户和网络服务账户的概念

文本编辑器IDM UltraEdit最新的31.0.0.28版本在Windows系统上的下载与安装配置

ChatGPT实时语音将于本周向免费用户推出：OpenAI DevDay 2024详细解读

基于STM32设计的智能家居控制系统设计_语音+环境检测(OneNet)_2022

简单：Windows中的文本与Linux中CentOS的vim编辑器相互复制粘贴方法

ChatGPT函数调用初体验：让ChatGPT具备抓取网页文本的能力

ChatGPT of Siri 快捷指令语音免魔法3.5版+网页版 - TDChat

固态硬盘的类型、颗粒和接口了解

部分阉割版Win7无法正常使用TTS语音的解决办法

js判断浏览器类型大全

Js判断linux还是windows,js获取客户端操作系统类型的方法【测试可用】

发表评论

推荐文章

安装虚拟机

Linux 第八周作业

TigerVNC for Windows 编译

win7分区软件_全自动分区装系统PE纯净无广告

计算机无法启动要求修复,系统受损电脑无法开机要怎么恢复？教你修复受损Win7系统...

热门文章

oracle数据库备份方法rman,用RMAN进行ORACLE数据库备份的方法研究

虚拟机中安装Ubuntu 20.04，Liunx系统的常用命令以及工具安装

2023辽宁工程技术大学计算机考研信息汇总

rce总结，绕过手法+危险函数举例

分布式微服务架构体系详解

excel表格行列显示十字定位

鸿蒙5.0开发【性能测试】DevEco Testing

windows系统下载好装不了

windows扫描域内端口

华为手机如何与台式计算机连接不上,华为手机怎样与电脑连接？USB数据线及WLAN无线两种连接电脑方式介绍...

最新文章

Raid技术

LSI_阵列卡操作手册

破解Centos7_root用户密码

Redhat重置Root用户密码方法

远程批量修改linux服务器密码的脚本

Windows7 系统安全设置权限技巧

（Windows系统）详细介绍Windows系统 含有英文版

最新Windows 11教育版下载：专为教育设计的系统！

Win7系统下搭建NFS服务器

零基础使用UltraISO制作并安装纯净Win10系统指南

python 键盘输入立刻反应_win10系统，为什么键盘输入字符后得停顿一下，鼠标点击才有效例如在wor...

（Windows系统）详细介绍Windows系统含有英文版