本篇文章给大家分享的是有关利用c#编写一个语音合成功能,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
开发流程如下:
1. 创建百度应用:
创建应用之后就能看到创建完的应用和 API KEY 以及 Secret KEY
2. 引用 Baidu.Aip (SDK)
Baidu.Aip 封闭了文字识别Ocr API 的Http请求,简化代码,提高开发效率。如果不想引用该DLL,可以自己封装Http请求方法。
C# SDK 现已开源,快速接入文档参考:https://ai.baidu.com/ai-doc/SPEECH/Jk4nlz6gp
3. 调用API,
这里仅展示通用及高精度识别示例,特殊场景识别,详见官方文档:https://ai.baidu.com/ai-doc/SPEECH/Jk4nlz6gp
/// <summary> /// 语音合成 /// </summary> /// <param name="reqItem">请求相关参数</param> /// <param name="destPath">mp3文件保存路径</param> /// <param name="synthesisEvent">状态事件</param> /// <returns></returns> public static bool Synthesis(ReqSynthesis reqItem, string destPath, SynthesisEvent synthesisEvent) { bool callResult = false; try { synthesisEvent("语音合成初始化..."); // 百度应用配置 var apiKey = ConfigUtil.GetConfigStr(EnumConfigKey.SpeechAPI_Key); var secretKey = ConfigUtil.GetConfigStr(EnumConfigKey.SpeechSECRET_KEY); if (!RiverAuth.Instant.CheckSynthesis(apiKey, secretKey)) { return false; } var client = new Baidu.Aip.Speech.Tts(apiKey, secretKey); client.Timeout = 60000; // 修改超时时间 var option = new Dictionary<string, object>() { {"vol", reqItem.vol}, // { "pit", reqItem.pit}, // {"spd", reqItem.spd}, // 语速 {"per", reqItem.per} // 发音人,4:情感度丫丫童声 }; synthesisEvent("开始语音合成..."); var result = client.Synthesis(reqItem.tex, option); // 保存文件 if (result.Success) // 或 result.Success { File.WriteAllBytes(destPath, result.Data); synthesisEvent("语音合成返回成功,文件:" + destPath); callResult = true; } else { synthesisEvent(string.Format("语音合成失败, 错误码:[{0}], 原因:{1}", result.ErrorCode, result.ErrorMsg)); } RiverAuth.Instant.EndCallEvent(); } catch (Exception ex) { synthesisEvent("语音合成失败,原因:" + ex.Message); LogHelper.LogError(ex, "语音合成"); } return callResult; } } /// <summary> /// 语音合成请求 /// </summary> [Serializable] public class ReqSynthesis { public string tex { get; set; }//合成的文本,使用UTF-8编码,请注意文本长度必须小于1024字节 必填项 public string cuid { get; set; }// 用户唯一标识,用来区分用户,填写机器 MAC 地址或 IMEI 码,长度为60以内 否 public int spd { get; set; }//语速,取值0-9,默认为5中语速 否 public int pit { get; set; }//音调,取值0-9,默认为5中语调 否 public int vol { get; set; }//音量,取值0-15,默认为5中音量 否 public int per { get; set; }//发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为普通女 } /// <summary> /// 语音转文字返回结果 /// </summary> public class RetSpeech { public string corpus_no { get; set; } public string err_msg { get; set; } public int err_no { get; set; } public string[] result { get; set; } public string sn { get; set; } }
4. 语音合成最后保存为 MP3 文件
以上就是利用c#编写一个语音合成功能,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。