语音质量有差异

BUG反馈 · 400 次浏览
epodak 创建于 2022-11-27 13:17

在线听的音质是最高的,我在网页油猴上点击收集模式的时候,选择48k 196 模式下载声音应该与在线一致。

但是在这个动作里面下载的音频总感觉音质降低了。


epodak 2022-11-27 15:20 :

是我的播放器问题。。。

回复内容
ZTOA10 回复 epodak 2022-11-28 15:37 :

这个不会整啊

epodak 回复 ZTOA10 2022-11-28 15:40 :

简单也简单,就是HTML标记语句而已,可是我不会,哈哈哈尬。
就是这样的结构

-----------------

<speak xmlns="http://www.w3.org/2001/10/synthesis" xmlns:mstts="http://www.w3.org/2001/mstts" xmlns:emo="http://www.w3.org/2009/10/emotionml" version="1.0" xml:lang="zh-CN">

    <voice name="en-US-AriaNeural">

        <mstts:express-as style="Cheerful">

            "That’s remarkable! You’re a genius!"

        </mstts:express-as>

            Mom said to her son.

    </voice>

    <voice name="en-US-JennyNeural">

        Customize output by 

            <prosody rate="-40.00%">    

                slowing-down the speed rate.

            </prosody>

    </voice>

    <voice name="en-US-GuyNeural">

        Add a break 

            <break time="600ms" /> 

                between words.

    </voice>

    <voice name="en-GB-SoniaNeural">

        You can pronounce it 

            <say-as interpret-as="spell">

                ASAP 

            </say-as>

                or 

                <sub alias="as soon as possible">

                    ASAP

                </sub>

        .

    </voice>

    <voice name="zh-CN-XiaoxiaoNeural">

        <s />

            <mstts:express-as style="chat">

                可以通过停顿里的高级功能“No break”,解决

                    <phoneme alphabet="sapi" ph="fen 1 ci 2">

                        分词

                    </phoneme>

                        引起的多余停顿问题。

            </mstts:express-as>

        <s />

        <mstts:express-as style="chat">

            也可以合成多角色多情感的有声

                <prosody contour="(49%, -40%)">

                    书

                </prosody>

                    ,例如:

        </mstts:express-as>

    </voice>

    <voice name="zh-CN-YunyeNeural">

        黛玉冷笑道:

    </voice>

    <voice name="zh-CN-XiaoxiaoNeural">

        <s />

            <mstts:express-as style="disgruntled">

                “我说呢,亏了绊住,不然,早就飞了来了。”

            </mstts:express-as>

        <s />

    </voice>

    <voice name="zh-CN-YunyeNeural">

        宝玉道:

    </voice>

    <voice name="zh-CN-YunxiNeural">

        “只许和你玩,替你解闷。不过偶然到他那里,就说这些闲话。”

    </voice>

    <voice name="zh-CN-XiaoxiaoNeural">

        <mstts:express-as style="angry">

            ”好没意思的话!去不去,关我什么事儿?又没叫你替我解闷儿,还许你

            <mstts:ttsbreak strength="none" />

                从此

                <prosody contour="(24%, +49%) (59%, -2%)">

                    不

                </prosody>

                <prosody rate="-15.00%" contour="(24%, +49%) (59%, -2%)">

                    理

                </prosody>

                <prosody contour="(24%, +49%) (59%, -2%)">

                    我呢

                </prosody>

                !”

            </mstts:express-as>

    </voice>

    <voice name="zh-CN-YunyeNeural">

        <s />

            说着,便赌气回房去了。

    </voice>

</speak>

ZTOA10 回复 epodak 2022-11-28 15:48 :

这么高级的玩意,平时我用不到,我也就玩玩,很多动作整了自己都不用

epodak 2023-01-08 19:23
#2

该换地址啦


https://azure.microsoft.com/en-us/products/cognitive-services/text-to-speech/#features

回复主贴