Thinking and Sharing

ICASSP2019 TTS Summary(Oral)

Posted on 2019-05-15 | Edited on 2019-05-30 | Comments:

Symbols count in article: 2k | Reading time ≈ 2 mins.

这篇文章主要是提出了一个基于线性预测的高质量声码器

主要贡献:

总结：
这篇文章开源了代码，而且跑出来的效果真的很不错，力推！

Posted on 2019-05-14 | Edited on 2019-05-15 | Comments:

Symbols count in article: 2.3k | Reading time ≈ 2 mins.

文章是基于18年2月份的WaveRNN来改进, 不同的是LPCNET是用来作为vocoder的，同时在相同的网络结构下能够得到更好的音质，每秒能进行30亿次的浮点数运算，能够支持在比较差的设备，手机等等上运行。实际上也是进行指令级的优化。

文章给了代码，从代码中其实能够学到很多:)。

Posted on 2019-02-23 | Comments:

Symbols count in article: 1.5k | Reading time ≈ 1 mins.

文章主要是使用元学习的方法来做少量数据下的自适应tts。

训练：

三种自适应的策略：