人声合成 - Casiotone | CASIO卡西欧官方网站

人声合成：重新定义键盘演奏的技术

想象一下，现在有一台神奇的电子键盘，可以根据您演奏的乐句“唱”出预先制作的歌词。与传统键盘和合成器不同，不需要专业的工作室制作设备和复杂的操作，Casiotone CT-S1000V以“人声合成”（Vocal Synthesis）这项技术，旨在重新诠释键盘演奏的概念。

自20世纪80年代以来，基于PCM技术已经为广大键盘手呈现了无数真实乐器的动人音符。但是，成功复制人类歌唱的声音，成为无数人长期以来遥不可及的梦想。即使是在恒定的音高下，人声的音色也同样变幻莫测，而且歌词的变化又为模拟人声增加了难度。即使是一个既定的单词，也可能因为旋律措辞的不同，或是前后单词的差异而改变波形。

虽然部分产品已经能够通过键盘复制人声，但需要专业的操作和演奏技术，或对预先编程的歌词进行细微的校准和演奏，因此对于音乐玩家们使用这类产品会有些限制。

CASIO的“人声合成”Vocal Synthesis通过将人声复制合成，使键盘手对于“电子键盘歌唱”技术的要求得到了解决。CT-S1000V的推出意味着人人都可以按照自己的喜好，创造出人声演奏，而无需局限于特别复杂的专业技术。

- 实时“唱歌”的乐器

- 单音模式和乐句模式可控制乐曲的演绎进程

- 实时控制人声音色

- 结合各种功能创建复杂的声乐音效

- 使用 Lyric Creator 应用程序上传原创歌词

- 人声合成：自 PCM 以来声音生成技术迈出的新的一步

实时“唱歌”的乐器

人声合成“Vocal Synthesis”这项技术，由卡西欧公司与名古屋工业大学的研究人员共同开发，乐器演奏者可以用它轻松唱出歌声。发音模式基于早期的机器学习研究，常被用来调整人声音色，一系列真实的人声数据与内置的预设歌词和通过Lyric Creator App制作的用户歌词相结合，最终实现用键盘“唱歌”的效果。模仿人类发声的PCM声源能产生人声音调，与输入歌词产生乐句的过滤器相结合后，即可产生人声。您也可以使用旋钮实时调整音色，以进一步调整年龄和性别等特征。

相比于市面上其他通过键盘预录人声，或将人声和合成器音色实时结合的方法而言，这项技术是一项全新突破。您可以利用vocal人声合成技术，将预设的歌词与心仪的旋律或和声相配，为器乐和乐曲表达开辟更多可能。

单音模式和乐句模式可以控制乐曲进程

歌词前进形式取决于您选择的模式：单音模式下，您演奏的单音将构成旋律，歌词随着每个音符的演奏而唱出；而在乐句模式下演奏时，歌词会以设置好的固定的节拍自动演唱。

在单音模式下，您演奏的音符会触发歌词的每个音节，终端辅音会在松开琴键后触发，最后传出流畅、自然的歌声。此外，还有一些功能可以避免因弹错音符而出错。搭配卡西欧的SP-3和SP-20踏板（单独出售）或其他市售的脚踏开关，可用于前移或后移歌词，或重置歌词的位置。您还可以用低音区的按键选择下一个要发音的音节，并控制在演奏和弦时音节的前进方式。

虽然“单音模式”和现有的人声合成软件基本都需要事先固定人声旋律，但在“乐句模式”中，CT-S1000V会在您演奏时自动前移歌词，便于您进行即兴创作。只需事先设置好歌词、节奏和速度，然后自由演奏，歌词就能按照预设的节拍唱出。

在乐句模式下，您可以不局限于简单的旋律，利用高级键盘技术创造出复杂的演唱。即使您只有基础演奏基础，也可以自信演奏，如果您不小心按错了一些键，乐句并不会因此“断裂”。乐句模式的另一项功能是自然衔接歌词，营造出流畅的演唱段落。这也是一个很好的作曲平台，您可以通过键盘的直观界面来设计新演唱人声，做出更多安排。

“乐句模式”让CT-S1000V成为一款不只具有新式声音演奏和音色实现的键盘，同时，为音乐表达赋予了更多可能。

实时控制Vocal人声音色

CT-S1000V内置22种人声音色（又称“Vocalist”），从“合唱团（Choir Group）”和“波萨诺瓦（Bossa Nova）”到“童声（Child）”，甚至“声音解码器（Vocoder）”等，每种音色都独具特色。每种音色包含多种波形和自然元素，如白噪音等。这些预设人声音色经过精确调整，可发出清晰的元音和辅音，无论是单音旋律还是复杂和声，它都能轻松胜任。

同时，CT-S1000V控制面板上的旋钮可用于实时调整参数，如颤音和滑音等，以及调整人声演唱歌手的年龄和性别等声调。通过调整击键、释键以及发音速度，在单词和音节变化时，您可以得到更自然的效果，同时可以通过微调，控制人声演唱的时间，让乐曲更加震撼人心。不止如此，您还可以上传16位/44.1kHz的WAV文件，创建您的专属自定义用户音色，调整各项参数后，可以还原出更加原始的声音。这些功能使CT-S1000V与众不同，又备受喜爱，这些功能均由卡西欧的人声合成技术提供支持。

Vocalist音色示例

合唱团

CHOIR GROUP 1 Do you hear

中型女声合唱团的音色。辅音发音清晰，即使在演奏和弦时也能听清。

三重唱

CHOIR TRIO 61 Iwanna be

男声三重唱。辅音发音清晰，即使在演奏和弦时也能听清。

声码器 1

VOCODER 1 82 Tell me why

类似声码器的音色，在 80 年代的迪斯科金曲中非常流行，音调低一个八度。

: 波萨诺瓦

BOSSA NOVA 26 Dont tell me

充满气息的波萨诺瓦风格女声。

歌剧

OPERA 84 The show must

带有独特颤音的歌剧音色。

死亡金属

DEATH VOICE 76 Set me free

一种被称为“咆哮”的激烈声音，用于死亡金属音乐流派。声音中不包含基音。

幽灵

GHOST 100 konnichiwa

在初始阶段加入向上弯曲音，以创造出一种有趣的幽灵般的声音。

动物

ANIMALS 13 Are you ready

这是一种独特的音效，可在模仿鸡、牛、狮子、猫和山羊的同时唱出词曲。

结合多项功能来创建丰富的vocal音效

多项内置功能可以赋予人声合成和CT-S1000V更多创意。例如，琶音器可以演奏琶音和弦和其他乐句，也可以与音节随机器结合使用，以随机顺序唱出歌词中的音节，创造出别具一格的音群。

内置DSP效果器结合器乐音色，可呈现出更多动态组合。在再触发功能激活的状态下长按一个键，即可重现快速、完整地连续敲击键的效果。将再触发功能与长按功能结合起来，即使在松开琴键后仍能重新触发，更容易达到仅靠物理击键难以呈现的效果。

使用歌词制作应用程序-
Lyric Creator
上传原创歌词

请在App Store/Android应用商店查询有关您的智能设备型号和操作系统的兼容性信息。

应用程序用户指南

将智能设备连接到乐器

输入歌词

您可以在您的iOS或Android设备上，利用卡西欧专门的歌词制作App -Lyric Creator，输入您喜欢或原创的英文/日文歌词。这些文字会自动划分为音节单位（当然，您也可以手动划分，并将多个音节组合在一起），将编辑结果输出至您的CT-S1000V，即可开始演奏。

设置节拍

在乐句模式下，歌词演奏的节拍由分配的音符时值（八分音符、四分音符等）和插入的休止符来确定。单个歌词音色包括速度数据，利用CT-S1000V即可调整。速度也可以与数字音频工作站或其他外部MIDI设备的MIDI时钟同步，以确保您在调整时，人声乐句可以正确卡点。

2025.1.23 Lyric Creator ver2.0.0 现已发布！

新功能让歌词创作更灵活、更方便

新功能简化了歌词乐句音符值的设置。除了标准的音符符号输入外，现在还可以通过沿网格线拖动音符来编辑音符值。每个音符值都显示为一个可视化方框，便于直观地调整长度和位置。这样就可以精确微调音符和休止符的持续时间，而标准音符符号输入则无法做到这一点。此外，小节线现在可以在屏幕上显示，从而简化了复杂节奏的编辑，例如跨小节的切分音。
此外，通过应用程序还可直接播放不同节奏的歌词短句。这样，在将歌词数据传输到乐器本体之前，您就可以立即检查节奏和歌词乐句的音效。

乐句和发音颗粒化

对颗粒化感兴趣的用户可以深入编辑组成单个音节的音素。除了制作更清晰的发音外，颗粒化还可以用来模仿地方口音，或模拟英语和日语以外语言的发音。（注意，可用的音素库只包括标准英语和日语的声音。）

将歌词串联成更长的歌词序列

虽然歌词制作App-Lyric Creator对输入的歌词长度有限制（最多100个八分音符的音节），但将歌词上传到您的CT-S1000V后，单段歌词即可组成更长的序列。您可以利用这项功能，在输入阶段对个别部分进行微调，然后在CT-S1000V内将它们串起来，合成一首完整的歌曲。

创建自己的专属“人声”

歌词制作APP- Lyric Creator也可用于将存储在移动设备内的WAV音频样本（16bit/44.1kHz，单声道/立体声，最长10秒）转化为原始的人声数据文件，然后加载到CT-S1000V中。您可以在编辑界面中设置年龄、性别、人声音域和颤音等特征。

CT-S1000V内置的的22种vocal音色会混合多种波形与白噪声等元素，以尽可能提高发音清晰度，因此User Vocalist的波形可能无法完全还原发音的波形。不过您可以尝试创造新的声音，如类似CT-S1000V中预设的动物声音。

您可以点击下方链接，免费下载兼容User Vocalist的波形样本（SawC4+WhiteNoise.wav）开始尝试：
https://support.casio.com/en/support/download.php?cid=008&pid=20

将 CT-S1000V 连接到智能设备

将Lyric Creator App安装到智能手机或平板电脑上后，您即可通过USB数据线（琴一端接口为microB）将设备与CT-S1000V连接起来，开始传输歌词、序列、人声样本等。连接后，您还可以使用该应用程序查看CT-S1000V内部驱动器的可用空间，删除文件，并编辑文件名。项目文件可通过专有格式导出，便于CT-S1000V的用户相互共享。您还可以从DAW中导入Music XML歌词数据和音符值。

将智能设备连接到乐器

Vocal人声合成：自PCM问世以来，声音生成迈出的第一步

CASIO 音源开发史

音频行业的研发史最早可追溯到20世纪70年代，脉冲编码调制（PCM）技术恰在彼时应运而生。这种技术通过数字化再现模拟音源（如实体乐器和人声），极大地改变了我们的日常音乐环境。

元音-辅音合成

Casiotone 201

PD 音源

CZ-101

iPD 音源

VZ-1

为了可以利用数字技术普及音乐演奏的乐趣，1980年，卡西欧计算机株式会社首次以Casiotone 201及其新型元音-辅音合成方法进入乐器市场。到20世纪80年代中期，录制音乐的载体从模拟唱片转向了数字CD，友商的乐器制造商竞相开发出用于音乐创作的数字合成平台。此后，卡西欧推出了CZ-101合成器，这款产品搭载了我们特有的相位失真（PD）音源。1988年，卡西欧推出VZ-1及其集成相位失真（iPD）技术，为数字合成的发展再一次作出了自己的贡献。

20世纪80年代，电子乐器对流行音乐的进化产生了深远影响。采用PCM技术的新键盘和合成器备受青睐，音乐玩家们开始使用全新的声音创作唱片，探索全新表演风格。同时，存储器的优化升级相对降低了数字乐器的成本，越来越多的普通消费者也能用得起了。

1985年，卡西欧发布了MT-500电子琴，它使用基于PCM的音色生成音乐，将鼓和钹的声音数字化，为传奇产品SK-1采样键盘奠定了基础，这款键盘在1986年面世后，共卖出了一百万台。随后，卡西欧又在1988年推出了CT-640，这是一款完全基于PCM音色生成的电子键盘。

大约在同一时期，PCM技术也催生出了声音愈发真实的电钢琴。1988年，卡西欧的首台带有重锤键盘的电钢琴，采用PCM技术的CDP-3000正式上市；1991年，卡西欧推出AP-7及其高端系列电钢琴（AP）音源，时至今日依然受欢迎的CELVIANO系列全面迈入电钢琴市场。在随后的几年里，存储器的改进使产品的性能和音质不断提高，而且价格越来越亲民。

但PCM音源并非没有缺点。

虽然它们能忠实地再现存储声音，但如果声音起伏较大，那么PCM音源就不能很好地重现音色和发音的微妙变化。为了更好地优化优化PCM架构，卡西欧于1993年推出了CTK-1000：这是一款基于PCM技术的同时，融入了iXA音源的电子琴，同时具备力度感应和DSP功能。

我们目前有许多产品仍在使用基于PCM的音源结合卡西欧独特的技术，以再现音色丰富的变化，例如声音衰减和演奏力度等。我们的电钢琴产品线包括Privia和CELVIANO系列，它们都使用了智能声学共鸣器的（AiR）音源，以及含AiR Grand三角钢琴音源的CELVIANO Grand Hybrid。同时，Casiotone系列也配有基于PCM的声学智能多重表达（AiX）音源。

基于 PCM 的音源

SK-1

CT-640

CDP-3000

CELVIANO AP-7

CTK-1000

Privia PX-S1100

CELVIANO Grand Hybrid GP-510BP

Casiotone CT-S1

虽然这些基于PCM的先进的音源能够大量模拟再现原声乐器的声音，但它面对基本而重要人声乐器模拟，依然显得束手无策。不同的发声技巧会产生极其复杂的音色变化，而且歌词内容产生的变数也需要处理。从词汇的多样性到音节之间的过渡，到不同的旋律或乐句，每种参数变化都会改变单词的波形，使得通过乐器表现人声，更加困难重重。近年来，虽然基于PCM的技术已有很大进步，声音合成器和其他技术也有很大的发展，但这个不足依然限制了其广泛普及。

经过多年不懈努力，2022年卡西欧终于开发出了全新的vocal合成音源技术—Vocal Synthesis的键盘乐器：Casiotone CT-S1000V。结合人声合成技术与创新的乐句模式，这款新设备能执行复杂的歌词演奏任务，让悠扬的人声通过指尖“演唱”出来。界面依然简单直观，简单上手。30年来，我们的生活方式发生了翻天覆地的变化，我们希望这款新品能在音乐表演和作曲领域同样可以带给您不同的演奏体验。

人声合成

Casiotone CT-S1000V

Casiotone