声刻 Voice Clone
GitHub
Cloudflare Pages
部署就绪
1. 克隆声音
上传 3 到 10 秒清晰人声音频
未上传
选择或拖入音频文件
支持 wav、mp3、m4a、webm,建议安静环境录制。
声音名称
我确认已获得该声音的合法使用授权,并同意不将生成内容用于违法、侵权、冒充或欺诈用途。
默认使用临时 voice id,生成后由服务端请求删除。
2. 输入文本与生成
让克隆声音朗读你的文本
清空文本
输入文本
上传文本文件
你好,欢迎使用声刻 Voice Clone 文本转语音工具。 你可以上传一段 3 到 10 秒的清晰人声音频,克隆出属于你的声音。 在这里输入或粘贴想要合成的文本,点击生成按钮,即可试听生成的语音。
0 / 5000
API 提供商
ElevenLabs 克隆
Microsoft Azure 免费 TTS
Google Cloud 免费 TTS
1forall.ai TTS
自定义兼容 API
基础模型
Multilingual v2
Turbo v2.5
Flash v2.5
稳定度
相似度
表现力
ElevenLabs:
支持上传几秒音频做声音克隆,需要在 Cloudflare 环境变量配置 ELEVENLABS_API_KEY。
Microsoft Azure:
普通神经朗读可用免费额度,不使用上传样本克隆声音。可在 Cloudflare 配置 AZURE_SPEECH_KEY / AZURE_SPEECH_REGION,或临时在这里填写。
Google Cloud:
普通文本转语音可用免费额度,不使用上传样本克隆声音。建议在 Cloudflare 配置 GOOGLE_SERVICE_ACCOUNT_JSON。
1forall.ai:
使用 speech/text-to-speech 接口生成普通朗读音频,鉴权格式为 Authorization: Api-Key。上传样本不会用于克隆。
自定义 API:
会以 multipart/form-data 发送 text、voiceName、sample 字段,并期待接口直接返回音频文件。
Azure 区域
Azure Key
Azure 声音
Google 语言
Google 声音
服务账号 JSON
自定义 API 地址
密钥 Header
API Key
1forall API Key
声音 ID
语速
下载音频
生成语音
3. 生成记录
最近生成
清空
声音名称
文本内容
模型
时间
操作