烟神殿API说明文档
首页烟神殿AI余额充值
首页烟神殿AI余额充值
  1. Python配置方式
  • 引言
  • 在线调试说明
  • 发出请求
  • 中转站基本介绍
    • API 快速开始指南
    • 联系客服
    • 分组详细表格
    • 分组的特殊性及价格差异
    • 代理接口调用地址
    • API Key 额度查询服务
    • 免费AI聊天项目导航
  • 绘画模型
    • README
    • 图像对象
    • Midjourney
      • 上传图片
      • 根据任务ID 查询任务状态
      • 提交Blend任务
    • Ideogram
      • Generate 3.0(文生图)Generate
      • Generate 3.0(图片编辑)Edit
      • Generate 3.0(图片重制)Remix
      • Generate 3.0(图片重构)Reframe
      • Generate 3.0(替换背景) Replace Background
    • GPT Image-1
      • 蒙版 gpt-image-1
    • DALL·E 3
    • FLUX 系列
      • gpt 兼容格式
        • Flux 创建(OpenAI dall-e-3格式)
        • Flux编辑(OpenAI dall-e-3格式)
      • Replicate 官方格式
        • Flux 分辨率
        • 接入教程
        • 创建任务 black-forest-labs/flux-kontext-dev
        • 查询任务
      • Fal.ai 官方格式
        • 接入教程
        • 获取请求结果
        • /fal-ai/flux-pro/kontext
        • /fal-ai/flux-pro/kontext/max
        • /fal-ai/flux-pro/kontext/max/multi(实验性多图编辑)
        • FLUX.1 [Dev] 文本生成图片
        • FLUX.1 [Dev] 图片生成图片
        • FLUX.1 [Dev] Redux
        • FLUX.1 [Schell] Redux
        • FLUX.1 Kontext [Pro]
        • FLUX.1 Kontext [Max] 文本转图像
        • FLUX.1 Kontext [Multi](实验性多图编辑)
        • FLUX.1 Kontext [Max]
        • FLUX.1 Kontext [Max] 文本转图像
        • FLUX.1 Kontext [Max Multi](实验性多图编辑)
    • 豆包系列
      • doubao-seedream-3-0-t2i-250415
      • doubao-seededit-3-0-i2i-250628
  • Claude Code配置教程
    • Claude Code 安装使用教程
  • Gemini Cli安装教程
    • Gemini Cli安装教程
  • CherryStudio配置教程
    • Cherry Studio配置教程
    • CherryStudio配置o4推理级别
    • CherryStudio调用cluade MCP
  • ChatGpt 接口
    • ChatGPT音频(Audio)
      • 音频转文字 whisper-1
      • 音频转文字 gpt-4o-transcribe
      • 创建语音
      • 创建翻译 (不支持)
    • ChatGPT聊天(Chat)
      • 聊天完成对象
      • 聊天完成块对象
      • 列出模型
      • 创建结构化输出
      • 控制推理模型努力程度
    • chatgpt-responses格式
      • chat 聊天
      • chat 聊天+网络搜索
      • deep-research 深度搜索 (巨贵,一次几十刀,慎用)
    • ChatGPT自动补全(Completions)
      • 完成对象
      • 创建完成
    • ChatGPT嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
    • Web 搜索
      • web搜索
  • 谷歌Gemini 接口
    • 原生格式
      • 聊天接口 [原生格式]
      • 聊天接口-流 [原生格式]
      • 聊天接口+思考-流 [原生格式]
      • 图片创作[原生格式]
      • 图片编辑 [原生格式] gemini-2.0-flash-preview-image-generation
      • 图片编辑 [原生格式]
      • 图片理解 [原生格式]
      • 格式化输出 [原生格式]
      • 函数调用 [原生格式]
      • 文档理解 [原生格式]
      • 视频理解-base64 [原生格式]
      • 聊天接口 - 阅读网页 [原生格式] 开发中
      • 视频理解-url [原生格式] 开发中
      • Imagen 3 生成图片 [原生格式] 开发中
    • chat兼容格式
  • Anthropic Claude 接口
    • 聊天完成对象
    • 聊天完成块对象
    • 创建聊天补全 (流式) [原生格式]
    • 创建聊天补全 (流式)
    • 创建聊天补全 (非流)
    • 创建聊天识图 (流式)
    • 创建聊天识图 (非流)
    • 创建函数调用
  • 文生视频模型
    • veo 视频生成
      • 视频统一格式
        • 创建视频
        • 查询任务
        • 创建视频,带图片
    • luma 视频生成
      • 官方API格式
        • 提交生成视频任务
        • 扩展视频
      • 查询任务
        • 查询单个任务
        • 批量获取任务
    • Kling 快手可灵
      • Callback协议
      • 图像生成
      • 文生视频
      • 图生视频
      • 查询任务(免费)
    • Runway 视频生成
      • 提交视频生成任务
      • 查询视频任务(免费)
      • 创建聊天函数调用 (只能非流)
  • 文生图接口
    • README
    • 图像对象
    • 创建 gpt-image-1
    • 创建 DALL·E 3
    • gemini图片创作接口 [chat兼容格式]
    • 编辑 gpt-image-1
    • 聊天接口 [chat兼容格式]
    • 聊天接口-思考1 [chat兼容格式]
    • 创建图像变体
  • MJ绘画
    • 提交Imagine任务
    • 根据任务ID 查询任务状态
    • 根据ID列表查询任务
    • 获取任务图片的seed
    • 执行Action动作
    • 提交Blend任务
    • 提交Describe任务
    • 提交Shorten任务
    • 提交Modal
    • 提交swap_face任务
  • ideogram 绘画
    • ideogram(文生图)
    • Remix(混合图)
    • Upscale(放大高清)
    • Describe(描述)
  • GPTs 相关
    • 聊天接口-思考2 [chat兼容格式]
    • 识图接口 [chat兼容格式]
    • 聊天+读取文件接口 [chat兼容格式]
  • 文生音乐 Suno
    • 官方N测试
  • Python配置方式
    • python 使用gpt-image-1 创建编辑图片
    • python openai官方库(使用AutoGPT,langchain等)
    • python 连续对话
    • python 使用 语音转文本
    • python 使用文本转语音
    • python 使用Embeddings 向量化
    • python 调用DALL·E
    • python简单调用 openai function-calling demo
    • python 简单langchain 调用openai demo
    • python llama_index 配置
    • Python使用gpt-4o识别图片-本地图片
    • Python基础对话
    • Python使用gpt-4o识别图片
    • Python使用Claude识别图片
    • Replicate 聚合平台
      • 接入教程
      • Flux 分辨率
  • nodejs 配置方式
    • nodejs 基础对话
  • 各种插件/软件使用教程
    • Cline 配置教程
    • CLAUDE DEV 配置教程
    • chatgpt-on-wechat 配置教程
    • 沉浸式翻译 设置gpt翻译
    • nextchat 设置教程
    • aider 配置教程
    • Cursor 配置教程
    • lobechat 设置教程
    • chatgpt GPT Academic 学术优化配置gpt教程
    • zotero gpt 配置方法
    • 浏览器插件ChatGPT Sidebar
    • ChatBox(推荐使用)
    • 开源gpt_academic
  • 帮助中心
    • HTTP状态码及其含义
  • Replicate 聚合平台
    • 接入教程
    • Flux 分辨率
  1. Python配置方式

python 使用文本转语音

文字转语音 (TTS) API 指南#

概述#

音频 API 提供 speech 端点,基于 TTS 模型实现以下功能:
📝 博客文章朗读
🌍 多语言音频生成
🎵 实时音频流输出
重要提示:必须向用户声明所听到的是 AI 生成的语音,而非人类声音

基础使用#

基本示例#

功能特性#

音频质量选项#

tts-1: 低延迟,适合实时应用
tts-1-hd: 更高质量,可能有更少的静态内容

可用声音#

alloy
echo
fable
nova
shimmer
onyx

支持的输出格式#

格式特点适用场景
MP3默认格式通用场景
Opus低延迟网络流媒体和通信
AAC高效压缩移动设备播放
FLAC无损压缩音频存档
WAV无压缩低延迟应用
PCM原始采样24kHz, 16位有符号

实时音频流#

支持语言#

支持多种语言,包括:
亚洲语言:中文、日语、韩语等
欧洲语言:英语、法语、德语等
其他语言:阿拉伯语、印地语等
注意:当前声音主要针对英语优化

常见问题#

Q: 如何控制生成音频的情感?#

A: 目前没有直接控制机制。大写字母或语法可能影响输出,但效果不确定。

Q: 能创建自定义声音吗?#

A: 不支持创建自定义声音。

Q: 生成的音频归属权?#

A: 归创建者所有,但需告知用户这是 AI 生成的音频。
修改于 2025-08-27 08:04:11
上一页
python 使用 语音转文本
下一页
python 使用Embeddings 向量化
Built with