一、需要增加的内容

2、与旧数字人技术对比图

传统数字人技术主要架构 :STT、NLP、TTS、音视频合成驱动。为了保证流式响应,牺牲了AI的思考能力。并且拓展能力有限,不支持重启历史对话,Tool自定义函数的拓展。

NavTalk:音频 -> 视频。减少了处理流程,增加了AI思考的时间和处理能力。支持重启历史对话,Tool自定义函数的拓展。

3、企业愿景

4、AI 特征配图

第一张gif动图,拖动音频 -> 点击按钮开始对话,显示文字,然后AI回复。

文本优化:

🔧 API 功能概览

◀️ 实时数字人(Real-Time Digital Human)

通过 WebSocket 接入音频流,边说边看,毫秒级响应的沉浸式互动体验。

🔹 核心能力:

  • 实时唇形驱动:输入语音,立即同步生成嘴唇动作

  • 超低延迟:平均响应时间 < 2000ms

  • 可持续流式输出:适配语音助手、虚拟客服等长对话场景

  • 多语言识别支持:兼容 57+ 语言,自动适配语音风格

  • 即时可嵌入:提供JS示例快速接入

📌 典型应用:
语音助手面孔 · 智能客服 · 互动讲解终端 · AI 陪伴机器人

👉 [立即接入实时模式 API]


▶️ 非实时数字人(Batch Digital Human)

上传内容,快速合成完整视频,适合播报、教学、宣传等批量内容场景。

🔹 支持输入类型:

  • 文本:支持英文、中文、西班牙语等内容直接生成视频

  • 音频文件(如 WAV/MP3/Base 64):分析语音节奏并同步嘴唇动作

  • 自定义头像图片:上传头像可生成专属虚拟数字人

🔹 核心优势:

  • 高度匹配语音节奏与口型,画面自然

  • 可选生成高清 MP4 或返回视频链接

  • 多种输出格式支持(URL / base64 / Blob)

  • 视频质量高,帧率可达30+fps,适配网页与移动端播放

📌 典型应用:
新闻播报 · 教学课程 · 产品介绍视频 · 虚拟主持人

👉 [立即开始合成模式 API]

5、背景颜色采用浅蓝色

与顶部的交接处渐变,AI特征模块采用浅蓝色,白色略显单调。

6、应用场景

政务服务与智能导览

在政务大厅或博物馆等场所,实时数字人可作为导览员,提供政策解读、业务咨询等服务,提升服务效率和用户满意度。

金融行业智能客服

银行等金融机构可部署实时数字人,提供7×24小时的客户服务,解答账户查询、理财建议等问题,降低运营成本。

医疗健康咨询

在医疗领域,实时数字人可用于健康咨询、心理辅导等,提供个性化的服务,缓解医疗资源紧张的问题。

教育与在线培训

在教育领域,实时数字人可用于录制教学视频、课件讲解等,提升学习体验和教学效率

品牌营销与广告制作

企业可利用实时数字人制作广告视频、品牌宣传片等,增强品牌形象和市场影响力。

7、客户评价

8、API构建开始

9、FAQ

1)什么是“实时数字人视频”?和合成视频有什么区别?

答:
实时数字人视频是指通过语音输入,驱动虚拟人同步说话和表情,适合用于直播、在线讲解或互动演示。合成视频则是将文字或音频与图片、视频等素材组合,生成完整的虚拟人视频,更适合短视频、教学或宣传内容的批量制作。


2)每个月我可以生成多少个视频?有次数或时长限制吗?

答:
不同套餐提供不同的配额。免费版包含 3 分钟实时视频和 10 次合成;Lite 提供 60 分钟实时 + 300 次合成;Business 提供 120 分钟实时,合成不限;Enterprise 支持实时和合成双重无限。配额每月清零,不可累计。


3)视频支持哪些输入形式?我可以上传图片或视频素材吗?

答:
合成视频支持文本、音频、图片和视频等多模态输入,可灵活组合生成内容。实时视频目前仅支持语音输入。如需自定义角色或背景图像,需升级为企业版并联系客服配置。


4)支持哪些语音音色?能定制吗?

答:
系统提供 8 种以上高质量音色,涵盖多种性别和语调风格。企业用户可申请定制音色服务,满足品牌或个性化需求。


5)支持哪些语言?语音会自动识别吗?

答:
平台支持 50 多种语言,包括中文、英文、日语、法语、西班牙语等。实时视频功能可自动识别语音语言并切换,无需手动设置,适合多语种内容生成场景。


6)API 能做什么?适合哪些开发者?

答:
API 可用于调用实时驱动、视频合成、上传素材等功能,适合需要将数字人技术集成到网站、APP 或业务系统的开发者使用。


7)什么是 Tool 函数调用支持?

答:
平台支持调用智能函数,如自动总结、关键词提取、情绪识别等,增强数字人的内容理解和生成能力。


8)合成速度快吗?优先处理是指什么?

答:
高级和企业用户享有视频处理优先级,合成速度更快。普通视频一般在 30 秒至 2 分钟内生成,具体视素材和时长而定。


9)有试用吗?订阅后可以退款或取消吗?

答:
我们提供免费试用额度,包含部分实时与合成视频生成次数。订阅后可随时取消自动续费,服务将在当月结束时终止。服务为数字内容交付,暂不支持退款。