智能助手工作台 v1.0.0 使用教程

📖 一、软件简介

1.1 核心功能

✅ 语音转文字：支持单文件和批量处理
✅ 文字转语音：支持情感克隆和声音定制
✅ 资源搜索：集成网页浏览器，快速访问资源网站

1.2 系统要求

操作系统： Windows 10/11 64位
内存： 4GB及以上
存储空间： 200MB可用空间
网络连接： 需要互联网连接（用于AI功能）

1.3 下载安装

下载页面： https://ai-tool.newmt.fun

安装步骤：

下载 ai-tools-v1.0.0-setup.exe
双击运行安装程序
按照向导完成安装
首次运行建议重启电脑

🎤 二、语音转文字功能

2.1 准备工作：获取API Token

硅基流动API Token获取步骤：

访问官网：https://www.siliconflow.cn/
注册登录：支持手机验证码、邮箱、GitHub、Google登录
创建Token：进入个人中心 → API密钥 → 新建API密钥
复制保存：创建成功后立即复制Token并妥善保存

2.2 操作流程

单文件模式：

点击左侧导航栏的🎤图标
在侧边栏输入API Token，选择模型
点击"选择文件"按钮
点击"开始识别"
识别结果可复制、保存或清空

批量模式：

切换到"批量识别模式"
点击"添加文件（多选）"
点击"批量识别"开始处理
完成后点击"下载ZIP"打包导出

2.3 支持格式

音频： mp3, wav, m4a, flac
视频： mp4, avi, mov, mkv（自动提取音频）

2.4 使用技巧

视频文件会自动提取音频进行识别
选择SenseVoiceSmall模型识别速度更快
批量处理多个文件更节省Token

🔊 三、文字转语音功能

3.1 准备工作：获取Gitee AI Token

访问 https://ai.gitee.com/models
注册Gitee AI账号
在API管理页面创建Token
复制Token备用

3.2 模型介绍

IndexTTS-2：情感克隆模型，可学习声音情感特征
Spark-TTS-0.5B：轻量级模型，合成速度快

3.3 操作步骤

点击左侧导航栏的🔊图标
输入Gitee AI Token，选择模型
上传参考音频（30秒以内，清晰无噪音）
输入要合成的文本（建议不超过500字）
点击"生成语音"，等待完成
可播放试听或下载保存

3.4 高级功能（IndexTTS-2）

情感音频控制：上传情感参考音频，调节强度
文本情感控制：输入情感文本，控制语音情感
声音克隆：模仿参考音频的音色和语调

🔍 四、资源搜索功能

4.1 使用方法

点击左侧导航栏的🔍图标
软件自动打开资源搜索网站
在嵌入式浏览器中搜索资源

4.2 支持网站

资源搜索： https://www.panws.top
软件下载： https://ai-tool.newmt.fun
官方论坛： https://www.newmt.fun

❓ 五、常见问题

5.1 安装问题

Q：安装时提示"Windows已保护你的电脑" A：点击"更多信息" → "仍要运行"，或暂时关闭Windows Defender

Q：软件启动后立即闪退 A：安装Visual C++ Redistributable，或更新Windows系统

5.2 功能问题

Q：语音识别总是失败 A：检查API Token是否正确，网络连接是否正常，音频格式是否支持

Q：文字转语音生成速度慢 A：避开高峰期使用，压缩参考音频文件，将长文本分段处理

Q：批量处理中途停止 A：检查网络连接，确认Token额度是否用完，关闭其他程序释放内存

5.3 使用问题

Q：如何保存当前配置？ A：API Token会自动保存到本地文件，位置在软件安装目录下

Q：支持哪些语言？ A：语音识别主要支持中文普通话，语音合成支持中文

💡 六、使用建议

初学者：

先从单文件语音识别开始
使用清晰的短音频进行测试
正确配置API Token后立即保存

进阶用户：

利用批量功能提高效率
尝试创建个性化语音
探索IndexTTS-2的高级功能

生产环境：

确保稳定的网络连接
定期备份重要数据
关注API使用量和费用

📞 七、技术支持

公众号： 百万教程

📌 附录

API服务商

功能	服务商	官网	免费额度
语音识别	SiliconFlow	https://siliconflow.cn	新用户赠送额度
语音合成	Gitee AI	https://ai.gitee.com	按量计费

文件格式支持

功能	支持格式	备注
语音识别输入	mp3, wav, m4a, flac, mp4, avi, mov, mkv	视频自动提取音频
音频提取输出	wav	16000Hz, 单声道
语音合成参考音频	mp3, wav, m4a, flac	建议30秒以内
语音合成输出	mp3	标准MP3格式
文本保存	txt	UTF-8编码
批量导出	zip	标准ZIP格式

祝您使用愉快！

文档版本：v1.0.0
最后更新：2026年1月22日
文档维护：公众号_百万教程

【新手必备】硅基流动API Token免费获取完全指南：4步解锁AI模型调用（零门槛+图文对照）

在AI开发热潮下，API Token作为对接硅基流动（SiliconFlow）多模态AI模型的核心凭证，已成为开发者必备工具。无论是免费试用DeepSeek-OCR，还是调用语言、语音、生图等模型，都无需复杂配置和高昂成本——本文将以零基础新手视角，提供一套完全免费、步骤清晰的API Token获取教程，搭配图文分镜，让你10分钟内轻松上手。

第一步：访问官网，完成快速登录

API Token获取的第一步是登录硅基流动平台，支持多种登录方式，无需额外注册，新手也能秒上手。

操作流程：

打开浏览器，输入官方网址：https://www.siliconflow.cn/，进入平台首页；
点击页面右上角的「登录」按钮，选择适合自己的登录方式（4种可选，无需复杂验证）：
- 基础登录：手机号接收验证码 / 邮箱+密码登录；
- 快捷登录：GitHub账号 OAuth 授权 / Google账号 OAuth 授权；
登录成功后，系统自动跳转至平台首页或开发者控制台（首次登录无强制完善信息环节，直接进入下一步）。

第二步：找到API密钥管理入口

登录后，需快速定位「API密钥」管理页面，这是创建Token的核心入口，位置清晰易找。

操作流程：

登录成功后，点击页面顶部的「头像」或「我的账号」图标，进入个人中心；
在个人中心左侧导航栏，或顶部功能菜单中，找到「API密钥」选项（若首页未直接显示，可点击底部“快速获取您的模型API”按钮间接跳转）；
点击「API密钥」，进入密钥管理专属页面（首次使用时页面无已创建密钥，仅显示功能按钮）。

第三步：免费创建API Token（无需审核）

硅基流动的API Token完全免费创建，无需提交申请、无需等待审核，点击按钮即可生成。

操作流程：

在API密钥管理页面，点击中间醒目的「新建API密钥」按钮（蓝色/绿色主色调，易识别）；
可选操作：在弹出的输入框中填写备注名称（如“免费OCR调用”“测试用Token”“项目A专用”），便于后续多密钥管理；
无需填写其他信息，直接点击「确认创建」按钮，系统即时生成API Token（含Access Key和Secret Key，或合并为单个Token字符串）。

第四步：复制保存，避免丢失

结语

硅基流动的免费API Token彻底打破了AI模型调用的门槛，无论是个人开发者测试项目、学生学习实践，还是企业验证AI落地场景，都能零成本快速对接优质AI能力。平台不仅提供高速推理（语言模型10x+速度提升、生图1s出图）、高稳定性（完善监控和容错机制）等优势，还支持私有化部署、混合云部署等企业级服务。

按照本文4步流程，你已经掌握了核心获取方法——现在就动手操作，解锁语言、OCR、音视频等多模态AI服务，开启你的AI开发之旅吧！

智能助手工作台 v1.0.0 使用教程 ​

📖 一、软件简介 ​

1.1 核心功能 ​

1.2 系统要求 ​

1.3 下载安装 ​

🎤 二、语音转文字功能 ​

2.1 准备工作：获取API Token ​

2.2 操作流程 ​

单文件模式： ​

批量模式： ​

2.3 支持格式 ​

2.4 使用技巧 ​

🔊 三、文字转语音功能 ​

3.1 准备工作：获取Gitee AI Token ​

3.2 模型介绍 ​

3.3 操作步骤 ​

3.4 高级功能（IndexTTS-2） ​

🔍 四、资源搜索功能 ​

4.1 使用方法 ​

4.2 支持网站 ​

❓ 五、常见问题 ​

5.1 安装问题 ​

5.2 功能问题 ​

5.3 使用问题 ​

💡 六、使用建议 ​

初学者： ​

进阶用户： ​

生产环境： ​

📞 七、技术支持 ​

📌 附录 ​

API服务商 ​

文件格式支持 ​

【新手必备】硅基流动API Token免费获取完全指南：4步解锁AI模型调用（零门槛+图文对照） ​

第一步：访问官网，完成快速登录 ​

第二步：找到API密钥管理入口 ​

第三步：免费创建API Token（无需审核） ​

第四步：复制保存，避免丢失 ​

结语 ​

智能助手工作台 v1.0.0 使用教程

📖 一、软件简介

1.1 核心功能

1.2 系统要求

1.3 下载安装

🎤 二、语音转文字功能

2.1 准备工作：获取API Token

2.2 操作流程

单文件模式：

批量模式：

2.3 支持格式

2.4 使用技巧

🔊 三、文字转语音功能

3.1 准备工作：获取Gitee AI Token

3.2 模型介绍

3.3 操作步骤

3.4 高级功能（IndexTTS-2）

🔍 四、资源搜索功能

4.1 使用方法

4.2 支持网站

❓ 五、常见问题

5.1 安装问题

5.2 功能问题

5.3 使用问题

💡 六、使用建议

初学者：

进阶用户：

生产环境：

📞 七、技术支持

📌 附录

API服务商

文件格式支持

【新手必备】硅基流动API Token免费获取完全指南：4步解锁AI模型调用（零门槛+图文对照）

第一步：访问官网，完成快速登录

第二步：找到API密钥管理入口

第三步：免费创建API Token（无需审核）

第四步：复制保存，避免丢失

结语