alibabacloud-bailian-speech-demo/samples/speech-plus/transcribe-video-and-do-translation-summarization-and-qa at master · aliyun/alibabacloud-bailian-speech-demo

History

Name		Name	Last commit message	Last commit date
parent directory ..
python		python
README.md		README.md

README.md

视频转写并进行翻译摘要和问答

本示例展示了将一个视频文件转码为opus音频文件，通过录音文件转写服务识别为文本，然后调用通义千问大模型进行翻译、内容摘要和问答的过程。

👉 适用场景

应用场景	典型用法	使用说明
音视频语音分析理解	音视频摘要与问答	对音视频文件进行语音识别，并使用大模型进行摘要总结和问答

👉 编程语言

Python

👉 参考详情

推荐模型	API详情
paraformer-v2	Paraformer录音文件识别
qwen-max	通义千问大语言模型

👉 依赖说明

本示例中，我们首先展示了如何将一个视频文件转码为OPUS格式的音频文件再上传到OSS调用。这个文件预处理的过程可以大幅减少您的存储成本和网络传输成本。同时节省的传输时间也能大大加快视频文件转写的吞吐效率。在这个过程中，我们使用了ffmpeg进行音频转码，使用了OSS作为云存储和网络分发服务。以下是具体说明：

安装ffmpeg: 请前往ffmpeg官方网站下载。
使用OSS：请前往阿里云OSS开通服务并进行必要配置。本示例下提供了一个简单的工具类ossUtil.py 用来上传文件到OSS并获得文件的分享链接。请配置您的鉴权和bucket等信息，才可以使用。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

transcribe-video-and-do-translation-summarization-and-qa

transcribe-video-and-do-translation-summarization-and-qa

README.md

视频转写并进行翻译摘要和问答

👉 适用场景

👉 编程语言

👉 参考详情

👉 依赖说明

👉 技术支持

Files

transcribe-video-and-do-translation-summarization-and-qa

Directory actions

More options

Directory actions

More options

Latest commit

History

transcribe-video-and-do-translation-summarization-and-qa

Folders and files

parent directory

README.md

视频转写并进行翻译摘要和问答

👉 适用场景

👉 编程语言

👉 参考详情

👉 依赖说明

👉 技术支持