如何使用Python构建TARS：Scratch的虚拟助手

小培 · 发表于 2020-8-26 17:58:28

　　今天我们将使用Python构建演示TARS。TARS可以帮助您自动执行任务，例如在YouTube中搜索视频并播放，发送电子邮件，打开网站，在Wikipedia中搜索材料并阅读它们，通知您所在国家的天气预报，问候等等。通过构建TARS，将增加您的Python知识，并学习许多有用的工具。想知道如何使用Python构建TARS，首先让我们首先创建虚拟环境并构建TARS的基本音频系统。

mkdirTARS% x8 B! P9 e) ?% e; k5 k: ]
cdTARS0 }/ O8 ?& v" |1 w R7 e$ K
virtualenvvenv

复制代码

　　要激活下面的venvrun命令

　　.venv/bin/activate

复制代码

　　什么是虚拟环境?
　　激活venv后，我们需要通过以下命令安装主库：
　　pip3installgTTSSpeechRecognitionPyAudiopygame
　　gTTS是一个Python库和CLI工具，可与GoogleTranslate的文本到语音API交互。此模块有助于将字符串文本转换为语音文本，并可以另存为.mp3
　　语音识别是家庭自动化，人工智能等多种应用中的重要功能。语音识别需要音频输入，而语音识别使检索此输入变得非常简单。无需从头开始构建脚本来访问麦克风并处理音频文件，SpeechRecognition只需几分钟即可让您启动并运行。
　　要使用SpeechRecognizer访问麦克风，您必须安装PyAudio软件包
　　Pygame是一组跨平台的Python模块，旨在编写视频游戏。它包括旨在与Python编程语言一起使用的计算机图形和声音库。
　　现在，让我们构建TARS的语音系统：

fromgttsimportgTTS; Z$ S9 n9 A3 M
importspeech_recognitionassr
& t# s7 `$ ~7 y/ M
frompygameimportmixer9 k& K; h1 C: z. O" Y
deftalk(audio):
0 i& A7 O* a, {9 y' I9 K
print(audio) h) W7 p# C) ^ N, p7 P2 B
forlineinaudio.splitlines():! O7 f# L* u2 J+ u. V5 ? n& D% ^
text_to_speech=gTTS(text=audio,lang='en-uk')+ e" I. ?. U/ h0 \. a N' Z2 y/ _
text_to_speech.save('audio.mp3')+ M- g' m% _5 S9 V
mixer.init()
/ }3 g! {& b0 y$ Q1 ~) b0 h
mixer.music.load("audio.mp3")
) f& H* R9 A, I* D* }' p5 z
mixer.music.play()

复制代码

　　我们通过音频作为使TARS说话的一种论据。例如talk程序将在splitlines()方法的帮助下循环这些行。此方法用于在线边界处分割线。检查splitlines()了解更多。然后，gTTS将处理所有这些文本转换为语音。text参数定义要读取的文本，lang定义用于读取文本的语言(IETF语言标签)。循环完成后，save()方法将结果写入文件。
　　pygame.mixer是用于加载和播放声音的模块，必须在使用之前进行初始化。
　　现在，让我们创建一个监听命令的函数：

defmyCommand():( v- T! F2 i% H4 w2 ?: E
#Initializetherecognizer
6 R) f" j& w6 s+ w4 c3 l. Z; W
r=sr.Recognizer()% B9 P, L2 C* O2 p1 K
withsr.Microphone()assource:- O, [- a9 c; z4 z' e, E+ g5 v; ]
print('TARSisReady...')$ D- h- c- ^- R, z$ `. H. \6 z9 h8 a
r.pause_threshold=1
0 n9 a$ A7 T2 S$ Z1 i9 G$ u
#waitforasecondtolettherecognizeradjustthe1 n7 A3 W$ I: R
#energythresholdbasedonthesurroundingnoiselevel# S. G* p+ l4 g" _
r.adjust_for_ambient_noise(source,duration=1)$ T9 Q% Y* ~) v c
#listensfortheuser'sinput
6 q4 {8 q: o( h7 Q; j$ D" ~ M
audio=r.listen(source)
% j8 d- X+ d+ R5 a! A Q* o
try:& Z& u. ~8 w/ }% ?6 }& u% S
command=r.recognize_google(audio).lower()( T; G S* G5 F! r
print('Yousaid:'+command+'\n') |; F% W$ c9 B. ^
#loopbacktocontinuetolistenforcommandsifunrecognizablespeechisreceived: m2 x9 J' B# Z$ v3 i
exceptsr.UnknownValueError:
. v4 M! ^1 h7 [( P: ?. H( t
print('Yourlastcommandcouldn\'tbeheard')" M( Q' c3 c* [' R C
command=myCommand();4 J8 `$ l. ~$ ~. K3 b: u
returncommand

复制代码

　　在此功能中，我们使用了SpeechRecognition库。它充当几种流行语音API的包装，因此非常灵活。其中之一-GoogleWebSpeechAPI-支持默认API密钥，该密钥硬编码到SpeechRecognition库中。这意味着您可以不用注册服务就能站起来。
　　为了能够通过语音识别使用自己的声音，您需要PyAudio软件包。像用于音频文件的Recognizer一样，我们将需要使用Microphone来获取实时语音数据。
　　您可以使用with块内Recognizer类的listen()方法捕获来自麦克风的输入。此方法将音频源作为其第一个参数，并记录来自该源的输入，直到检测到静音为止。
　　尝试在安静的地方说出您的命令，否则TARS可能会造成混淆。
　　综上所述，对于如何使用Python构建TARS：Scratch的虚拟助手的信息，相信大家已经清楚了吧。

账号		自动登录	找回密码
密码			立即注册

如何使用Python构建TARS：Scratch的虚拟助手

浏览过的版块

站长推荐 /1