GitHub - tsuibin/record_recog: 录音并识别

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 52 Commits
Test		Test
bin		bin
conf		conf
database		database
designs		designs
include		include
src		src
tmp		tmp
.gitignore		.gitignore
0517-暂定UI.JPG		0517-暂定UI.JPG
KEY_TABLE		KEY_TABLE
Makefile		Makefile
README		README
TODO		TODO
bug		bug
dbus_config		dbus_config
deepin-speech.desktop		deepin-speech.desktop
key_table		key_table
ld_msc.sh		ld_msc.sh
music.JPG		music.JPG
pinyin		pinyin
speech_struct.pdf		speech_struct.pdf
环境与规则.jpg		环境与规则.jpg

Repository files navigation

2013-04-25
录音并识别。
录音使用 alsa 库，语音识别使用科大讯飞提供的接口。

运行时请设置：LD_LIBRARY_PATH
如：
	ARCH=`arch`
	MSCLIBS_PATH=./bin/$ARCH
	export LD_LIBRARY_PATH=${MSCLIBS_PATH} ：${LD_LIBRARY_PATH}

MSCLIBS_PATH : 为科大讯飞库的位置，请根据系统架构具体选择。

依赖：
gksu
xsel
espeak
#wmctrl
libwnck-3
libasound2-dev
libx11-data
libx11-dev
libxtst-dev
libxmu-dev
libdbus-1-dev
libjsoncpp-dev
libdbus-glib-1-dev

运行说明：
开启软件，按下 CTRL 键（不低于2s）输入语音。
语音朗读：先用鼠标选中文字，然后按下 ALT 键

命令说明：
index.json : 存放开启软件的命令，并设置此软件的程序名、窗口标题、配置文件和命令类型。在这个文件中匹配到输入的命令后，就会设置其参数。再次输入语音命令的话就会在此软件的配置文件中搜索。
appname.json : 存放应用的语音输入及对应的命令。
open.json : 存放开启软件的命令。
command.conf : 存放额外的命令.

程序设计思想请见：speech_struct.pdf