基于语音检测的视频监控探头方位控制系统设计开题报告
1. 研究目的与意义
随着社会和经济的进步,人工智能深入各个行业,视频监控系统也由原先的被动式的巡检方式发展处主动式的巡检方式,利用智能检测技术为视频监控提供方向定位,进而通过事件驱动方式控制监控探头朝向合理的方位进行有效的监控。本课题涉及语音处理技术、模型分析方法、控制系统的传感器选型和信号处理以及微电机行程控制等相关内容知识。
语音识别技术以逐步走向应用,语音识别的稳定性和健壮性问题己经逐步成为语音识别研究的焦点。具有应用价值的语音识别系统必须可以适应各种各样的噪声环境。而目前的语音识别系统性能并不能满足要求,在噪声环境下性能会大大降低,其中一个主要的原因就是语音端点检测不够准确,因此,准确、可靠、稳健的语音端点检测算法在语音识别系统中是必不可少的。
1952年等人在贝尔实验室里成功的设计出基于特定说话人的单个数字识别系统。该系统重点考虑每个输入数字的元音部分来进行语音识别。1959年fry和dense等人初步设计了能够识别个元音和个辅音的音素识别系统,同时借助模式匹配和频谱分析等技术来作出语音识别的决策。其最大的贡献是,通过英语音素序列中的统计信息来提高包含多个音素词中音素的精度。20世纪60年代初期,很多来自日本的研究者通过开发的相关硬件来进行语音识别的研究。到了20世纪60年代末期,martin等人在实验室里开发了一系列的时间归正方法,一定程度上解决了语音信号时间长度不完全相同的问题,明显地提高了语音识别的性能。而同一时期,苏联的vintsyuk计对参考语音模板和待测语音模板的无法对准问题,提出了著名的动态规划算法。这就是动态时间弯折算法的基础,也是其连接词识别算法的初级版。直到20世纪60年代末期,语音识别技术的主要精力放在了如何识别孤立词。在20世纪70年代,语音识别取得了很多令人瞩目的成就。首先在孤立词识别方面,日本学者skaoe提出了基于动态时间弯折一算法的语音识别技术,动态规划方法是一种把比较复杂的全局最优化问题转化为相对简单的局部最优化问题的非线性归正技术。实践证明了该算法在语音识别中的有效性,并在小词汇量的研究中取得了成功,从而引起了人们对语音识别的研究热潮。itakura等人定义了线性预测编码的距离测度,并将其成功的应用到语音识别研究中,取得了良好的识别效果。以ibm为首的一些公司和研究单位陆续对连续语音进行了识别研究的工作,att的贝尔实验室同时也开始了对于不同发音人的语音识别的研究。许多发达国家都为语音识别系统的实际应用开发投入了大量的人力和物力。
2. 研究内容和预期目标
研究内容:
设计一个基于语音检测的视频监控探头方位控制系统,实现监控探头在各种包括警情、求助等情况下的转向控制;该系统应包括:场景状态检定单元(包括语音强度、特定事件及探头方位等)、单片机匹配控制单元、二维度探头方向调整执行单元、lcd或者数码显示单元;完成的功能:语音信号、监控图像、探头方位等的数据采集、显示、运算处理、按需要控制输出量;电路原理图和硬件电路图设计;软件编程及功能调试。
预期目标:
3. 研究的方法与步骤
图1 语音监控的硬件系统
语音监控的硬件系统如图1 所示,当单片机启动之后,各个语音传感器开始检测,由不同传感器检测到的语音强度确定监控对象位置,同时检测语音信号的特征,微处理器经过一系列运算之后等到识别结果,识别出结果之后将结果传输到lcd/数码显示模块。当检测到特定信号时单片机就通过驱动模块来驱动步进电机到达指定位置同时控制监控探头进行拍照。
4. 参考文献
[1] 单片机原理及应用,张洪润,孙悦等著.清华大学出版社.2008
[2] 系统建模与仿真,张晓华主编. 清华大学出版社.2006
[3] 语音识别与控制应用技术,刘么和编著.科学出版社.2008
5. 计划与进度安排
(1)2022.2.25—2022.3.24 查阅资料,撰写开题报告;
(2)2022.3.25—2022.4.14 硬件功能分析,熟悉mcs-51系统指令及编程语言;
(3)2022.4.15—2022.5.5 设计电路原理图、编制应用程序;
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。