液压管路云平台的数据清洗及预处理方法研究开题报告
全文总字数:4725字
1. 研究目的与意义(文献综述)
1.1 研究目的及意义
随着科技的高度发展及社会的不断进步,越来越多的设备正在朝着智能化、自动化转变。在工业生产中液压系统是确保动力传动的核心部件之一。液压传动是指以液体为工作介质进行能量传递和控制的一种传动方式。在机械上采用液压传动技术,可以简化机器的结构,减轻机器质量,减少材料消耗,降低制造成本,减轻劳动强度。与传统的机械传动、电气传动相比,液压传动的各种元件可以根据需要方便、灵活地来布置,很容易实现机器的自动化。而带有云平台数据库的液压管路能监测、管理液压管路数据,提高液压管路的安全性和工作效率。
云计算平台也称为云平台,是指基于硬件资源和软件资源的服务,提供计算、网络和存储能力。云计算平台可以划分为3类:以数据存储为主的存储型云平台、以数据处理为主的计算型云平台以及计算和数据存储处理兼顾的综合云计算平台。针对液压管路状态监测的云平台需要整合、处理大量来源于分布式多参数的传感数据。低质量的数据将会导致低质量的挖掘结果,所以需要对数据进行清洗和预处理以方便后续特征提取和挖掘。
2. 研究的基本内容与方案
从上述分析可以看出,数据清洗及预处理方法有着巨大的研究价值,在未来很长一段时间仍将是研究的热点。数据清洗,指的是针对一系列给定的数据,首先检测其中存在的各类错误,包括但不限于数据重复、数据缺失、数据异常以及数据不一致等。然后,对存在问题的数据,采取一定的方式进行删除或修正,从而改善数据质量。本文通过研究数据清洗的相关方法,结合现有研究成果,设计数据清洗服务详细流程,并进行仿真实验。论文内容具体安排如下:
第一,对数据清洗做一个初步的认识与了解。首先指出研究的背景与意义,然后粗略介绍国内外的研究历史与研究现状,再简洁的概括论文的主要内容和结构安排。
第二,介绍数据清洗的关键技术。其中包括数据清洗的相关算法、相似度计算公式和所使用的平台的相关技术,为后面的设计提供理论基础。
3. 研究计划与安排
第1-3周:查阅相关文献资料,明确研究内容,了解研究所需理论基础。确定方案,完成开题报告。
第4-5周:熟悉掌握基本理论,完成英文资料的翻译。
第6-9周:编程实现数据清洗的算法设计,并进行算法的仿真分析。
4. 参考文献(12篇以上)
[1] 李志鹏. 基于spark的可定义规则数据清洗系统的设计与实现[d].电子科技大学,2019.
[2]zhouran yu, xu chu. piclean: a probabilistic and interactive data cleaning system[j]. proceedings of the 2019 international conference on management of data,2019:2021-2024.
[3] 常征,吕勇.基于正则表达式的海量数据清洗系统[j].计算机应用,2019,39(10):2942-2947.
课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。