1.选题背景和意义 1.1选题背景 当今社会,随着信息技术的迅速发展,其应用正快速渗透到各行各业,导致了巨量数据的产生,随之进入了数据爆炸时代,大部分用户很难从大量数据中提取有价值信息,这也是数据科学界所面临的巨大挑战之一。数据可视化概念的提出成为了大数据界的希望,利用可视化技术将数据转化成可以展示的图形或图像将提高用户的信息读取效率,辅助用户进行管理和决策,比如金融领域的股票大盘走势图以及医学领域用于疾病诊断的PET(正电子放射断层扫描技术)。 1.2选题意义 1.2.1有利于增强人类对数据的感知 科学进步使得收集数据变得越来越容易,人们可以从互联网中获得大量的数据信息,但如何从庞大的数据源中获取有价值的数据成为普通用户在处理数据时的难题,很显然数据处理技术远远落后于数据获取技术。有研究表明人的视觉感知是最主要的信息界面,它输入了从外界获取的70%的信息,所以目前将数据可视化是向公众传播复杂信息的最有效途径。数据科学家们开始试图利用数据可视化将复杂的数据转换为人类可以用视觉感知的形式,所以这一领域在数年间得到了蓬勃发展。 人的视觉加上先进的计算机技术能够快速准确的识别有用信息,摒弃繁杂的无用信息,有时视觉能够迅速感知或忽略的信息计算机通过复杂的算法反复地循环才能够识别,这也正是在大数据时代数据可视化技术的意义所在。 1.2.2有利于处理复杂的科学问题 在互联网时代,利用数据可视化通过向用户提供可视化交互界面可以实现科学知识的传播与协同探索。通过数据的分享和传播可以聚集人类的智慧,使原本没有任何意义的数据变成知识,成为科学的进步和人类社会向前发展的动力。例如,曾经一位可视化专家与一位蛋白质结构学家共同开发一款游戏Fold.It,让人类通过视觉感受加简单的规则扭曲蛋白质来预测蛋白质结构。实验结果证明,任何算法预测蛋白质的速度都不及玩家仅凭直觉来预测蛋白质结构的速度,所以这说明了可视化在科学发展中所起到的重要作用。 1.2.3有利于推动各个与人类生活密切相关的领域的发展 我们很容易想象到,数据可视化不仅在众多高尖端科学领域扮演重要角色,而且与人类生活的各个领域都密切相关,比如:生命科学以及商业智能领域。生命科学是最早使用可视化技术的学科,计算机断层扫描技术(CT),核磁共振成像技术(NMRI)等都极大地提高了对疾病诊断的准确性,提高了疾病的治愈率。对于商业人士来说,数据之中蕴藏着极其丰富的商业价值,抓住市场变化无疑是公司的核心任务。可视化技术可以使得收集到的各种类型数据更加清晰地表示出来,有利于管理者进行决策,也有利于每一位员工提高工作效率。 |
2.国内外研究现状、发展动态 2.1数据可视化发展回顾 1987年,Visualization in Scientific Computering(科学计算可视化)作为学科名词被正式提出,成为了此后正式将可视化作为学科研究的开端,但可视化的理念和应用可以追溯到数百年之前。16世纪人类就开始用地图来记录重要的地理信息,17世纪时数据可视化就已经应用到航天、测绘、勘探等领域,19世纪出现了统计图、概念图等可视化工具,20世纪后复杂的多维数据可视化,文本及网络数据可视化以及交互可视化应运而生。在可视化技术的发展过程中分别经历了科学计算可视化、数据可视化、信息可视化和知识可视化四个阶段,但无论哪个阶段,从根本上来讲可视化的本质都是各种类型的数据。 2.2国内外研究现状 国内对数据可视化研究的起步相比于国外来说较晚,而且从国内作者在国际期刊上的发文量、引用和被引情况来看,我国数据可视化技术很大程度上是在国外相关学者研究成果的基础上发展起来的,目前我国在此领域的影响力还不足,所以迫切需要进行创新性研究。虽然很多国内的学者在可视化方面提出了自己的理论框架并推动了国内可视化技术的发展,但很多都不够完善和系统。相比而言,国外特别是欧美国家在数据可视化领域起步较早,应用广泛,从文章上分析成果显著。但是可视化还处在迅速发展的过程当中,没有成熟的理论基础和方法,各国的数据科学家对可视化的研究都各持己见,所以当前迫切需要系统的理论方法给予支撑。 |
3.研究的内容及可行性分析 3.1研究的内容 3.1.1概念及理论 1) 对与数据可视化相关的名词进行解释,如:数据可视化、可视分析、大数据及人机交互。着手课题的前提首先要弄清楚什么是数据可视化,数据可视化能够做什么,能够解决什么问题。 2) 根据数据可视化的发展历程,对其与信息可视化与科学计算可视化进行区分。可视化概念提出之际,最先产生的是科学计算可视化,简单的将大量的数据经过图形处理技术以图形图像的形式展示给用户。在可视化迅速发展的过程中随即出现了数据可视化,更深层次地将数据表达出来,挖掘背后隐藏的含义并且实现人机交互。 3) 阐述数据可视化所依托的主流理论体系。数据可视化的理论体系包括哲学方法论,基础理论以及技术论。哲学是一切科学研究的基础,它揭示了一切事物、现象的共同本质和普遍的规律。基础理论包括统计学理论、认知论、信息论、心理学理论及计算机科学理论等与数据挖掘技术、计算机图形处理技术等特殊的技术理论结合共同促进了信息可视化技术的发展。 3.1.2数据可视化的技术方法和典型应用 1) 研究数据可视化的基本技术方法即基于几何、图标、图形以及层次的可视化方法并进行比较分析。 2) 研究数据可视化热点应用,如在生命科学领域、网络与系统安全领域、商业智能领域等领域的应用。 3.1.3具体数据类型、可视化图表分类研究 1) 目前信息可视化领域的研究热点是对多维数据、时态数据、层次数据、网络数据的可视化分析,不同类型的数据需要不同的可视化图表,例如平行坐标系、散点图矩阵、星绘法、Chernoff面法主要是针对多维数据的可视化图表,焦点 上下文主要应用于层次数据的可视化,自动布局算法主要应用于网络数据可视化。 2) 图表是信息可视化最常用的展示工具,图表的准确选择能够提高信息的可读性。在此主要针对各种可视化数据图表进行分析,常见的图表包括散点图、柱状图、折线图、饼图、雷达图、K线图、箱线图、热力图等,本课题将对以上所列图表及各类型下细分的图表分析其优缺点以及适合的数据类型。 3.1.4研究Matlab及Python可视化编程工具 1) Python比较善于处理大批量的数据,该语言能够胜任繁重的计算和分析工作,还可以利用很多模块来创建数据图形,不过从美学方面来讲还不够好。 2) Matlab不但具有强大的矩阵处理能力,还提供了很多在二维、三维空间内可以可视化数据信息的函数,还可以对图形进行适当的修饰使其更美观。 3.1.5编程实现 本课题将选用特定的数据集,利用Python及JavaScript语言对其中的数据进行可视化并演示。 3.1.6总结 总结当前数据可视化所面临的挑战和发展前景。 |
4.论文拟解决的关键问题及难点 4.1论文拟解决的关键问题 1) 可视化图表的分类 2) 各种数据类型所适用的可视化方法 3) 利用可视化编程语言实现数据可视化 4.2论文的难点 1) 对多维数据、层次数据和文本数据的可视化 2) 针对特定数据集利用Python进行大数据可视化 |
5.论文进度安排 第一阶段:2017年1月-2017年2月 根据所学知识与指导老师交流,确定选题范围,查阅与收集相关资料。 第二阶段:2017年2月-2017年3月 在导师的指导下,拟定开题报告。 第三阶段:2017年3月-2017年4月 熟练掌握编程语言,熟悉各类图表。 第四阶段:2017年4月-2017年5月 尝试利用各类图表进行可视化分析,设计进行大数据可视化分析并完成 论文初稿。 第五阶段:2017年5月 继续收集整理资料,修改论文,在老师的指导下最后完成定稿。 第六阶段:2017年6月 毕业论文答辩。 |
6.主要参考文献 [1]Keim D,Qu H,Ma KL.Big-Data visualization[J].IEEE Computer Graphics and Application,2013,33(4):20-21. [2]Keim D,Konlhammer J,Eillis G,Mansmann F.Mastering the Information Age:Solving Problems with Visual Analytics[C].Goslar:Eruographic Association,2010,1-168. [3]Mackinlay J D. Opportunities for information visualization[J].IEEE Computer Graphic and Application,2000,20(1):22-23 [4]郝世博,朱学芳,朱光,李刚.国内外信息可视化研究的比较分析[J].图书情报工作,2013,57(14):105-113. [5]任磊,杜一,马帅,张小龙,戴国忠.大数据可视分析综述[J].Journal of Software,2014,25(9):1909-1936. [6]彭兰.信息是美的:大数据时代信息图表的价值及运用[M].新闻记者,2013. [7]杨彦波,刘滨,祁明月.信息可视化研究综述[N].河北科技大学学报,2014,35(1). [8]戴国忠,陈为,洪文学,刘世霞,屈华民,袁晓如,张加万,张康*.信息可视化和可视分析:挑战与机遇-北戴河信息可视化战略研讨会总结报告[C].中国科学:信息科学,2013,43(1):178-184. [9]刘堪,周晓峥,周洞汝.数据可视化的研究与发展[J].Computer Engineering,2002,28(8)61:63. [10]谭章禄,方毅芳,吕明,张长鲁.信息可视化的理论发展与框架体系构建[J].理论与探索,2013,36(1):16-32. [11]陈为,沈则潜,陶煜波,等.数据可视化[M].电子工业出版社,2013. [12]Nathan Yau(美)[著],向怡宁[译].鲜活的数据[M].人民邮电出版社,2012. [13]Igor Milovanovic(爱尔兰)[著].Python数据可视化编程实战[M].人民邮电出版社,2015. |
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。