技术相关
核心理念1. 将数据,数据相关绘图,数据无关绘图分离
这点可以说是ggplot2最为吸引人的一点。众所周知,数据可视化就是将大家从数据中探索的信息与图形要素对应起来的过程。
ggplot2将数据,数据到图形要素的映射,以及和数据无关的图形要素绘制分离,有点类似java的MVC框架思想。这让ggplot2的使用者能清楚分明的感受到一张数据分析图真正的组成部分,有针对性的进行开发,调整。
2. 图层式的开发逻辑
在ggplot2中,图形的绘制是一个个图层添加上去的。举个例子来说,大家首先决定探索一下身高与体重之间的关系;然后画了一个简单的散点图;然后决定最好区分性别,图中点的色彩对应于不同的性别;然后决定最好区分地区,拆成东中西三幅小图;最后决定加入回归直线,直观地看出趋势。这是一个层层推进的结构过程,在每一个推进中,都有额外的信息被加入进来。在使用ggplot2的过程中,上述的每一步都是一个图层,并能够叠加到上一步并可视化展示出来。
3. 各种图形要素的自由组合
由于ggplot2的图层式开发逻辑,大家可以自由组合各种图形要素,充分自由发挥想象力
基本开发步骤
1. 初始化 – ggplot()
这一步需要设定的是图的x轴,y轴和”美学特征”。基本形式如下:
p <- ggplot(data = , aes(x = , y = ))
这一步里,设置x轴和设置y轴很好理解。那么”美学特征”又是什么呢?
举个例子来说,下面这张散点图里,x轴表示年龄,y轴表示身高,很好理解:
但这张图除了展示年龄和身高的关系,还展示出每个样本点的体重:颜色越深表示体重越大。因此体重信息和年龄身高一样,也需要绑定到一个具体的列。这一列就是散点图中的”美学特征”。
来看看R语言绘制代码:
ggplot(heightweight, aes(x=ageYear, y=heightIn, colour=weightLb))+geom_point()
其中的colour参数就是该图的”美学特征”。
再比如,下面这张柱状图中,x轴表示日期,y轴表示权重,很好理解:
但这张图中每个日期对应了两个不同的权重并采用两个柱状来对比,那么这个划分依据也是另一个“美学特征”。
再看看绘制代码:
ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar))+geom_bar(position=”dodge”, stat=”identity”)
其中的fill参数就是该图的”美学特征”。
综上所述,图中的每个样本点除了通过它的坐标位置,还可以以其他形式展示信息,比如大小,色深,分组等。而这些新形式需要绑定的列,便叫做”美学特征”。
“美学特征”的形式和x,y轴一样是以列的形式给出,且列中元素个数和x,y轴列必然相等。它的设置也和x,y轴一样在ggplot()函数的aes参数括号内进行。
2. 绘制图层 – geom_bar()/geom_line()等等
上一步的主要工作是为数据可视化配置好了数据,接下来便可根据业务的需要来绘制不同的图,如折线图/柱状图/散点图等等。具体的实现方法在后面的章节中会细致讲解,这里重点提一下绘图函数里的stat参数。这个参数是对冲突样本点做统计,该参数默认为identity,表示保留样本点原(y)值,还可以是sum,表示对出现在这点的(y)值进行求和等等。
3. 调整数据相关图形元素 – scale系列函数、某些专有函数
在ggplot2中,scale标尺机制专门负责完成数据到图像元素的映射。也许你会问,”美学特征”不是已经定义好了这个映射吗?然而事实是”美学特征”只是选定了映射前的数据,并没有说明具体映射到什么图形元素。
举个例子,假如某张表记录了不同种类水池的长,宽,深信息。现在需要绘制不同种类下水池长和宽关系的柱状图,那么初始化完成的是这个映射:
而scale函数完成的是这个映射:
显然a映射为了红色,b映射为了蓝色。
也许你还会问,偶的代码不用scale,那么映射是如何完成的呢?答曰系统有默认映射的,就像绘图函数都有默认参数stat=identity这样。
4. 调整数据无关图形元素 – theme()、某些专有函数
这部分包括设置图片标题格式,文字字体这类和数据本身无关的图像元素。只需调用theme()函数或者某些专有函数(如annovate函数可为图片添加注释)便可实现。
一个图层绘制好后便可观察调整,然后开始下一个图层的制作,直到整幅图绘制完毕。
R语言可视化成品图
说到工具,顺带提一下BI工具—FineBIFineBI是为大数据量提供数据处理、ETL、Dashboard报表展示、动态分析、报表管理的可视化分析工具。优势是:
前端可视化简单操作(小试牛刀):1.新建分析新建分析包括两种类型的分析:普通即时分析和实时报表。普通即时分析:是指普通的分析模板,从cube中获取数据,进行数据分析;实时报表:是指做出来的即时分析模板,可以对数据进行实时查看,保证数据的准确性报表创建完成之后,页面进入数据分析设计界面,选择组件布局为自由布局,如下图:添加组件制作汇总表制作图表组件布局:自适应布局&自由布局自适应布局,自动调节布局自由布局,自由选择布局上传视频时找不到文件?
答案是很简单的,就是这种格式编码PR不支持,所以文件被选择器过滤了,软件设计的时候就有两个选项,一个是支持格式还有一个是所有文件。就算你找到文件也会导不进去的。解决办法就是转个格式比如mp4等。至于深层原因其实打个比方,一个新的屠宰场想处理一大堆骨头肉的时候,却发现没有剔骨刀。
所有的视频文件是有其统一的文件封装格式的,就如mp4,mkv,m4v,mov等,在封装格式里面又有固定的几种编码方式,编码方式就如,一段密码,解码工具假如是新华字典,根据这个字典可以把密码还原,那么编码格式也需要对应的解码工具。
而PR支持的解码方式恰好只有那么几种,所以一部分视频素材就需要转个格式来告诉PR你应该这样把偶搬到你的固定区域里面去。软件剪辑过程其实有一个过程是这样的,你导入素材,软件就开始对这段素材在后排默默搬运,且进行预处理和生成小格式。这样你开始剪辑的时候也就可以比较流畅的。其实在所有的电脑里面,不管你什么格式只是不同的数据结构表现形式罢了,你不能用它,并不是你不认识它,而是电脑或者处理软件不认识它罢了。
比如简单一个例子,html文件,偶可以用浏览器打开,也可以用记事本打开,而呈现的结果却是很不一样的。
如何将图片转换成html?
1、首先,在ps中打开一张要处理的图片。
2、然后,在左侧的工具栏中点击切片工具。
3、接着,用切片工具把图片分成4份。
4、之后,再依次点击左上角的文件——存储为web所用格式。
5、在弹出的窗口中点击存储的按钮。
6、最后,弹出的保存窗口中把格式选择为html图像,再点击保存按钮即可。
有哪些冷知识比较有趣?
1、你可以只用手知道一个角度的度数。
尽可能张开你的手指,把手掌放在你要测量的角度的表面上。小指应位于底部,代表0°。拇指与小指的夹角为90°,小指与其他手指的夹角分别为30°、45°和60°。2、在你的一生中,你会遇到16个杀人犯,你甚至都不知道。3、每当你洗牌的时候,你是历史上第一个有这个特定顺序的牌的人。你知道吗,每当你洗牌时,你很有可能创造历史?一副52张牌可以在52个订购!= 52 x 51 x 50 x … x 2 x 1种方式。这是因为有52种方式选择第一张牌,51种方式选择第二种,50种方式选择第三种,但是52!是一个非常大的数字:大于8×10 的67次方。因此,很有可能通过随机洗牌实现的任何给定配置在洗牌历史中从未出现过!4、你可以使用指关节找出每个月的天数。握紧拳头,开始数节指关节。每个关节凸点和间隙是单独的月份。开始数一方面,然后,在达到结尾后,再次用食指的指节开始。如果月份在关节凹凸处,则有31天,如果在差距上,则该月份包含30天或更少。5、一个43厘米的比萨比两个30厘米的比萨饼大。6、人体唾液含有一种叫做opiorphin的天然止痛药,比吗啡有效6倍。此外,opiorphin可以同时具有抗恐慌和抗抑郁作用。所以没事在家多接接吻吧。7、有大家的大脑无法想象的颜色,。它们由在人眼中相互补偿的色调组成,例如红绿或黄蓝。如果有人要你想象黄蓝色,你会想到绿色,而事实上,同时存在黄色和蓝色的颜色,但大家无法想象它。8、现在在大家肺部的氧原子,大家肌肉中的碳,骨骼中的钙和血液中的铁诞生于恒星内部,并在宇宙爆炸时散落在宇宙周围。这意味着大家所有人都是部分外星人,并且是由 星尘组成的。9、当你60岁的时候,你会失去一半的味蕾和分辨甜、咸、酸、苦的产品的能力。你天生就有9000个味蕾,与你的嗅觉一起工作,因为你的味觉主要依赖于气味。随着年龄的增长,你的嗅觉和口感也随之改变。在40到50岁之间,味蕾的数量减少,其余的开始萎缩。60岁以后,你可能开始失去辨别甜味、咸味、酸味和苦味食物味道的能力。嗅觉直到70岁后才开始消退;其下降加剧了受影响人口味的损失。这些变化的确切原因有待辩论。然而,味道和气味随着年龄下降的实际原因可能不如它对你和你的营养平衡所产生的影响那么重要。10、当你睡着的时候,你就感觉不到任何气味。虽然声音会破坏睡眠,但气味不能。根据布朗大学的一项新研究,人们不能依靠嗅觉来唤醒他们火灾的危险。11、在怀孕期间,如果一个妇女损坏了她的内脏,婴儿会将其干细胞送到受损部位加速愈合过程。12、每天,大家的心脏产生足够的能量进行30km的卡车旅行,而大脑产生足够的能量来点亮一个10瓦的灯泡。13、大多数人都不知道街灯实际上比看上去大得多,而且路面上的线条比看上去的要厚得多。有一种解释称为尺寸知觉现象。14、每一年,身体中98%的原子每年都会被替换掉。在20世纪50年代的研究人员通过喂养他们的对象放射性原子来发现这一发现。研究人员使用辐射探测器观察到原子在整个身体上移动。他们发现新的原子取代了旧的原子,最终进入了人体的所有组织。15、氧是人们生活所必需的,但它可以氧化了的细胞是什么导致衰老。16、坐在你左边最靠近你的人是你右边最远的人。17、你的年龄就是你在太阳周围制作的圈子数量。18、平均云重约500吨(100头大象),而风暴云的重量与200000头大象相同。科学家们能够通过知道它的大小和它所含的水的数量来“衡量”一朵云。19、1991年,社会学家斯科特·费尔德(Scott Feld)计算了一个人拥有的朋友的平均数量,并将其与该人朋友的朋友人数进行了比较。第二个数字总是比第一个数字大,这意味着你的朋友总是比你拥有更多的朋友。这是友谊悖论的来源。你知道像这样有趣的冷知识吗?请在下面的评论栏分享给大家!如果喜欢大家的文章,记得点关注哟。