数据可视化-formattable包
在存储原始数据的同时将输出结果用格式化输出,使数据在保留原有属性的基础上更加易读
加载包
这个包的功能很简单,但是却很具创意性,它颠覆了 R 语言数据以及数据表的呈现方式,数据方面提供了百分数、会计技术等多个 R 尚未支持的数据格式;数据表方面支持自定义视觉化元素,如对某一列数据进行字号、颜色、背景、以及图形化处理,整体的版式仍然保留表格的样式,但是已经具有了表和图结合的意味。
首先加载所需的程序包:
|
|
格式化数据
该包提供了几个典型的可格式化对象,它们包括:percent
, comma
, currency
, accounting
和 scientific
。这些对象实质上是具有预定义格式规则和参数的数值型向量。
percent
|
|
参数列表: x:数值型向量 digits:一个整数,用于指示百分比字符串的位数 format:格式类型,传递给formatC
|
|
comma
|
|
参数列表: x:数值型向量 digits:一个整数,用于指示百分比字符串的位数 format:格式类型,传递给formatC
|
|
currency
|
|
参数列表: x:数值型向量 symbol:货币符号 digits:一个整数,用于指示百分比字符串的位数 format:格式类型,传递给formatC big.mark:千分隔符 sep:符号和值之间的分隔符
|
|
accounting
|
|
参数列表: x:数值型向量 digits:一个整数,用于指示小数位数 format:格式类型,传递给formatC big.mark:千分隔符
|
|
scientific
|
|
参数列表: x:数值型向量 digits:一个整数,用于指示小数位数 format:格式类型,传递给formatC
|
|
复杂数据结构
formattable()
将高度可定制的格式应用于各种类的对象,如 numeric
, logical
, factor
, Date
, data.frame
等。例如,数据框可能也可存储格式化的列向量(这是自然地,因为数据框就是由若干个等长的向量组成的):
|
|
格式化数据表
举个栗子
普通的表格数据如下所示:
|
|
格式化表格,具有以下可视化效果:
|
|
表格中使用的图标集由GLYPHICONS.com提供并包含在Bootstrap中。
注意到一共用了 文字格式自定义、文字背景自定义、文本自定义
三种自定义可视化类型:
color_tile函数用于输出按照数值量级进行颜色背景填充的列。
formatter函数提供字体显示格式的自定义,grade列自定义了值为A的记录显示绿色,并将字体加粗,否则忽略。 test1_score, test2_score两列通过area函数在对应字体背景位置使用条形图来代表指标量级大小,颜色填充粉色。 final_score列对指标按照top3显示绿色,其余显示灰色,同时将内容显示格式自定义为浮点型+(rank:名次)进行显示。 registered列则在对填充颜色按照对应布尔值进行显示(TRUE显示绿色、FALSE显示红色)之外,在左侧添加了对用的icon文本(TRUE显示绿色对号,FALSE显示红色叉号)。
文字格式自定义
color_text
|
|
formatter
|
|
参数列表: .tag:HTML 标签,默认为 span style:CSS语句 注:类似 x ~ expr 的公式将表现得像 function(x) expr
诸多CSS样式于此可见:List of CSS properties
文字背景自定义
色块函数
|
|
area
|
|
参数列表: row/col:选取的行与列,默认为全选
文本自定义
icontext
|
|
参数列表: icon:图标名称的字符矢量或字符矢量列表 text:文本的字符向量
使用的图标集由GLYPHICONS.com提供并包含在Bootstrap中。
致谢
参考文章