书名:科研论文配图绘制指南——基于R语言
ISBN:978-7-115-63550-1
本书由人民邮电出版社发行数字版。版权所有,侵权必究。
您购买的人民邮电出版社电子书仅供您个人使用,未经授权,不得以任何方式复制和传播本书内容。
我们愿意相信读者具有这样的良知和觉悟,与我们共同保护知识产权。
如果购买者有侵权行为,我们可能对该用户实施包括但不限于关闭该帐号等维权措施,并可能追究法律责任。
著 宁海涛(@DataCharm)
责任编辑 张 涛
人民邮电出版社出版发行 北京市丰台区成寿寺路11号
邮编 100164 电子邮件 315@ptpress.com.cn
网址 http://www.ptpress.com.cn
读者服务热线:(010)81055410
反盗版热线:(010)81055315
本书是指导科研人员使用R语言绘制高质量科研论文配图的实用指南。首先,本书从科研论文配图的基础知识出发,详细介绍了绘图的规范、原则和配色技巧;其次,书中深入讲解了R语言的配置、使用以及ggplot2图形语法,为读者提供了从单变量到多变量图形绘制的全面指导;再次,本书还特别介绍了地理空间数据的可视化分析,以及如何绘制其他类型统计图形;最后,本书通过具体案例展示了科研论文配图的绘制流程。
本书实用性强、内容丰富,适合想通过R语言进行数据分析、科研论文配图绘制的不同专业的在校学生,以及对数据分析与可视化感兴趣的科研人员阅读。
在科学研究中,数据可视化是不可或缺的一环,清晰、准确、美观的图表能够帮助我们更好地呈现研究结果,揭示数据背后的规律。R语言作为一种流行的数据分析和编程语言,提供了丰富的图形绘制和数据可视化功能,使得我们能够以精确和专业的方式呈现研究结果。R语言已经成为众多科研人员绘制科研论文配图的首选。然而,市场上关于使用R语言绘制常见科研论文配图的图书相对较少,导致读者缺少可参考的资料。基于以上原因,笔者编写了本书,系统地介绍了用R语言快速绘制美观的科研论文配图的方法和技巧。
本书适合想通过R语言进行数据分析、科研论文配图绘制的不同专业的在校学生,以及对数据分析与可视化感兴趣的科研人员阅读。
全书内容共8章,主要内容如下。
第1章 介绍科研论文配图的绘制基础与配色基础。
第2章 介绍R软件和RStudio的安装,以及如何与Jupyter Notebook进行交互,并重点介绍R语言中重要绘图工具包ggplot2图形语法。
第3章 介绍科研论文中常见的单变量图形及其绘制方法。
第4章 介绍科研论文中常见的双变量图形及其绘制方法。
第5章 介绍科研论文中常见的多变量图形及其绘制方法。
第6章 介绍科研论文中常见的地理空间数据型图形及其绘制方法。
第7章 介绍科研论文中的其他类型统计图形及其绘制方法。
第8章 以一篇完整科研论文中的配图的绘制为例,详细讲解选择配图和绘制配图的方法。
本书所讲解的图形的绘制方法大部分是用R语言中的ggplot2绘图工具包,以及基于ggplot2开发的其他绘图工具包实现的,适用于目前科研论文中的多种常见配图类型。同时,本书详细地介绍了多种空间数据型图形的绘制方法,读者可将绘制方法应用到自己的实际项目中。
本书使用的R语言版本为4.2.3,主要使用的绘图工具包为tidyverse(2.0.0)、ggplot2(3.4.3)、ggpubr(0.6.0)、sf(1.0~14),主要数据读取及处理分析工具包为readr(2.1.4)、readxl(1.4.3)、dplyr(1.1.2)、tidyr(1.3.0)和stringr(1.5.0)等。作为免费开源的工具,R语言及其工具包的更新迭代很快,因此,读者可以根据实际使用情况或运行代码脚本后给出的提示更新自己的工具包。
本书提供所有绘图示例的R语言绘图源文件(.R文件)和Excel(.xlsx文件)、CSV、TXT格式的数据文件。注意:读者在运行代码脚本时,若看到提示某一个数据分析与可视化工具包不存在的信息,请根据提示安装相关的工具包。
读者可关注笔者的微信公众号(DataCharm)、哔哩哔哩账号(DataCharm)、抖音账号(DataCharm)、小红书账号(DataCharm),获取数据可视化文章。读者可通过关注微信公众号(DataCharm),在微信公众号中回复关键字“R语言科研论文配图配套资料”,获取本书的配套源代码及其他学习资料,Jupyter Notebook等文件或其他资源的获取方式,读者可参见封面上的有关说明。
注意:笔者为本书读者提供了“R语言图书学习圈(付费)”,交流的内容包括本书的讲解视频、绘图知识点答疑、绘图知识点拓展、数据可视化技巧汇总、可视化工具介绍以及更多R语言数据可视化知识点等;此外,还有本书配套的详细的Jupyter Notebook代码文件。
2023年,笔者编写的第一本书《科研论文配图绘制指南:基于Python》正式出版了。很荣幸,这本书受到了很多读者的喜欢,笔者收到的反馈也比较多,其中有很多读者反馈,有没有可能出一本其他语言的科研论文配图绘制指南?于是,本书就诞生了,你可以把它看作《科研论文配图绘制指南:基于Python》的R语言版本。但本书中添加了较多的新内容,并基于第一本书的读者反馈的问题,笔者对本书内容做出了一些修改、调整。
写书,是一个费力劳神的过程,不仅需要笔者对已了解的知识点进行表达,而且需要笔者为保证涉及的内容尽可能全面而学习新的知识点,如新的图表类型。虽然笔者有了之前写书的经验,但在面对一个全新的编程语言时,难免会遇到或大或小的问题,好在最后能够克服并坚持写作。
在本书的编写过程中,笔者认识了很多喜欢数据可视化的新朋友,感谢他们对我写作的支持和鼓励。
读书之法为循序而渐进,熟读而精思。亲爱的读者,希望本书能够成为你科研中的一份实用指南,帮助你掌握使用R语言进行科研论文配图绘制的技巧和方法,也希望你能快乐地阅读本书!
注:第6章介绍的地理空间数据型图形的绘制内容中,涉及的地图都是虚拟的,与真实地图无关,特此说明。另外,一些图中的英文是软件生成图时自带的,为了与本书使用的软件保持一致,图中英文没有翻译。
宁海涛
数据可视化(data visualization)借助于图形化手段来展现数据,以便读者对数据进行更直观和深入的观察与分析。它是一种关于数据视觉表现形式的技术研究。“一图胜千言”表现了数据可视化在信息表达中的重要性。
科研论文配图(插图)是实验数据和分析结论的可视化表达形式。科研论文配图的绘制是一种将科学与艺术相结合的工作,既能用图片的艺术感来吸引读者,又能展现实验数据和分析结论的科学性,帮助读者理解科研工作者所研究的内容。
科研论文配图作为数据可视化在科研领域的重要应用,是研究结果直观、有效的呈现方式。它不仅是读者关注的对象,还是编辑和审稿人重点关注的对象,在学术论文、研究报告、专利申请文件、科研基金申请文件等的编写方面起着举足轻重的作用。如何绘制有意义的科研论文配图,更好地呈现科研结果,是众多科研工作者需要思考的问题。本节将介绍科研论文配图的绘制规范和3条绘制原则,其中涉及科研论文配图绘制过程中容易被忽略的一些细节,以期帮助读者更好地理解科研论文配图绘制的重要性。
相比其他数据可视化呈现形式,科研论文配图的规范性是我们首要关注的。科研论文配图的规范性是指绘制的配图要符合投稿期刊的配图格式要求。不同的期刊在图名、字体、坐标轴等配图构成,以及配图颜色、配图格式等配图属性方面,都有不同的特殊要求。只有科研论文配图符合投稿期刊的配图格式要求,才能进入后续的查阅和审核环节。
根据呈现方式,科研论文配图可分为线性图、灰度图、照片彩图和综合配图4种类型。其中,线性图是主要和常用的配图类型,也是本书重点介绍的配图类型。线性图是指由包括Python、R、MATLAB等编程语言,以及Excel、SPSS、Origin(OriginLab公司出品)等集成软件在内的绝大多数数据分析工具输出的多种配图,如折线图、散点图、柱形图等。线性图是科研论文中常见的图形类型,也是一种加工费时、设置细节较多的图形类型。本书主要介绍的就是这种科研论文配图的选择和绘制方法。由于使用场景、专业性等方面的限制较大,因此灰度图、照片彩图和综合配图等则不在本书的介绍范畴内。
科研论文配图主要包括X轴(X axis,又称横轴)、Y轴(Y axis,又称纵轴)、X轴标签(X axis label)、Y轴标签(Y axis label)、主刻度(major tick)、次刻度(minor tick)和图例(legend)等基本构成,如图1-1-1所示。科研论文配图的每个构成部分都有详细的绘制要求,如坐标轴,作为科研论文配图的尺度标注,是其重要的组成部分。在对坐标轴进行设置时,我们要做到布局合理且数据表达不冗余。此外,对于配图中的标签文本的大小、是否使用斜体、是否添加图例边框、是否添加网格线等,我们都需要进行合理、有据的设置。
注:为了和绘图工具保持一致,X轴和Y轴若无特别标注,一律用大写正体。
图1-1-1 科研论文配图基本构成示意
科研论文中常见的配图可分为像素图和矢量图。其中,像素图(位图)是以单个像素为单位,通过不同像素规律组合和排列,来显示效果的图片。像素图在放大到一定程度后会失真,变得模糊。常见的像素图格式包括JPEG、PSD、PNG、TIFF,其中,JPEG是一种常用的有损压缩图片格式,JPEG格式的图片易于处理,但像素低、清晰度差、色彩损失大。矢量图是使用点、直线或多边形等基于数学方程的几何图元表示的图像。矢量图的图像文件包含独立的分离图像,可以自由、无限制地进行重新组合,其特点是放大后图像不会失真。常见的矢量图格式包括EPS、PDF、AI、SVG,其中,EPS格式的图片体积小、质量高、色彩保真度高,印刷时较为清晰,是常用的科研论文配图格式;PDF格式的图片无论放大还是缩小,清晰度都不会改变,也不会出现弧线“锯齿”化现象;AI格式是一种可以二次修改的图片格式,也是常用的配图格式,AI格式的图片体积较大,包含图片各图层的所有信息。
对于像素图,一般的SCI(Science Citation Index,科学引文索引)期刊都要求配图的分辨率大于300dpi(dpi是表示空间分辨率的计量单位,即每英寸点数)。注意,我们不能一味地追求高分辨率的像素图,因为分辨率太高,相应的配图的体积就会很大,投稿时易造成困难。
对于科研论文中每幅配图的尺寸,期刊往往不会有严格的绘制要求,但为了配图的可阅读性和论文排版的整洁性,我们需要考虑图片尺寸与图框、图中文本大小和上下文的协调性,进行合理设置,避免文章版面空间的浪费,保持排版的整体美观性。在对配图进行单、双栏排版时,不同尺寸的配图有它们各自的放置规则。一般情况下,单栏排版的配图的宽度不宜过大。在对某个含有多个子图的配图进行单栏排版时,我们应考虑将这些子图进行竖向排列。在对配图进行双栏排版(这样的配图一般含有多个子图)时,我们应先考虑每行可排列的子图数量,再考虑子图之间的对齐问题,如图例、图号等都应对齐。
有些科技期刊明确规定了科研论文配图的字体和字号,有些则无特定要求。一些中文科技期刊要求将科研论文配图中的文本对象(横、纵轴的标签,以及图例文本)的字体设置为宋体或黑体,英文科技期刊大多使用Arial、Helvetica或Times New Roman字体。值得注意的是,单篇科研论文中的所有配图的字体、字号要尽量保持一致,同一张配图中的字体必须一致。如果配图中确有需要突出的部分,则可以将它们设置为粗体或斜体形式,或者更改文字颜色。
要想让科研论文配图美观,我们需要在其版式设计、结构布局和颜色搭配方面多下功夫。在版式设计方面,配图中文字的字体要保持一致,字号不大于正文字号,行距、文字间距应与正文协调一致;在结构布局方面,配图应出现在引用文字的下方或右侧(即“先文后图”),不同尺寸的配图不要安排在同一列或同一行;在颜色搭配方面,我们应避免使用过亮或过暗的颜色,相邻的图层元素不宜采用相近的颜色,特别是在分类配图中。此外,对于彩色图,我们要使用原图,慎用灰度图。
科研论文配图在科研结果展示方面的作用明显,本小节将介绍其绘制过程中的3条原则。
科研论文配图的主要应用场景包括结构表达、体系构建、模型研究、数据预处理及分析、调查统计等,而在这些应用场景中,是否真的需要使用配图? 对于这个问题,我们要根据具体情况具体分析,如果配图可以起到对文字进行补充说明、直观展示结果、引出下文内容等作用,那么它就是必要的。
另外,科研论文中要避免出现文字较少、图表较多的情况,即无须将原始数据和中间处理过程涉及的图形全部展示在论文中,而应在具有复杂和多维数据的情况下,提高提炼数据和绘制具备总结性特点的精选配图的能力,而非简单地罗列配图。过多的配图不仅会消耗大量的绘制时间,还会给科技期刊编辑的审核工作带来难度。
为了方便读者准确理解科研论文配图的内容,我们在绘制它时应遵守易读性原则。完整、准确的标题、标签和图例等可以有效实现科研论文配图的易读性。
在科研论文配图的绘制过程中,我们需要遵守一致性原则。
● 配图所表达出的内容与上下文或者指定内容描述一致:科研论文中的配图虽然可以独立存在,但也应与上下文的内容密切相关,论文正文中介绍配图的内容应与对应配图一致。此外,论文配图中的物理量符号等应与论文正文介绍的保持一致。
● 配图数据与上下文保持一致:论文配图中的有效数字是根据实际数据或者不同测量、转换方法等最终确定的,应与上下文中对应的有效数字保持一致。
● 配图比例尺和缩放比例大小保持一致:在涉及地理空间配图的绘制时,配图中包含的比例尺等图层元素,应当在修改时保持同步变动;在修改配图的大小时,也应保持同比例缩放修改。
● 类似配图各图层元素保持一致:当论文中出现多个类似配图时,我们应当保证各配图中的文本属性(字号、字体、颜色)、符号,以及配图中各图层结构等保持一致。
配色是科研论文配图绘制过程中的重要工作。优秀的配色方案不但可以提高论文的美观度,而且可以高效表达配图内容。本节将介绍科研论文配图的配色基础,包括色彩模式、色轮配色原理、颜色主题和配色工具4个方面。
色彩模式是众多可视化设计者在设计作品时常用的工具。其实,在科研论文配图绘制过程中,我们也可以选择使用色彩模式。常见的色彩模式包括RGB色彩模式、CMYK色彩模式和HEX色彩模式。
RGB色彩模式是指通过混合红色(Red)、绿色(Green)、蓝色(Blue)3种颜色来表现各种颜色。该色彩模式利用红、绿、蓝3个颜色通道的变化,以及它们相互的叠加来得到各种颜色值,是目前使用较为广泛的色彩模式。RGB色彩模式为图片中每一个像素的R、G、B分量各分配一个强度值(取值范围为0~255),如黑色可表示为(0,0,0),白色可表示为(255,255,255)。图1-2-1利用三维坐标形式展示了RGB色彩模式,其中,图1-2-1(a)所示为RGB色彩模式的三维立方体示意图,图1-2-1(b)所示为RGB色彩模式对应立方体颜色映射效果。我们可以看出,红色、绿色、蓝色分别位于立方体在坐标轴上的3个顶点,黑色在原点处,白色位于离原点最远的顶点,黄色(Yellow)、品红色(Magenta)和青色(Cyan)分别位于立方体的其余3个顶点。距离黑色顶点越近的顶点颜色越深;距离白色顶点越近的顶点颜色越浅。
(a)RGB色彩模式的三维立方体示意图
(b)RGB色彩模型对应立方体颜色映射效果
图1-2-1 RGB色彩模式示意图
CMYK色彩模式可以看作RGB色彩模式的子集。它是一种主要用于彩色印刷的四色模式,其中,C表示青色(Cyan)、M表示品红色(Magenta)、Y表示黄色(Yellow)、K表示黑色(blacK)。与RGB色彩模式的不同之处在于,CMYK色彩模式是一种印刷色彩模式,也是一种依靠反光的色彩模式。尽管RGB色彩模式表示的颜色更多,但它们并不能够全部印刷出来。理论上,把青色、品红色、黄色结合在一起,就可以得到黑色,但是,依靠目前的工艺制造水平,三者结合后的实际结果是暗红色,因此,我们需要加入一种专门的黑墨来中和,即使用定位套版色(黑色)[Key Plate(black)],以确保输出黑色。在现阶段,大多数纸质期刊在稿件出版阶段都使用CMYK色彩模式的图片。对于网络期刊,我们应该使用RGB色彩模式,因为使用该色彩模式的图片表现效果好,色彩靓丽,更适合在网络中传播。图1-2-2所示为CMYK色彩模式示意图,其中,图1-2-2(a)所示为CMYK色彩模式三维立方体示意图,图1-2-2(b)所示为CMYK色彩模式对应立方体颜色映射效果。我们可以看出,与RGB色彩模式正好相反,在CMYK色彩模式中,黄色、品红色和青色分别位于立方体在坐标轴上的3个顶点,白色在原点处,黑色位于离原点最远的顶点上,红色、绿色和蓝色则位于其余3个顶点。
(a)CMYK色彩模式三维立方体示意图
(b)CMYK色彩模式对应立方体颜色映射效果
图1-2-2 CMYK色彩模式示意图
HEX色彩模式,又称十六进制色彩模式,它的原理和RGB色彩模式的原理类似,都是通过红、绿、蓝三原色的混合而产生各种颜色。HEX色彩模式常用于在代码中表示颜色,这一点方便我们在利用代码绘制科研论文配图的过程中更换颜色。HEX色彩模式采用6位十六进制数来表示颜色,而RGB色彩模式中的R、G、B分量则分别采用1个十进制数来表示。简单来说,HEX色彩模式就是将RGB色彩模式中的每个十进制数转换为对应的2位十六进制数来表示,并以“#”号开头,且3字节的顺序如下:字节1表示红色值(颜色类型为红色),字节2表示绿色值(颜色类型为绿色),字节3表示蓝色值(颜色类型为蓝色),1字节表示00~FF范围内的数字。需要注意的是,HEX色彩模式中的每字节必须包含2位十六进制数,对于十进制数(0~255)经过转换后得到的十六进制数只有一位的情况,我们应在这个十六进制数之前补0。例如,十进制数0转换为十六进制数后仍为0,但是,在HEX色彩模式中要将它表示为“00”。图1-2-3所示为HEX色彩模式示意图,其中,图1-2-3(a)所示为HEX色彩模式的十六进制数表示,图1-2-3(b)所示为HEX色彩模式中的颜色示例。
(a)HEX色彩模式的十六进制数表示
(b)HEX色彩模式中的颜色示例
图1-2-3 HEX色彩模式示意图
提示:对于HEX色彩模式,很多读者可能对其转码(如将RGB颜色码转换为HEX颜色码)过程比较陌生,可通过ColorPix、FastStone等屏幕取色工具直接获取颜色码,或者通过Encycolorpedia等网站直接搜索不同颜色对应的HEX颜色码。
色轮(color wheel)又称色环,一般由12种基本颜色按照圆环方式排列组成。它是一种人为规定的色彩排列方式。它不但可以帮助用户更好地研究色彩变换和色彩搭配规律,而且允许用户自行设计具有个人风格的配色方案。常见的色轮配色方案有单色配色方案(monochromatic color scheme)、互补色配色方案(complementary color scheme)、等距三角配色方案(triadic color scheme)和四角配色方案(tetradic color scheme)等。图1-2-4所示为具有12色、3轮的4种常见的色轮配色方案。
(a)单色配色方案
(b)互补色配色方案
(c)等距三角配色方案
(d)四角配色方案
图1-2-4 4种常见的色轮配色方案
单色配色方案是指将色相相同或相近的一组颜色进行组合。单色配色方案的饱和度和明暗度明显。单色配色方案比较容易上手,因为用户只需要考虑同一色相下的饱和度和明暗度变化。此外,单色配色方案还具备相同色系的协调性,在使用过程中,不会出现颜色过于鲜艳的情况,保证了所选颜色之间的平衡性。在科研论文配图的绘制过程中,单色配色方案常被用于表示有直接关系、关系较为密切或同系列的数据。需要注意的是,对于单色配色方案中颜色的选择,个数不宜过多,3~5个较为合适。图1-2-5所示为利用单色配色方案绘制的可视化配图示例。
(a)利用单色配色方案绘制的可视化配图示例1
(b)利用单色配色方案绘制的可视化配图示例2
图1-2-5 利用单色配色方案绘制的可视化配图示例
当只能选择两种颜色时,我们可参考互补色配色方案进行选择。色轮上间隔180°(相对)的两种颜色为互补色。互补色具有强烈的对比效果,因此,它可用于科研论文配图中实验组数据和对照组数据的可视化表达。图1-2-6所示为利用互补色配色方案绘制的可视化配图示例。
(a)利用互补色配色方案绘制的可视化配图示例1
(b)利用互补色配色方案绘制的可视化配图示例2
图1-2-6 利用互补色配色方案绘制的可视化配图示例
等距三角配色方案是指将色轮上彼此间隔120°的3种颜色进行组合。等距三角配色方案会让配图的颜色更加丰富,但它在科研论文配图的绘制过程中应用较少。在使用等距三角配色方案时,我们可以将其中一种颜色作为主色,将另外两种颜色作为辅色。图1-2-7所示为利用等距三角配色方案绘制的可视化配图示例。
(a)利用等距三角配色方案绘制的可视化配图示例1
(b)利用等距三角配色方案绘制的可视化配图示例2
图1-2-7 利用等距三角配色方案绘制的可视化配图示例
四角配色方案有两种,一种是图1-2-4(d)中实线表示的两对互补色组成的矩阵配色方案(matrix color scheme),另一种是图1-2-4(d)中虚线表示的方形配色方案(square color scheme)。四角配色方案的优点是能够使配图的颜色更加丰富,缺点是使用时具有很大的挑战性,容易造成色彩杂乱,很多用户很难平衡自己选择的多种颜色。在科研论文配图的颜色选择过程中,我们要尽量避免使用四角配色方案。图1-2-8所示为利用四角配色方案绘制的可视化配图示例。
(a)利用四角配色方案绘制的可视化配图示例1
(b)利用四角配色方案绘制的可视化配图示例2
图1-2-8 利用四角配色方案绘制的可视化配图示例
不同的绘图工具(如R语言中的基础绘图函数、ggplot2绘图工具包等)都有其颜色主题。颜色主题是按照一定的美学规律设计出来的,对其灵活使用可以提高插图的美观度。颜色主题对用户(尤其是初学者)友好,使用户不必将大量时间浪费在配色的选择上。用户可根据自身绘图需求选择合适的颜色主题或自定义颜色主题。一些英文期刊会有专用的一套颜色主题,用户在投稿时将插图颜色主题更改为期刊要求的颜色主题即可。
图1-2-9展示的是R语言基础颜色主题(rainbow)、ggplot2默认颜色主题以及parula(MATLAB基础色系)颜色主题的可视化效果。图1-2-10展示的是ggsci包中3种常见期刊的默认颜色主题的可视化效果。
(a)rainbow基础颜色主题
(b)ggplot2 默认颜色主题
(c)parula颜色主题
图1-2-9 R语言基础颜色主题、ggplot2默认颜色主题以及parula颜色主题的可视化效果
R语言的ggplot2包及其拓展绘图工具包涉及的颜色主题主要分为3种类型,分别为单色系、双色渐变色系和多色系。
(a)NPG期刊的默认颜色主题
(b)AAAS期刊的默认颜色主题
(c)NEJM期刊的默认颜色主题
图1-2-10 3种常见期刊的默认颜色主题的可视化效果
单色系颜色主题中颜色的色相基本相同,饱和度单调递增。它的主要维度是颜色亮度(lightness),一般情况下,较低的数值对应较亮的颜色,较高的数值对应较暗的颜色,这是因为可视化配图往往是在白色或浅色背景上绘制的;而在深色背景中,则会出现相反的情况,即更高的数值表示更亮的颜色。单色系颜色主题的次要维度是色调(hue),即较暖的颜色出现在较亮的一端,较冷的颜色则出现在较暗的一端。例如,人口密度的变化就可以使用单色系颜色主题进行表示。图1-2-11所示为部分单色系颜色主题示意图。
图1-2-11 部分单色系颜色主题示意图
双色渐变色系颜色主题主要用在有一个关键中心值(midpoint)的数值变量中,其本质是两个连续单色系颜色主题的组合,关键中心值作为中间点,一般使用白色表示,大于关键中心值的分配中间点一侧的颜色,而小于关键中心值的分配中间点另一侧的颜色。此外,我们可以通过颜色的深浅进行判断,即中心值通常被指定为浅色,距中心点越远,颜色越深。图1-2-12所示为部分双色渐变色系颜色主题示意图。
图1-2-12 部分双色渐变色系颜色主题示意图
当要表示的数据为类别型数值(类别变量)时,我们可以使用多色系颜色主题。在多色系颜色主题的使用过程中,需要给每个组分配不同的颜色。一般情况下,可尝试将颜色主题中的颜色类别设置为10种或更少,因为使用过多的颜色类别,可能造成分组混乱,导致杂乱的视觉效果。当现有的颜色类别无法表示全部数值时,可将某些数值类别叠加在一起,形成单个其他类别。图1-2-13所示为部分多色系颜色主题示意图。
图1-2-13 部分多色系颜色主题示意图
图1-2-14所示为使用ggplot2包根据tips数据集绘制的单色系、双色渐变色系和多色系可视化配图示例,具体为单色系颜色主题中的ylgnbu色系、双色渐变色系颜色主题中的spectral色系和多色系颜色主题中的set1色系。
(a)单色系可视化配图示例
(b)双色渐变色系可视化配图示例
(c)多色系可视化配图示例
图1-2-14 根据数据集绘制的单色系、双色渐变色系和多色系可视化配图示例
颜色主题在科研图形中起着重要的作用,它可以帮助读者更好地理解数据。以下是颜色主题对科研图形的几个作用。
● 强调重点:通过使用鲜明的颜色,可以将重要的数据或信息突出显示,帮助读者快速捕捉到关键内容。
● 分类和区分:通过使用不同的颜色,可以将数据分成不同的类别或组别,使读者更容易辨认和区分不同的数据集。
● 渐变和比较:通过使用渐变的颜色,可以在图形中表示数据的变化趋势或比较不同数据之间的差异。例如,使用渐变的颜色来表示不同的数值范围,从而展示数据的梯度或变化程度。
● 提供视觉引导:选择适当的颜色可以帮助读者在图形中找到特定的数据点或信息。例如,使用醒目的颜色来标记关键数据点或重要的趋势线。
● 增强可读性:使用对比明显的颜色组合可以增强图形的可读性。例如,将亮色和暗色组合在一起,以确保数据和标签清晰可见。
想要高效地给科研论文配图选择合适的配色,除使用绘图工具自带的颜色主题以外,我们还可以使用一些优秀的配色工具。通过配色工具,我们可以进行灵活的高级配色。常用的配色工具有Color Scheme Designer网站中的高级在线配色器、Adobe旗下的在线配色方案工具Adobe Color和专业在线配色方案提供网站ColorBrewer 2.0。
Color Scheme Designer网站中的高级在线配色器是一个免费的在线配色工具,主要以色环(色轮)的方式供使用者选择配色,包括单色搭配、互补色搭配、三角形搭配、矩形搭配、类似色搭配和类似色搭配互补色6种色环配色方案。Color Scheme Designer网站中的高级在线配色器界面如图1-2-15所示。
图1-2-15 Color Scheme Designer网站中的高级在线配色器界面
高级在线配色器界面包含4个区域,介绍如下。
● 黄色框区域为色环配色选择区域,有6种色环配色方案可供使用者选择。
● 红色框区域为色环显示区域,黑色箭头指向的是根据“三角形搭配”方案选择的颜色在色环中的位置。
● 蓝色框区域为配色方案ID(编号)。
● 绿色框区域为“配色预览”区域。
在高级在线配色器的左上角,选择一个配色方案,所选方案不同,色环上会出现不同数量的圆点。单击或拖动色环上的圆点,右侧“配色预览”区域将即时呈现所选配色的预览图。
在选好色环配色方案后,我们可以通过“配色方案调节”选项(见图1-2-16)进行颜色明度和饱合度的调整,还可以进行配色对比度的调整;“色彩列表”区域展示该色环配色方案对应的所有HEX颜色码。
图1-2-16 “配色方案调节”区域和“色彩列表”区域
Adobe Color是Adobe官方推出的在线配色方案工具。它提供了配色模式、图片取色、图片渐变色提取等多个工具,是一个免费的在线工具,用户无须注册或下载即可使用。这里主要介绍Adobe Color的色轮配色工具,它提供了9种智能调色模式和1种自定义模式,支持RGB、HSB、LAB色彩模式。Adobe Color的色轮配色工具界面如图1-2-17所示。
图1-2-17 Adobe Color的色轮配色工具界面
Adobe Color的色轮配色工具界面包括6个区域。
● 黄色框区域包含常用的色轮配色方案,有类别色系、单色系、三角色系、互补色系、正方形色系等。
● 红色框区域为选择色轮配色方案后对应的色轮,拖动白色箭头(图1-2-17中红色箭头指示处),可以统一调整色相和饱和度。
● 蓝色框区域为选定色轮配色方案对应的颜色,中间色块中的白色三角对应色轮中的白色箭头。
● 紫色框区域为色块对应的HEX颜色码。
● 橙色框区域为可选的色彩模式,包括RGB、HSB和LAB。
● 绿色框区域为色彩模式对应的单个维度颜色值,如R、G、B值。
在选定对应的色轮配色方案后,我们可根据它提供的HEX颜色码或R、G、B值进行图片配色的拾取,从而完成配图颜色的选择。诸如图片颜色拾取、渐变色生成等功能,读者可自行探索。图片颜色拾取功能可以帮助科研工作者获取优质科研论文配图的优秀配色,从而高质量地完成论文配图的绘制。
ColorBrewer 2.0是一个专业在线配色方案提供网站,它提供了大量的颜色主题,这些主题是众多绘图工具(如Matplotlib、ggplot2等)内置的颜色主题。ColorBrewer 2.0提供的颜色主题类型包括单色系、双色渐变色系和多色系。ColorBrewer 2.0的操作界面如图1-2-18所示。
图1-2-18 ColorBrewer 2.0的操作界面
ColorBrewer 2.0的操作界面包括下列8个模块。
① 表示可选的数据类别数。ColorBrewer 2.0最多支持12个数据类别,建议将数据类别数设置为5~8。
② 表示可选择的颜色主题。ColorBrewer 2.0提供了单色系(sequential)、双色渐变色系(diverginy)和多色系(qualitative)这3种选项。
③ 表示选定颜色主题后的配色方案的选择。在单色系中,还涉及色调的选择,可供选择的色调类型包括多色调(Multi-hue)和单色调(Single hue)。
④ 表示配色方案输出时的注意事项,即用户是否需要考虑色盲情形(colorblind safe)、是否打印友好(print friendly)等。
⑤ 表示具体搭配色系的输出模式及对应的颜色码,可选择的格式包括HEX、RGB和CMYK。
⑥ 用于控制不同配色方案的一些属性,包括道路(roads)、城市(cities)和边界(borders),用户可以用不同的颜色表示它们。
⑦ 表示背景设置区域。背景设置包括纯色(solid color)和地形(terrain)两个选项。用户还可以设置背景颜色的透明度(color transparency)。
⑧ 展示不同配色方案的预览效果。
图1-2-19展示了ColorBrewer 2.0中3种颜色主题对应的配色方案的选择和预览效果。
单色系 |
双色渐变色系 |
多色系 |
---|---|---|
图1-2-19 ColorBrewer 2.0中3种颜色主题对应的配色方案的选择和预览效果
R语言中的RColorBrewer包和Python的Matplotlib中都包含ColorBrewer 2.0的全部或大部分颜色主题,用户可以在绘制可视化作品时方便地选择颜色。在使用RColorBrewer包时,用户可直接通过设置scale_fill/color_brewer()(scale_fill_brewer()函数或scale_color_brewer()函数)度量(scale)函数中的palette参数来设置绘图的颜色主题。
本章介绍了科研论文配图的绘制基础,具体包括绘制规范、绘制原则;还介绍了科研论文配图的配色基础,包括色彩模式、色轮配色原理、颜色主题以及配色工具,目的是让读者更好地了解科研论文配图的绘制规范,重视颜色在科研论文配图绘制中的作用。