【eBook】鲜活的数据:数据可视化指南 秦路

内容简介
在生活中,数据几乎无处不在,任我们取用。然而,同样的数据给人的感觉可能会千差万别:或冰冷枯燥,让人望而生畏、百思不解其意;或生动有趣,让人一目了然、豁然开朗。为了达到后一种效果,我们需要采用一种特别的方式来展示数据,来解释、分析和应用它。这就是数据可视化技术。Nath an Yau是这一创新领域的先锋。在本书中,他根据数据可视化的工作流程,先后介绍了如何获取数据,将数据格式化,用可视化工具(如R)生成图表,以及在图形编辑软件(如Illustrator)中修改以使图表达到最佳效果。本书介绍了数十种方法(如柱形图、饼图、折线图和散点图等),以创造性的视觉方式生动讲述了有关数据的故事。

百度网盘

链接:https://pan.baidu.com/s/1-gYBgaVJiMbGhP1D5nIMrQ 提取码:oi76

1.用数据讲故事
不只是数字
-数据是现实生活的一种映射,其中隐藏着许多故事,在那一堆堆的数字之间存在着实际的意义、真相和美学。
-新闻报道
-图表和图形并不只是将统计结果可视化,它们还对可视化展现的内容进行解释。
-艺术
-有时我们寻求的并不是分析和洞察,而是从富有情感的观点来讲述故事,鼓励读者对数据作出回应。
-娱乐
-引人注目
我们要寻求什么
-模式
-无论观察的对象是什么,变化本身可以和变化的过程一样妙趣横生。
-相互关系
-在统计学中,它通常代表的是关联性和因果关系。多个变量之间应该存在着某种联系
-有问题的数据
设计
-解释编码
-先拿到数据,然后以圆形、柱形和颜色等形式对数据进行“编码”,最后呈现给读者
-标注坐标轴
-没有标注或解释的坐标轴就只是个摆设
-确保几何上的正确性
-提供数据来源
-数据图都附有数据来源,通常都以小字体印在图表的底部。
-考虑你的受众
-多考虑数据图本身的设计意图和受众群体。

2.处理数据
收集数据
-由他人提供
-寻找数据源
--搜索引擎
--在网上找东西
-直接数据源
--尝试求助于该领域的学者
-大学资源
--数据及故事图书馆
--数据实验室
--统计数据库
-综合数据类应用
--有些网络应用提供了大型的数据文件,供人有偿或无偿下载。还有一些应用则由广大开发人员创建,通过应用编程接口(ApplicationProgrammingInterface,API)获得数据
-专题性数据
--地理社区数据
--体育
--全球
--大的国际性组织都有关于全球性的数据
--政府与政治
-自动搜集数据
-自动搜集一个网站
--(1)找出规律;
--(2)循环;
--(3)存储数据
设置数据的格式
-数据格式
--带分隔符的文本
--JavaScript对象表示法(JSON)
--只用掌握一些基础就能满足大部分需要
--很多应用、语言和函数库都支持JSON输入
--访问http://json.org阅读JSON的完整说明。
-XML(可扩展标记语言)
--XML相对比较容易用函数库来分析,例如Python里面的BeautifulSoup
-格式化工具
-GoogleRefine
-Mr.DataConverter
-Mr.People
-电子表格软件
-用代码来格式化
-数据格式的切换
-在循环中加入新的逻辑

3.选择可视化工具
开箱即用的可视化工具
-MicrosoftExcel
-Excel的方便易用让它获得了大众的欢迎,但如果你想要高质量的数据图就不要止步于此。其他工具会更适合你。
-GoogleSpreadsheets
-GoogleSpreadsheets其实就是MicrosoftExcel的云版本,两者的界面非常相似
-地址是http://docs.google.com
-ManyEyes
-IBM视觉传达实验室(IBMVisualCommunicationLab)主导的一个研究项目
-最好不要用ManyEyes来挖掘你的公司客户信息,或者销售数据
-TableauSoftware
-这些工具都非常容易使用,有些软件可能确实提供了充分的功能,但你可能需要学习大量的按钮。
编程工具
-大多数设计新颖、令人惊艳的数据图都是通过代码或绘图软件实现的,很有可能两者兼有
-Python
-Python善于处理大批量的数据,不会造成宕机。这使得该语言能够胜任繁重的计算和分析工作。
-NumPy是Python的一个数据处理的函数库,里面主要是一些矩阵的运算等
-SciPy是Python语言中用于科学研究的函数库,它是在Numpy基础上开发的。
-PHP
-PHP官方网站(http://php.net)
-SparklinePHP图形函数库(http://sparkline.org)
-Processing
-一门适合于设计师及数据艺术家的开源语言
-Processing的官方网站(http://processing.org)
-Flash和ActionScript
-如果你对网上的可交互图形感兴趣,那么Flash和ActionScript是非常好的选择。
-不过ActionScript并不好学
-HTML、JavaScript和CSS
-统计运算的R项目
-http://www.r-project.org
绘图软件
-AdobeIllustrator
-Illustrator被广泛用于印刷是因为它处理的是矢量图形,而非像素
-Inkscape
-Inkscape是AdobeIllustrator的免费且开源的替代产品
-CorelDraw
-一款只支持Windows系统的软件
地图绘制工具
-Google、Yahoo!和Microsoft地图
-通过提供的地图API来完成越多的编程事情
-Google地图API系列(http://code.google.com/apis/maps/)
-Yahoo!地图Web服务(http://code.google.com/apis/maps/index.html)
-Bing地图API(http://www.microsoft.com/maps/developers/web.aspx)
-ArcGIS
-ModestMaps
-Polymaps
-有点像JavaScript版本的ModestMaps
-Polymaps官方网站(http://polymaps.org/)
-在线工具
【eBook】鲜活的数据:数据可视化指南 秦路

4.有关时间趋势的可视化
在时间中寻求什么
-是延续性还是暂时性的时间数据
时间中的离散点
-时间数据可以分为离散时间和延续时间两种
-柱形
-数据图的目的是显示数据本身。尝试去掉所有多余的元素。
-柱形的堆叠
-圆点
-这种类型的图表通常被称为散点图(scatterplot),你也可以用它来表现非时间数据
-折线图
-它必须要表现从A点到B点间的稳定变化。
-平滑和估算

5.有关比例的可视化
在比例中寻求什么
-通常会寻求三件事情:最大值、最小值和总体分布
整体中的各个部分
-饼图
-面包圈图
-比例中的堆叠
-层级和矩形
带时间属性的比例
-堆叠的延续
-逐点详述
小结
-如果数据并不多,那么饼图可能最适合你
-有多个类别的多个数值,可以考虑堆叠柱形图,而非多个饼图

6.有关关系的可视化
在关系中寻求什么
-是因果关系还是关联关系?
关联性
-更多的圆点
-散点图不仅可以应用于时间,还可以表现两个变量之间的关系
-探索更多的变量
-气泡
-气泡的大小是根据面积来的,而不是半径、直径或者圆的周长
分布
-茎叶图(stem-and-leafplot,或者stemplot)
对照和比较
-多个分布图表

7.发现差异
在差异中寻求什么
-看到每一个变量间的差异,也希望看到所有变量间的差异。
在多个变量间比较
-要想对表格中的数据进行可视化,最直接的方法就是一次性把它们都显示出来
-热点图
-相面术
-切尔诺夫脸谱图
-星光灿烂
-平行坐标图
-利用多维量法
寻找异常值

8.有关空间关系的可视化
在空间中寻求什么
-阅读地图的方式和阅读静态图表的方式几乎是一样的
具体位置
-找到纬度和经度
-Geocoder.us(http://geocoder.us)——提供简单的界面,将地址复制并粘贴进去后会得到经纬度信息。还提供API。
-LatitudeLongitudePopup(www.gorissen.info/Pierre/maps/)——Google地图的混搭模式。在地图上点击某个位置,它就能告诉你该地的经纬度。
-Geopy(http://code.google.com/p/geopy/)——Python的地理编码工具箱。在一个工具包中囊括了多个地理编码API。
-单纯的点
-带有点的地图
-带有线的地图
-有大有小的点
--带有气泡的地图
-地区
-根据数据来着色
跨越空间和时间
-系列组图
-抓住差额
-动画
-更明显的一种可视化空间和时间变化的方式是让数据“动”起来

9.有目的地设计
让自己作好准备
-只有充分了解了自己掌握的原始材料,才有可能用数据把故事讲好。
-可视化的目的就是传播数据,所以要花时间了解什么才是你的图表的基础
让读者作好准备
视觉提示
-较暗的配色方案可能适用于较严肃的主题
-明亮的配色方案(如柠檬黄)则能让人感到更加愉快、无忧无虑
-可视化就是将数据(可以是数字、文本、类别或任何其他东西)转换为视觉元素。

结尾
数据只是对真实生活的一种表现。当我们在可视化数据时,其实是在可视化我们身边以及这个世界上正在发生些什么。我们的观察范围可以从微小的个体到广袤的宇宙。仔细研究数据,我们就能讲出大多数人从不知晓、但却渴望听到的故事。如今我们这个世界上的数据比以往任何时候都要丰富,而且人们希望了解它们背后蕴涵的信息。
思维导图
鲜活的数据:数据可视化指南.xmind
【eBook】鲜活的数据:数据可视化指南 秦路



您可以选择一种方式赞助本站

支付宝转账赞助

支付宝扫一扫赞助

微信钱包扫描赞助

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

图片 表情