R
前几篇举例子用的 PM2.5 数据来自十年前,这是因为 dapeng 手头碰巧有这么篇论文。今天偶尔发现,网上已经在公布最近国内城市的空气质量数据了,本篇就以北京和郑州两城市最近半个月的 PM2.5 数据举例子。
顺序、循环和分支是编程的三大结构。上一篇说了循环,这一篇说说分支。啥是分支?分支就是你到了一个路口,向左向右向前看,要选择到底往哪个方向走。每时每刻我们都要做出选择:渴了,是喝咖啡还是茶?见了人,是上去打招呼还是悄悄躲开?这篇帖子,是关掉还是继续读下去?其实仔细想想,岂止是编程,那三大结构简直就是整个生活的基本结构:日出日落,月圆月缺,年尾年头,这是循环;上学还是就业,单身还是结婚,丁克还是生娃,这是分支;不管是循环还是分支,都嵌入在生老病死的时间轴上,这是顺序。所谓尽人事听天命,想来就是心平气和地接受顺序结构,小心翼翼地制订循环结构,在关键时刻控制好分支结构,就这样度过一生罢。
前两天 dapeng 用 R 给师妹做了一张全国各省 PM10 浓度地图,以省会城市的 PM10 浓度值给各省涂上颜色,结果师妹说:这个用 ArcGIS 能又快又好地做出来。 dapeng 脑子里立刻涌现出多种说法要细数 R 的优势,第一条就是:若是有 20 年的数据,每年做一张图,R 菜鸟用简单一个循环就能编程搞定,ArcGIS 该怎么又快又好做出来?若不是资深用户的话,我等菜鸟恐怕得一张一张图点出来吧?这种操作费时费力并且毫无乐趣,就应该交给机器来解决,这是懒人的必备技能。本篇就来说说程序的基本结构之一:循环。
这一篇,我们试着进行线性拟合,示例所用的数据仍然是前两篇中的北京 PM2.5 质量浓度。
在上两篇中,我们都用到了 plot
命令来作图。如果说 Excel 作图的方法是先按照默认的格式画好之后再让你涂涂改改,那么 R 作图的流程更亲切:铺开一张白纸,打好格,画数据点,画坐标轴,加图例。就像用纸笔画图。不像 Excel 那样自作聪明。每一步都清清楚楚掌控在你手里。
在第 01 篇里,我们学会了用 R 进行一般的数学运算和统计计算,并且做出了两张图:拜罗伊特降水的季节变化图,北京的 PM2.5 日变化图。很好,只是,这些数据总不能一个一个敲到代码里吧。要是处理保存在其他文件里的大量数据呢?本篇就解决这个问题。
如果你和当初的 dapeng 一样是个菜鸟,对 R 有浓厚的兴趣,只是苦于入不了门,在门口纠结徘徊不忍离去,那么,这个系列的帖子就是写给你的。
情人节是上大学时我们寝室的室节,没有情人的情人节是我们寝室的室歌,因为——我们宿舍门牌号是214。昨天得知我们宿舍最年轻的小伙儿刚刚成了亲,热烈祝贺!祝天下眷属永远是彼此的小情人!话说我们寝室谈恋爱的顺序和结婚的顺序基本上是反着的:最先谈恋爱的最晚结婚。结了婚,就不能去外面找情人了,但是不找又违背了男人的本性,所以只能寄情于物,比如我的私家小情人骨感的有吉他和kindle,肉感的有博客、LATEX和R。有人说弄这些东西太费劲儿,我要说,兄弟,弄懂这些比弄懂女人还是要更容易一些的。