R语言的初体验

R Training
r
Author
Published

Thursday, January 16, 2020

R语言是从起源于贝尔实验室的S统计绘图语言演变而来的。与S语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。

R的特点总结

  1. 软件本身及程序包的源代码公开;

  2. 涵盖了多种行业数据分析中几乎所有的方法;

  3. 任意一个分析步骤的结果均可被轻松保存、操作,并作为进一步分析的输入;

  4. R拥有顶尖水准的制图功能;

  5. R可运行于多种平台上,包括Windows、UNIX和Mac OS X;

  6. 可轻松地从各种类型的数据源读写数据,包括文本文件、数据库管理系统、统计软件,乃至专门的数据仓库;

  7. 每个函数都有统一格式的帮助和运行实例。

R的帮助系统

R提供了大量的帮助功能,学会如何使用这些帮助文档有助于编程。R的内置帮助系统提供了当前已安装包中所有函数的细节、参考文献以及使用示例。帮助文档可以通过以下函数进行查看。

  • help.start():打开帮助文档首页

  • help(foo)或?foo:查看函数foo的描述说明等帮助信息(如返回值)

  • help.search(‘foo’)或??foo:以foo为关键词搜索本地帮助文档

  • RSiteSearch(‘foo’):以foo为关键词搜索在线文档和邮件列表存档

  • apropos(‘foo’, mode=‘function’):列出名称中含有foo的所有可用函数,在只知道函数的部分名称时搜索可用

  • example(foo):查看函数foo的使用范例

  • data() 列出当前已加载包中所含的所有可用示例数据集

  • vignette() 列出当前已安装包中所有可用的vignette文档

  • vignette(‘foo’) 为主题foo显示指定的vignette文档

工作空间和目录

工作空间(workspace)是当前R的工作环境,存储着所有你定义的对象(向量、矩阵、函数、数据框和列表)。在一个R会话结束时,你可以将当前工作空间保存到一个镜像中,以便在下次启动R时自动载入它。当前的工作目录(working directory)是R用来读取文件和保存结果的默认目录。

用于管理工作空间和目录的部分标准命令如下:

  • getwd():查看当前工作目录

  • setwd():重新设定当前工作目录。如果需要读入一个不在当前工作目录下的文件,需要在调用语句中写明文件的完整路径。setwd()命令的路径中使用正斜杠/。R将反斜杠。即使在Windows平台上运行R,在路径中也要使用正斜杠。

  • ls():列出当前工作空间中的对象

  • rm(objectlist):删除一个或多个对象

  • options():显示或设置当前选项

  • history(#):显示最近使用的#个命令(默认值为25)

  • savehistory(‘myfile’) 保存命令历史到文件myfile.Rhistory中

  • loadhistory(‘myfile’) 载入命令历史文件myfile.Rhistory

  • save.image(‘myfile’) 保存工作空间到文件myfile.RData中

  • load(‘myfile’) 读取工作空间myfile.RData到当前会话中

  • save(objectlist, file=‘myfile’) 保存指定对象到一个文件中

  • q():结束对话退出R,并询问是否保存工作空间

R包

R提供了大量备用功能,通过可选模块的下载和安装来实现。目前有15364个称为包的用户贡献模块可从https://cran.r-project.org/web/packages下载。这些包提供了横跨各种领域、数量庞大的功能,包括分析地理数据、处理蛋白质质谱,甚至是心理测验分析的功能。

R包是R函数、数据、预编译代码以一种定义完善的格式组成的集合,具有详细的说明和示例。计算机上存储包的目录称为库(library)。.libPaths()显示库所在位置,library()则可以显示库中包。

第一次安装一个包,使用命令install.packages()即可,在括号中输入要安装的包名称,一个包仅需安装一次。update.packages()更新已安装的包。installed.packages()列出已安装的包的相关信息(如版本号、依赖关系等)。Windows下的R包是经过编译的zip文件,安装时不要解压缩。安装路径为“Pacakges>install packages from local files”,选择本地磁盘上存储zip包的文件夹。

包的安装是指从某个CRAN镜像站点下载它并将其放入库中的过程。安装好以后,必须被载入到会话中才能使用包,需要使用library()函数载入该包。在一次应用中,包只需载入一次,如果需要,我们可以自定义启动环境以自动载入会频繁使用的包。search()显示已加载并可使用的包。help(‘package_name’)输出某个包的简短描述以及包中可用的函数名称和数据集名称的列表,help()查看包中任意函数或数据集的描述,R的帮助系统包含了每个函数的一个描述(同时带有示例),每个数据集的信息也被包括其中。

R的使用

R是面向对象的,区分大小写的解释型数组编程语言。R中多数功能是由程序内置函数、用户自编函数和对对象的创建和操作所实现的。一次交互式会话期间的所有数据对象都被保存在内存中。R语句由函数和赋值构成,R使用 -> 而非 = 作为赋值符号。R也允许使用 = 为对象赋值,但是它不是标准语法,某些情况下会出现问题。R具有完备的数据存取、管理、分析和显示等功能,将数据处理和统计分析融为一体。以后我们继续学习R语言。