统计软件 R 语言学习笔记 (7) 统计量
在描述行统计中,除了统计图表,统计量可以定量的描述数据。本章介绍常见的统计量:均值、方差、标准差、中位数、四分位数、变异系数、IQR、极差、偏度、峰度、Q-Q 图。以及分类汇总函数 aggregate 。
树的遍历算法
树的遍历常见方案:前序遍历 (preorder traversal) ,后序遍历 (postorder traversal) ,二叉树的中序遍历 (inorder traversal) ,层序遍历/广度优先遍历 (level order traversal/breadth-first traversal) 。
SQL 自学笔记(11)MySQL 数据类型
本章详细的介绍了 MySQL 中主要的数据类型,包括:整数类型、浮点类型、定点数类型、位类型、日期时间类型、文本字符串类型、枚举类型、集合类型、二进制字符串类型、JSON 类型。
树 Tree & 二叉树 Binary Tree
本章介绍了重要的数据结构:树。并详细讲解了二叉树。包括:树的定义、树的图论性质。并通过 Python 实现了树(基于链表 vs 基于数组),同时分析了时间复杂度。
统计软件 R 语言学习笔记 (6) 统计图表
本章介绍了常见的统计图表和其 R 语言实现方法:频数频率图表、条形/柱状图、列联表、饼图;直方图、箱线图、散点图。同时介绍了 R 语言绘图的范式:高级&低级绘图函数、常见参数设置、子图、保存图片的方法。
统计软件 R 语言学习笔记 (5) 统计数据类型和日期时间数据
本章介绍统计数据的计量尺度(定类、定序、定距、定比),重点介绍了一种特殊的数据类型:时间和日期。并讲解了一些常用时间日期函数:`strptime` `as.Date` ,除此之外还介绍了时间 Times 类型的两种类型 `POSIXct` 和 `POSIXlt` 。
队列 Queue
本章介绍了队列 (Queue) 数据类型,并实现了队列的抽象数据类型 (Queue ADT) 。并基于数组和链表分别实现了队列、循环队列和双端队列。由于队列的先进先出性 (FIFO) 能够实现很多应用,本章介绍了两个实际问题的应用:1. 使用队列实现杨辉三角;2. 使用栈+回溯法实现了迷宫问题的路径寻找、使用队列+洪水算法实现了迷宫问题的最短路寻找。
Linux 操作系统:重定向和通配符扩展
本章介绍了 Linux 操作系统中的重定向和通配符扩展:包括 `cat` 和 `split` 命令以及管道 `|` 的使用;有关通配符 `?, *, [abc]` 等的使用,快速查找文件内容和处理命令输入输出。
栈 Stack 和回溯法 Backtracking
本章介绍栈数据类型,包括栈的概念、如何用 Python 实现栈(数组、链表)、栈的实际使用(数据逆置、匹配问题、算数计算原理、函数调用等原理)以及回溯法的概念和使用,包括常见案例(全排列、子集问题、求和谜题以及著名的 N 皇后问题)。
统计软件 R 语言学习笔记 (4) R 语言初步:自定义函数、简单模拟与数据清洗
本章介绍 R 语言的函数定义方法,以及进行统计模拟、数据清洗的方法。`function` 关键字自定义函数;`r*` `p*` `d*` `q*` 分别进行各种分布的模拟;`sample` 函数进行简单随机抽样;数据清洗包括了缺失数据处理、按行排序、选取/删除部分数据、添加变量/特征和合并数据集操作。