第一章 数据结构绪论
1. 基本概念和术语
数据: 是描述客观事物的符号, 是计算机中可以操作的对象, 是能被计算机识别, 并输入给计算机处理的符号集合.
数据元素: 是组成数据的, 有一定意义的基本单位, 在计算机中通常作为整体处理. 也被称为记录.
数据项: 一个数据元素可以由若干个数据项组成, 数据项是数据不可分隔的最小单位.
数据对象: 是性质相同的数据元素的集合, 是数据的子集.
数据结构: 是相互之间存在一种或多种特定关系的数据元素的集合. 包含逻辑结构和物理结构.
2. 逻辑结构与物理结构
2.1 逻辑结构
逻辑结构: 指数据对象中数据元素之间的相互关系. 包含集合结构, 线性结构, 树形结构和图形结构几种类型.
逻辑结构思维导图
2.2 物理结构
物理结构: 数据的逻辑结构在计算机中的存储形式. 数据元素的存储结构形式有两种: 顺序存储和链式存储.
顺序存储结构: 把数据元素存放在地址连续的存储单元里, 其数据间的逻辑关系和物理关系是一致的.
链式存储结构: 把数据元素存放在任意的存储单元里 , 这组存储单元可以是连续的, 也可以是不连续的.
3. 抽象数据类型
3.1 数据类型
数据类型: 是指一组性质相同的值的集合及定义在此集合上的一些操作的总称. 数据类型包括原子类型和结构类型.
数据类型思维导图
3.2 抽象数据类型
抽象数据类型 (Abstact Data Type, ADT): 是指一个数学模型及定义在该模型上的一组操作.
第二章 算法
1 算法的定义
算法是指解决特定问题求解步骤的描述, 在计算机中表现为指令的有限序列, 并且每条指令表示一个或多个操作.
2 算法的特性
2.1 输入输出
算法具有零个或多个输入; 算法至少有一个或多个输出.
2.2 有穷性
指算法在执行有限的步骤之后, 自动结束而不会出现无限循环, 而且每一个步骤在可接受的时间内完成.
2.3 确定性
算法的每一步骤都具有确定的含义, 不会出现二义性.
2.4 可行性
算法的每一步都必须是可行的, 也就是说, 每一步都能够通过执行有限次数完成.
3 算法设计的要求
3.1 正确性
算法的正确性是指算法至少应该具有输入, 输出和加工处理无歧义性, 能正确反映问题的需求, 能够得到问题的正确答案.
"正确" 的四个层次
上述四个层次中, 第 4 条是最困难的, 一般情况下, 将层次 3 作为一个算法是否正确的标准.
3.2 可读性
算法设计的另一目的是为了便于阅读, 理解和交流.
3.3 健壮性
当输入数据不合法时, 算法也能做出相关处理, 而不是产生异常或者莫名其妙的结果.
3.4 时间效率高和存储量低
设计算法应尽量满足时间效率高和存储量低的需求.
4 算法效率的度量方法
4.1 事后统计方法
这种方法主要是通过设计好的测试程序和数据, 利用计算机计时器对不同算法编制的程序的运行时间进行比较, 从而确定算法效率的高低.
由于存在各种缺陷, 这种方法一般不予考虑.
4.2 事前分析估算方法
在计算机程序编制前, 依据统计方法对算法进行估算
计算机程序运算时间消耗的影响因素
最终, 在分析程序的运行时间时, 最重要的是把程序看成是独立于程序设计语言的算法或者一系列步骤.
5 函数的渐进增长
给定两个函数 f(n) 和 g(n), 如果存在一个整数 N, 使得对于所有的 n> N,f(n) 总是比 g(n) 大, 那么, 我们说 f(n) 的增长渐近快于 g(n) .
6 算法时间复杂度
6.1 算法时间复杂度定义
在进行算法分析时, 语句总的执行次数 T(n) 是关于问题规模 n 的函数, 进而分析 T(n) 随 n 的变化情况并确定 T(n) 的数量级. 算法是时间复杂度, 也就是算法的时间量度, 记作: T(n) = O(f(n)) . 它表示随问题规模 n 的增大, 算法执行时间的增长率和 f(n) 的增长率相同, 称作算法的渐进时间复杂度, 简称时间复杂度. 其中 f(n) 是问题规模 n 的某个函数.
6.2 推导大 O 阶方法
1. 用常数 1 取代运行时间中的所有加法常数.
2. 在修该后的运行次数函数中, 只保留最高阶项.
3. 如果最高阶项存在且不是 1, 则去除与这个项相乘的常数, 得到的结果就是大 O 阶.
常见的时间复杂度所消耗的时间从小到大依次是:
O(1) < O(logn) < O(n) < O(nlogn) < O() < O() < O() < O(n!) < O()
7 算法空间复杂度
算法的空间复杂度通过计算算法所需要的存储空间实现, 算法空间复杂度的计算公式记作: S(n) = O(f(n)), 其中, n 为问题的规模, f(n) 为语句关于 n 所占存储空间的函数.
来源: http://www.jianshu.com/p/b0efb4b2e975