流让你从外部迭代转向内部迭代, for 循环显示迭代不用再写了, 流内部管理对集合数据的迭代. 这种处理数据的方式很有用, 因为你让 Stream API 管理如何处理数据. 这样 Stream API 就可以在背后进行多种优化. 此外, 使用内部迭代的话, Stream API 可以决定并行运行你的代码. 这要是用外部迭代的话就办不到了, 因为你只能用单一线程挨个迭代.
1. 筛选和切片
1.1 用谓词筛选
该操作会接受一个谓词 (一个返回 boolean 的函数) 作为参数, 并返回一个包括所有符合谓词的元素的流. 筛选出所有素菜
- List<Dish> vegetarianMenu = menu.stream()
- .filter(Dish::isVegetarian)
- .collect(toList());
1.2 筛选各异的元素
返回一个元素各异 (根据流所生成元素的 hashCode 和 equals 方法实现) 的流. 筛选出列表中所有的偶数, 并确保没有重复.
- List<Integer> numbers = Arrays.asList(1, 2, 1, 3, 3, 2, 4);
- numbers.stream()
- .filter(i -> i % 2 == 0)
- .distinct()
- .forEach(System.out::println);
1.3 截短流
流支持 limit(n)方法, 该方法会返回一个不超过给定长度的流. 所需的长度作为参数传递给 limit. 如果流是有序的, 则最多会返回前 n 个元素. 选出热量超过 300 卡路里的头三道菜
- List<Dish> dishes = menu.stream()
- .filter(d -> d.getCalories()> 300)
- .limit(3)
- .collect(toList());
limit 也可以用在无序流上, 比如源是一个 Set. 这种情况下, limit 的结果不会以 任何顺序排列.
1.4 跳过元素
流还支持 skip(n)方法, 返回一个扔掉了前 n 个元素的流. 如果流中元素不足 n 个, 则返回一个空流. 跳过超过 300 卡路里的头两道菜, 并返回剩下的.
- List<Dish> dishes = menu.stream()
- .filter(d -> d.getCalories()> 300)
- .skip(2)
- .collect(toList());
2. 映射
2.1 对流中每一个元素应用函数
流支持 map 方法, 它会接受一个函数作为参数. 这个函数会被应用到每个元素上, 并将其映射成一个新的元素. 提取流中菜肴的名称:
- List<String> dishNames = menu.stream()
- .map(Dish::getName)
- .collect(toList());
2.2 流的扁平化
flatmap 方法让你把一个流中的每个值都换成另一个流, 然后把所有的流连接起来成为一个流. 单个流都被合并起来, 即扁平化为一个流. 例如, 给定单词列表 ["Hello","World"], 你想要返回列表["H","e","l", "o","W","r","d"].
- List<String> words = Arrays.asList("Java 8", "Lambdas", "In", "Action");
- List<String> uniqueCharacters = words.stream()
- .map(w -> w.split(""))
- .flatMap(Arrays::stream)
- .distinct()
- .collect(Collectors.toList());
3. 查找和匹配
3.1 检查谓词是否至少匹配一个元素
anyMatch 方法可以回答 "流中是否有一个元素能匹配给定的谓词".anyMatch 方法返回一个 boolean, 因此是一个终端操作. 比如, 你可以用它来看看菜单里面是否有素食可选择:
- if(menu.stream().anyMatch(Dish::isVegetarian)){
- System.out.println("The menu is (somewhat) vegetarian friendly!!");
- }
3.2 检查谓词是否匹配所有元素
allMatch 方法的工作原理和 anyMatch 类似, 但它会看看流中的元素是否都能匹配给定的谓词. 比如, 你可以用它来看看菜品是否有利健康(即所有菜的热量都低于 1000 卡路里):
boolean isHealthy = menu.stream().allMatch(d -> d.getCalories() <1000);
和 allMatch 相对的是 noneMatch. 它可以确保流中没有任何元素与给定的谓词匹配. 比如, 你可以用 noneMatch 重写前面的例子:
boolean isHealthy = menu.stream().noneMatch(d -> d.getCalories()>= 1000);
anyMatch,allMatch 和 noneMatch 这三个操作都用到了我们所谓的短路, 这就是大家熟悉 的 Java 中 && 和 || 运算符短路在流中的版本.
3.3 查找元素
findAny 方法将返回当前流中的任意元素. 它可以与其他流操作结合使用. 比如, 你可能想找到一道素食菜肴. 你可以结合使用 filter 和 findAny 方法来实现这个查询:
- Optional<Dish> dish =menu.stream()
- .filter(Dish::isVegetarian)
- .findAny();
Optional<T > 类 (java.util.Optional) 是一个容器类, 代表一个值存在或不存在. Optional 里面几种可以迫使你显式地检查值是否存在或处理值不存在的情形的方法也不错.
isPresent()将在 Optional 包含值的时候返回 true, 否则返回 false.
ifPresent(Consumer<T> block)会在值存在的时候执行给定的代码块.
T get()会在值存在时返回值, 否则抛出一个 NoSuchElement 异常.
T orElse(T other)会在值存在时返回值, 否则返回一个默认值.
3.4 查找第一个元素
为此有一个 findFirst 方法, 它的工作方式类似于 findany. 例如, 给定一个数字列表, 下面的代码能找出第一个平方 能被 3 整除的数:
- List<Integer> someNumbers = Arrays.asList(1, 2, 3, 4, 5);
- Optional<Integer> firstSquareDivisibleByThree = someNumbers.stream()
- .map(x -> x * x)
- .filter(x -> x % 3 == 0)
- .findFirst(); // 9
4. 归约
归约操作 (将流归约成一个值). 用函数式编程语言的术语来说, 这称为折叠 (fold), 因为你可以将这个操作看成把一张长长的纸(你的流) 反复折叠成一个小方块, 而这就是折叠操作的结果.
4.1 元素求和
reduce 操作是如何作用于一个流的: Lambda 反复结合每个元素, 直到流被归约成一个值.
reduce 接受两个参数:
一个初始值, 这里是 0;
一个 BinaryOperator<T > 来将两个元素结合起来产生一个新值, 这里我们用的是 lambda (a, b) -> a + b.
int sum = numbers.stream().reduce(0, (a, b) -> a + b);
reduce 还有一个重载的变体, 它不接受初始值, 但是会返回一个 Optional 对象:
Optional<Integer> sum = numbers.stream().reduce((a, b) -> (a + b));
4.2 最大值和最小值
使用 reduce 来计算流中的最大值
Optional<Integer> max = numbers.stream().reduce(Integer::max);
要计算最小值, 你需要把 Integer.min 传给 reduce 来替换 Integer.max:
Optional<Integer> min = numbers.stream().reduce(Integer::min);
4.3 小结
5. 实战
- public class ExecDemo {
- public static void main(String[] args) {
- Trader raoul = new Trader("Raoul", "Cambridge");
- Trader mario = new Trader("Mario","Milan");
- Trader alan = new Trader("Alan","Cambridge");
- Trader brian = new Trader("Brian","Cambridge");
- List<Transaction> transactions = Arrays.asList(
- new Transaction(brian, 2011, 300),
- new Transaction(raoul, 2012, 1000),
- new Transaction(raoul, 2011, 400),
- new Transaction(mario, 2012, 710),
- new Transaction(mario, 2012, 700),
- new Transaction(alan, 2012, 950)
- );
- System.out.println("(1) 找出 2011 年发生的所有交易, 并按交易额排序(从低到高).");
- List<Transaction> collect = transactions.stream()
- .filter(t -> t.getYear() == 2011)
- .sorted(Comparator.comparing(Transaction::getValue))
- .collect(Collectors.toList());
- System.out.println(collect);
- System.out.println("\n(2) 交易员都在哪些不同的城市工作过?");
- List<String> collect1 = transactions.stream()
- .map(transaction -> transaction.getTrader().getCity())
- .distinct()
- .collect(Collectors.toList());
- System.out.println(collect1);
- // [Cambridge, Milan]
- System.out.println("\n(3) 查找所有来自于剑桥的交易员, 并按姓名排序.");
- List<Trader> collect2 = transactions.stream()
- .map(Transaction::getTrader)
- .filter(trader -> trader.getCity().equals("Cambridge"))
- .distinct()
- .sorted(Comparator.comparing(Trader::getName))
- .collect(Collectors.toList());
- System.out.println(collect2);
- System.out.println("\n(4) 返回所有交易员的姓名字符串, 按字母顺序排序.");
- String reduce = transactions.stream()
- .map(transaction -> transaction.getTrader().getName())
- .distinct()
- .sorted()
- .reduce("", (n1, n2) -> n1 + n2);
- System.out.println(reduce);
- System.out.println("\n(5) 有没有交易员是在米兰工作的?");
- boolean b = transactions.stream()
- .anyMatch(transaction -> transaction.getTrader().getCity().equals("Milan"));
- System.out.println(b);
- System.out.println("\n(6) 打印生活在剑桥的交易员的所有交易额.");
- transactions.stream()
- .filter(transaction -> transaction.getTrader().getCity().equals("Cambridge"))
- .map(Transaction::getValue)
- .forEach(System.out::println);
- System.out.println("\n(7) 所有交易中, 最高的交易额是多少?");
- transactions.stream()
- .map(Transaction::getValue)
- .reduce(Integer::max)
- .ifPresent(System.out::println);
- System.out.println("\n(8) 找到交易额最小的交易.");
- transactions.stream()
- .map(Transaction::getValue)
- .reduce(Integer::min)
- .ifPresent(System.out::println);
- }
6. 数值流
6.1 原始类型流特化
Java 8 引入了三个原始类型特化流接口来解决这个问题: IntStream,DoubleStream 和 LongStream, 分别将流中的元素特化为 int,long 和 double, 从而避免了暗含的装箱成本.
6.1.1 映射到数值流
将流转换为特化版本的常用方法是 mapToInt,mapToDouble 和 mapToLong. 这些方法和前 面说的 map 方法的工作方式一样, 只是它们返回的是一个特化流, 而不是 Stream<T>. 例如, 你 可以像下面这样用 mapToInt 对 menu 中的卡路里求和:
- int calories = menu.stream() // 返回一个 Stream<Dish>
- .mapToInt(Dish::getCalories) // 返回一个 IntStream
- .sum();
请注意, 如果流是空的, sum 默认返回 0.IntStream 还支持其他的方便方法, 如 max,min,average 等.
6.1.2 转换回对象流
要把原始流转换成一般流(每个 int 都会装箱成一个 Integer), 可以使用 boxed 方法, 如下所示:
- IntStream intStream = menu.stream().mapToInt(Dish::getCalories); // 将 Stream 转换为数值流
- Stream<Integer> stream = intStream.boxed(); // 将数值流转换为 Stream
6.1.3 默认值 OptionalInt
对于三种原始流特化, 也分别有一个 Optional 原始类 型特化版本: OptionalInt,OptionalDouble 和 OptionalLong. 例如, 要找到 IntStream 中的最大元素, 可以调用 max 方法, 它会返回一个 OptionalInt:
OptionalInt maxCalories = menu.stream().mapToInt(Dish::getCalories).max();
6.2 数值范围
Java 8 引入了两个可以用于 IntStream 和 LongStream 的静态方法, 帮助生成这种范围: range 和 rangeClosed. 这两个方法都是第一个参数接受起始值, 第二个参数接受结束值. 但 range 是不包含结束值的, 而 rangeClosed 则包含结束值.
- IntStream evenNumbers = IntStream.range(1, 100) .filter(n -> n % 2 == 0); // 一个从 1 到 100 的偶数流 表示范围[1, 100)
- IntStream evenNumbers = IntStream.rangeClosed(1, 100) .filter(n -> n % 2 == 0); // 一个从 1 到 100 的偶数流 表示范围[1, 100]
7. 构建流
7.1 由值创建流
你可以使用静态方法 Stream.of, 通过显式值创建一个流. 它可以接受任意数量的参数. 例如, 以下代码直接使用 Stream.of 创建了一个字符串流. 然后, 你可以将字符串转换为大写, 再一个个打印出来:
- Stream<String> stream = Stream.of("Java 8", "Lambdas", "In", "Action");
- stream.map(String::toUpperCase).forEach(System.out::println);
你可以使用 empty 得到一个空流, 如下所示:
Stream<String> emptyStream = Stream.empty();
7.2 由数组创建流
你可以使用静态方法 Arrays.stream 从数组创建一个流. 它接受一个数组作为参数. 例如, 你可以将一个原始类型 int 的数组转换成一个 IntStream, 如下所示:
- int[] numbers = {
- 2, 3, 5, 7, 11, 13
- };
- int sum = Arrays.stream(numbers).sum();
7.3 由文件生成流
Java 中用于处理文件等 I/O 操作的 NIO API(非阻塞 I/O)已更新, 以便利用 Stream API. java.nio.file.Files 中的很多静态方法都会返回一个流. 例如, 一个很有用的方法是 Files.lines, 它会返回一个由指定文件中的各行构成的字符串流.
7.4 由函数生成流: 创建无限流
Stream API 提供了两个静态方法来从函数生成流: Stream.iterate 和 Stream.generate. 这两个操作可以创建所谓的无限流: 不像从固定集合创建的流那样有固定大小的流. 由 iterate 2 和 generate 产生的流会用给定的函数按需创建值, 因此可以无穷无尽地计算下去! 一般来说, 应该使用 limit(n)来对这种流加以限制, 以避免打印无穷多个值.
7.4.1 迭代
- Stream.iterate(0, n -> n + 2)
- .limit(10)
- .forEach(System.out::println);
此操作将生成一个无限流 -- 这个流没有结尾, 因为值是按需计算的, 可以永远计算下去. 我们说这个流是无界的. 正如我们前面所讨论的, 这是流和集合之间的一个关键区别. 我们使用 limit 方法来显式限制流的大小. 这里只选择了前 10 个偶数. 然后可以调用 forEach 终端操作来消费流, 并分别打印每个元素.
7.4.2 生成
与 iterate 方法类似, generate 方法也可让你按需生成一个无限流. 但 generate 不是依次 对每个新生成的值应用函数的. 它接受一个 Supplier<T > 类型的 Lambda 提供新的值. 我们先来看一个简单的用法: 这段代码将生成一个流, 其中有五个 0 到 1 之间的随机双精度数.
- Stream.generate(Math::random)
- .limit(5)
- .forEach(System.out::println);
8. 小结
这一章很长, 但是很有收获! 现在你可以更高效地处理集合了. 事实上, 流让你可以简洁地表达复杂的数据处理查询. 此外, 流可以透明地并行化. 以下是你应从本章中学到的关键概念.
Streams API 可以表达复杂的数据处理查询. 常用的流操作总结在表 5-1 中.
你可以使用 filter,distinct,skip 和 limit 对流做筛选和切片.
你可以使用 map 和 flatMap 提取或转换流中的元素.
你可以使用 findFirst 和 findAny 方法查找流中的元素. 你可以用 allMatch,noneMatch 和 anyMatch 方法让流匹配给定的谓词.
这些方法都利用了短路: 找到结果就立即停止计算; 没有必要处理整个流.
你可以利用 reduce 方法将流中所有的元素迭代合并成一个结果, 例如求和或查找最大元素.
filter 和 map 等操作是无状态的, 它们并不存储任何状态. reduce 等操作要存储状态才能计算出一个值. sorted 和 distinct 等操作也要存储状态, 因为它们需要把流中的所有元素缓存起来才能返回一个新的流. 这种操作称为有状态操作.
流有三种基本的原始类型特化: IntStream,DoubleStream 和 LongStream. 它们的操作也有相应的特化.
流不仅可以从集合创建, 也可从值, 数组, 文件以及 iterate 与 generate 等特定方法创建.
无限流是没有固定大小的流.
Tips
来源: http://www.jianshu.com/p/675384947e8b