码,就可以很方便地写出高性能的并发程序。所以说,Java 8 中首次出现的 java.util.stream 是一个函数式语言+多核时代综合影响的产物。
2、什么是流
Stream 不是集合元素,它不是数据结构并不保存数据,它是有关算法和计算的,它更像一个高级版本的 Iterator。原始版本的 Iterator,用户只能显式地一个一个遍历元素并对其执行某些操作;高级版本的 Stream,用户只要给出需要对其包含的元素执行什么操作,比如 “过滤掉长度大于 10 的字符串”、“获取每个字符串的首字母”等,Stream 会隐式地在内部进行遍历,做出相应的数据转换。 Stream 就如同一个迭代器(Iterator),单向,不可往复,数据只能遍历一次,遍历过一次后即用尽了,就好比流水从面前流过,一去不复返。
而和迭代器又不同的是,Stream 可以并行化操作,迭代器只能命令式地、串行化操作。顾名思义,当使用串行方式去遍历时,每个 item 读完后再读下一个 item。而使用并行去遍历时,数据会被分成多个段,其中每一个都在不同的线程中处理,然后将结果一起输出。Stream 的并行操作依赖于 Java7 中引入的 Fork/Join 框架(JSR166y)来拆分任务和加速处理过程。Java 的并行 API 演变历程基本如下:
? 1.0-1.4 中的 java.lang.Thread ? 5.0 中的 java.util.concurrent ? 6.0 中的 Phasers 等 ? 7.0 中的 Fork/Join 框架 ? 8.0 中的 Lambda
Stream 的另外一大特点是,数据源本身可以是无限的。
3、流的构成
当我们使用一个流的时候,通常包括三个基本步骤:
获取一个数据源(source)→ 数据转换→执行操作获取想要的结果,每次转换原有 Stream 对象不改变,返回一个新的 Stream 对象(可以有多次转换),这就允许对其操作可以像链条一样排列,变成一个管道,如下图所示。
图 1. 流管道 (Stream Pipeline) 的构成
流的操作类型分为两种:
? Intermediate:一个流可以后面跟随零个或多个 intermediate 操作。其目的主要是打开流,做出某种程度的数据映射/过滤,然后返回一个新的流,交给下一个操作使用。这类操作都是惰性化的(lazy),就是说,仅仅调用到这类方法,并没有真正开始流的遍历。
? Terminal:一个流只能有一个 terminal 操作,当这个操作执行后,流就被使用“光”了,无法再被操作。所以这必定是流的最后一个操作。Terminal 操作的执行,才会真正开始流的遍历,并且会生成一个结果,或者一个 side effect。
关键:在对于一个 Stream 进行多次转换操作 (Intermediate 操作),每次都对 Stream 的每个元素进行转换,而且是执行多次,这样时间复杂度就是 N(转换次数)个 for 循环里把所有操作都做掉的总和吗?其实不是这样的,转换操作都是 lazy 的,多个转换操作只会在 Terminal 操作的时候融合起来,一次循环完成。我们可以这样简单的理解,Stream 里有个操作函数的集合,每次转换操作就是把转换函数放入这个集合中,在 Terminal 操作的时候循环 Stream 对应的集合,然后对每个元素执行所有的函数。
4、常见方法
? Intermediate:map (mapToInt, flatMap 等)、 filter、 distinct、 sorted、 peek、 limit、 skip、 parallel、 sequential、 unordered
? Terminal:forEach、 forEachOrdered、 toArray、 reduce、 collect、 min、 max、 count、 anyMatch、 allMatch、 noneMatch、 findFirst、 findAny、 iterator
1)map/flatMap
我们先来看 map。如果你熟悉 scala 这类函数式语言,对这个方法应该很了解,它的作用就是把 input Stream 的每一个元素,映射成 output Stream 的另外一个元素。 清单 1. 转换大写 List> inputStream = Stream.of( Arrays.asList(1), Arrays.asList(2, 3), Arrays.asList(4, 5, 6) ); Stream
filter 对原始 Stream 进行某项测试,通过测试的元素被留下来生成一个新 Stream。 清单 1. 留下偶数 Integer[] sixNums = {1, 2, 3, 4, 5, 6}; Integer[] evens = Stream.of(sixNums).filter(n -> n%2 == 0).toArray(Integer[]::new); 经过条件“被 2 整除”的 filter,剩下的数字为 {2, 4, 6}。 清单 2. 把单词挑出来 List
forEach 方法接收一个 Lambda 表达式,然后在 Stream 的每一个元素上执行该表达式。 清单 1. 打印姓名(forEach 和 pre-java8 的对比) // Java 8 roster.stream() .filter(p -> p.getGender() == Person.Sex.MALE) .forEach(p -> System.out.println(p.getName())); // Pre-Java 8 for (Person p : roster) { if (p.getGender() == Person.Sex.MALE) { System.out.println(p.getName()); } } 对一个人员集合遍历,找出男性并打印姓名。可以看出来,forEach 是为 Lambda 而设计的,保持了最紧凑的风格。而且 Lambda 表达式本身是可以重用的,非常方便。当需要为多核系统优化时,可以 parallelStream().forEach(),只是此时原有元素的次序没法保证,并行的情况下将改变串行时操作的行为,此时 forEach 本身的实现不需要调整,而 Java8 以前的 for 循环 code 可能需要加入额外的多线程逻辑。 但一般认为,forEach 和常规 for 循环的差异不涉及到性能,它们仅仅是函数式风格与传统 Java 风格的差别。 另外一点需要注意,forEach 是 terminal 操作,因此它执行后,Stream 的元素就被“消费”掉了,你无法对一个 Stream 进行两次 terminal 运算。下面的代码是错误的: stream.forEach(element -> doOneThing(element)); stream.forEach(element -> doAnotherThing(element)); 相反,具有相似功能的 intermediate 操作 peek 可以达到上述目的。如下是出现在该 api javadoc 上的一个示例。 清单 2. peek对每个元素执行操作并返回一个新的 Stream Stream.of(\ .filter(e -> e.length() > 3) .peek(e -> System.out.println(\ .map(String::toUpperCase) .peek(e -> System.out.println(\ .collect(Collectors.toList()); forEach 不能修改自己包含的本地变量值,也不能用 break/return 之类的关键字提前结束循环。 4)findFirst
这是一个 termimal 兼 short-circuiting 操作,它总是返回 Stream 的第一个元素,或者空。
这里比较重点的是它的返回值类型:Optional。这也是一个模仿 Scala 语言中的概念,作为一个容器,它可能含有某值,或者不包含。使用它的目的是尽可能避免 NullPointerException。
清单 1. Optional的两个用例
λ表达式本质上是一个匿名方法,它可以自动实现接口中的唯一方法,这个接口一般用@FunctionalInterface标注出来(也可以不标),java8引入lambda表达式和stream可以实现函数式编程。
实现函数式接口的例子有Runnable,Callable,Comparable,java8中新加入了Function,Predicate,Consumer,Supplier。 函数式编程的核心 ?
声明式的代码风格(Declarative Style) : 这需要提高代码的抽象层次,比如在前面的例子中,将从集合中搜索一个元素的操作封装到contains方法中。
?
更多的不变性(Promote Immutability) : 能不声明变量就不要声明,需要变量时尽量使用final来修饰。因为变量越多,就意味着程序越难以并行。实现了不变性的方法意味着它不再有副作用,不会因为调用而改变程序的状态。
?
使用表达式来代替语句(Prefer Expression to Statement) : 使用语句也就意味着不变性的破坏和程序状态的改变,比如赋值语句的使用。
?
使用高阶函数(High-Order Function) : 在Java 8以前,重用是建立在对象和类型系统之上。而Java 8中则将重用的概念更进一步,使用函数也能够实现代码的重用。所谓高阶函数,不要被其名字唬住了,实际上很简单:
o o o
将函数作为参数传入到另外一个函数中 函数的返回值可以是函数类型 在函数中创建另一个函数
函数式编程例子1: prices.stream()
.filter(price -> price.compareTo(BigDecimal.valueOf(20))>0) .map(price -> price.multiply(BigDecimal.valueOf(0.9))) .reduce(BigDecimal.ZERO, BigDecimal::add);
一、lambda表达式
1.自定义函数式接口(也可以直接使用java8自带函数式接口)
@FunctionalInterface
public interface LambdaInterface { int add(int i, int j); }
2、将函数式接口作为参数的方法和类
public class LambdaUse{ private Integer age; private String name;
public String getName() { return name; }
public void setName(String name) { this.name = name; }
public Integer getAge() { return age; }
public void setAge(Integer age) {
this.age = age; }
public LambdaUse(int age, String name) { this.age = age; this.name = name; }
public LambdaUse() { }
public int getAdd(LambdaInterface lambdaInterface) { return lambdaInterface.add(5, 6); } }
3.测试
public class TestClass { @Test
public void lambdaTest() {
LambdaUse lambdaUse = new LambdaUse();
System.out.println(lambdaUse.getAdd((i, j) -> {return i + j;})); } @Test
public void foreachTest() {
String[] atp = {\, \, \, \,\,
\,\, \}; List a = Arrays.asList(atp);
a.forEach(pp -> System.out.println(pp)); } @Test
public void sortTest() {
// Collections.sort(a, Comparator.comparing(pp->pp)); // a.sort(Comparator.comparing(pp->pp));
// List b = a.stream().sorted((p1,p2) -> p2.compareTo(p1)).collect(Collectors.toList()); // b.forEach(pp->{System.out.println(pp);}); List b = new ArrayList(); b.add(new LambdaUse(14,\)); b.add(new LambdaUse(10,\)); b.add(new LambdaUse(15,\)); b.add(new LambdaUse(14,\)); b.add(new LambdaUse(19,\)); b.add(new LambdaUse(11,\)); b.add(new LambdaUse(13,\)); b.add(new LambdaUse(17,\)); b.add(new LambdaUse(16,\));
Comparator cc = Comparator.comparing((s) -> s.getAge()); Comparator dd = cc.reversed().thenComparing(s->s.getName()); b.sort(dd);
b.forEach(one -> System.out.println(one.getAge() + \+ one.getName())); } @Test
public void sortTest1() { List b = new ArrayList(); b.add(new LambdaUse(14,\)); b.add(new LambdaUse(10,\)); b.add(new LambdaUse(15,\)); b.add(new LambdaUse(14,\)); b.add(new LambdaUse(19,\)); b.add(new LambdaUse(11,\)); b.add(new LambdaUse(13,\)); b.add(new LambdaUse(17,\)); b.add(new LambdaUse(16,\));
List c = b.stream().sorted((i,j) -> j.getAge().compareTo(i.getAge())).sorted((i,j) -> i.getName().compareTo(j.getName())).collect(Collectors.toList()); c.forEach(one -> System.out.println(one.getAge() + \+ one.getName())); }
二、stream
1.介绍
Stream 作为 Java 8 的一大亮点,它与 java.io 包里的 InputStream 和 OutputStream 是完全不同的概念。它也不同于 StAX 对 XML 解析的 Stream,也不是 Amazon Kinesis 对大数据实时处理的 Stream。Java 8 中的 Stream 是对集合(Collection)对象功能的增强,它专注于对集合对象进行各种非常便利、高效的聚合操作(aggregate operation),或者大批量数据操作 (bulk data operation)。Stream API 借助于同样新出现的 Lambda 表达式,极大的提高编程效率和程序可读性。同时它提供串行和并行两种模式进行汇聚操作,并发模式能够充分利用多核处理器的优势,使用 fork/join 并行方式来拆分任务和加速处理过程。通常编写并行代码很难而且容易出错, 但使用 Stream API 无需编写一行多线程的代
String strA = \print(strA); print(\print(strB); getLength(strA); getLength(\getLength(strB); public static void print(String text) { // Java 8 Optional.ofNullable(text).ifPresent(System.out::println); // Pre-Java 8 if (text != null) { System.out.println(text); } } public static int getLength(String text) { // Java 8 return Optional.ofNullable(text).map(String::length).orElse(-1); // Pre-Java 8 // return if (text != null) ? text.length() : -1; }; 在更复杂的 if (xx != null) 的情况中,使用 Optional 代码的可读性更好,而且它提供的是编译时检查,能极大的降低 NPE 这种 Runtime Exception 对程序的影响,或者迫使程序员更早的在编码阶段处理空值问题,而不是留到运行时再发现和调试。 Stream 中的 findAny、max/min、reduce 等方法等返回 Optional 值。还有例如 IntStream.average() 返回 OptionalDouble 等等。 5)reduce
这个方法的主要作用是把 Stream 元素组合起来。它提供一个起始值(种子),然后依照运算规则(BinaryOperator),和前面 Stream 的第一个、第二个、第 n 个元素组合。从这个意义上说,字符串拼接、数值的 sum、min、max、average 都是特殊的 reduce。例如 Stream 的 sum 就相当于
Integer sum = integers.reduce(0, (a, b) -> a+b); 或 Integer sum = integers.reduce(0, Integer::sum);
也有没有起始值的情况,这时会把 Stream 的前面两个元素组合起来,返回的是 Optional。 清单 1. reduce 的用例 // 字符串连接,concat = \String concat = Stream.of(\// 求最小值,minValue = -3.0 double minValue = Stream.of(-1.5, 1.0, -3.0, -2.0).reduce(Double.MAX_VALUE, Double::min); // 求和,sumValue = 10, 有起始值 int sumValue = Stream.of(1, 2, 3, 4).reduce(0, Integer::sum); // 求和,sumValue = 10, 无起始值 sumValue = Stream.of(1, 2, 3, 4).reduce(Integer::sum).get(); // 过滤,字符串连接,concat = \concat = Stream.of(\ filter(x -> x.compareTo(\上面代码例如第一个示例的 reduce(),第一个参数(空白字符)即为起始值,第二个参数(String::concat)为 BinaryOperator。这类有起始值的 reduce() 都返回具体的对象。而对于第四个示例没有起始值的 reduce(),由于可能没有足够的元素,返回的是 Optional,请留意这个区别。 6)limit/skip
limit 返回 Stream 的前面 n 个元素;skip 则是扔掉前 n 个元素(它是由一个叫 subStream 的方法改名而来)。 清单 1. limit 和skip对运行次数的影响 public void testLimitAndSkip() { List
对 Stream 的排序通过 sorted 进行,它比数组的排序更强之处在于你可以首先对 Stream 进行各类 map、filter、limit、skip 甚至 distinct 来减少元素数量后,再排序,这能帮助程序明显缩短执行时间。我们对清单 14 进行优化: 清单 1. 优化:排序前进行 limit 和 skip 结果会简单很多: name2 name1 [stream.StreamDW$Person@6ce253f1, stream.StreamDW$Person@53d8d10a] 当然,这种优化是有 business logic 上的局限性的:即不要求排序后再取值。
8)min/max/distinct
min 和 max 的功能也可以通过对 Stream 元素先排序,再 findFirst 来实现,但前者的性能会更好,为 O(n),而 sorted 的成本是 O(n log n)。同时它们作为特殊的 reduce 方法被独立出来也是因为求最大最小值是很常见的操作。 清单 1. 找出最长一行的长度 BufferedReader br = new BufferedReader(new FileReader(\int longest = br.lines(). mapToInt(String::length). max(). getAsInt(); br.close(); System.out.println(longest); 下面的例子则使用 distinct 来找出不重复的单词。 清单 2. 找出全文的单词,转小写,并排序 List
Stream 有三个 match 方法,从语义上说:
? ? ?
allMatch:Stream 中全部元素符合传入的 predicate,返回 true anyMatch:Stream 中只要有一个元素符合传入的 predicate,返回 true noneMatch:Stream 中没有一个元素符合传入的 predicate,返回 true
它们都不是要遍历全部元素才能返回结果。例如 allMatch 只要一个元素不满足条件,就 skip 剩下的所有元素,返回 false。对清单 13 中的 Person 类稍做修改,加入一个 age 属性和 getAge 方法。
清单 1. 使用 Match List
5进阶:自己生成流
1)Stream.generate
通过实现 Supplier 接口,你可以自己来控制流的生成。这种情形通常用于随机数、常量的 Stream,或者需要前后元素间维持着某种状态信息的 Stream。把 Supplier 实例传递给 Stream.generate() 生成的 Stream,默认是串行(相对 parallel 而言)但无序的(相对 ordered 而言)。由于它是无限的,在管道中,必须利用 limit 之类的操作限制 Stream 大小。 清单 1. 生成 10 个随机整数 Random seed = new Random(); Supplier
iterate 跟 reduce 操作很像,接受一个种子值,和一个 UnaryOperator(例如 f)。然后种子值成为 Stream 的第一个元素,f(seed) 为第二个,f(f(seed)) 第三个,以此类推。 清单 24. 生成一个等差数列 Stream.iterate(0, n -> n + 3).limit(10). forEach(x -> System.out.print(x + \输出结果: 0 3 6 9 12 15 18 21 24 27 与 Stream.generate 相仿,在 iterate 时候管道必须有 limit 这样的操作来限制 Stream 大小。 6进阶:用 Collectors 来进行 reduction 操作
java.util.stream.Collectors 类的主要作用就是辅助进行各类有用的 reduction 操作,例如转变输出为 Collection,把 Stream 元素进行归组。
1)groupingBy/partitioningBy
清单 1. 按照年龄归组 Map
7.实例
@Test
public void getPrimeByStream() { List nums = new ArrayList();
for(int i = 0; i < 100; i++) { nums.add(String.valueOf(i)); nums.add(String.valueOf(i)); }
List result = nums.stream() .map(e -> new Integer(e)) .distinct() .filter(e -> e < 50) .collect(Collectors.toList());
result.forEach(r -> System.out.println(r)); }
结束语
总之,Stream 的特性可以归纳为:
? ?
?
? ? ?
? ? ? ? ? ?
不是数据结构 它没有内部存储,它只是用操作管道从 source(数据结构、数组、generator function、IO channel)抓取数据。
它也绝不修改自己所封装的底层数据结构的数据。例如 Stream 的 filter 操作会产生一个不包含被过滤元素的新 Stream,而不是从 source 删除那些元素。 所有 Stream 的操作必须以 lambda 表达式为参数 不支持索引访问
你可以请求第一个元素,但无法请求第二个,第三个,或最后一个。不过请参阅下一项。
很容易生成数组或者 List
惰性化
很多 Stream 操作是向后延迟的,一直到它弄清楚了最后需要多少数据才会开始。 Intermediate 操作永远是惰性化的。 并行能力
当一个 Stream 是并行化的,就不需要再写多线程代码,所有对它的操作会自动并行进行的。 可以是无限的
?
o
集合有固定大小,Stream 则不必。limit(n) 和 findFirst() 这类的 short-circuiting 操作可以对无限的 Stream 进行运算并很快完成。
参考文献:
http://blog.csdn.net/ioriogami/article/details/12782141/ http://www.cnblogs.com/franson-2016/p/5593080.html
https://www.ibm.com/developerworks/cn/java/j-lo-java8streamapi/ http://blog.csdn.net/dm_vincent/article/details/40185059
作者:scn7th
百度搜索“yundocx”或“云文档网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,云文档网,提供经典综合文库lambda和steam经典总结在线全文阅读。
最新更新: