流API--初体验

在JDK8新增的许多功能中，有2个功能最重要，一个是Lambda表达式，一个是流API。Lambda表达式前面我已经整理过了，现在开始整理流API。首先应该如何定义流API中的“流”这个概念呢？记住：流是数据的渠道。

高中的时候我们就学过电流，水流，磁场流，然后java中还有io流，那么这个流到底是什么东西呢？我们这样子来理解：流是一种对抽象化事物的模拟。流本身并不存储数据，它只是代表一个对象序列，流操作本身并不修改数据源。出于某些原因呢，我们不好研究数据源本身，所以我们就用流来模拟一个对象序列，在这里流里面做一些数据过滤，排序和其他的操作，它只是移动数据，或者说压根就不是客观存在的东西，所以流操作本身不会修改数据源（这点也是我们需要特别注意的）。

现在我们较为直观的来看一段代码来初体验下流，假设我们现在有这么一个情景，我们需要统计一个Integer类型的集合中元素大于2的数量，按照以前我们的写法我们来编码：

public static void main(String[] args)

	{

		//模拟一个集合和一个累加器

		List<Integer> list = Lists.newArrayList(1, 2, 3);

		int count = 0;

		//然后迭代该集合

		for (Integer integer : list)

		{

			if (integer > 2)

			{

				count++;

			}

		}

		System.out.println("集合中元素的个数：" + count);

	}

上面的代码我们以前经常写，有什么问题吗？没有。只不过它很难被并行运算。这也是java8引入大量操作符的原因。我们现在使用java8中的流来实现上面的情景：

public static void main(String[] args)

	{

		//模拟一个集合和一个累加器

		List<Integer> list = Lists.newArrayList(1, 2, 3);

		//使用java8的流，编码量也大大的减小了

		System.out.println(list.stream().filter(value -> value > 2).count());

	}

我们来对比下上面的2段代码，一个Stream表面上看与一个集合很类似，允许你改变和获取数据。但是实际上它与集合还是有很大区别的：

1，Stream不会存储元素。元素可能被存储在底层的集合中，或者根据需要产生出来

2，Stream操作符不会改变源对象，相反，他们会返回一个持有结果的新的Stream

public static void main(String[] args)

	{

		//模拟一个集合

		List<Integer> list = Lists.newArrayList(1, 2, 3);

		long count = list.stream().filter(value -> value >= 2).count();

		System.out.println("使用这个流来做一些操作：该流的数量是" + count);

		//一下代码我们输入原来的数据源看下，原来的数据源是否发生了改变。事件证明，原来的数据源不变

		for (Integer integer : list)

		{

			System.out.println(integer);

		}

	}

3，Stream可能是延迟执行的，也就是说他们会等到需要结果的时候才执行。

4，我们现在已经发现了，使用Steam表达式比循环的可读性更好。其实还有最重要的一点就是他们很容易被并行执行。

System.out.println(list.parallelStream().filter(value -> value > 2).count());

总结：我们应该深深体会到Stream设计的原则--做什么，而不是怎么去做

当你使用Stream时，你会通过三个阶段来建立一个操作流水线

1，创建一个Stream

2，在一个或者多个步骤中，指定将初始的Stream转换为另外一个Stream的中间操作

3，使用一个终端操作来产生一个结果，该操作会强制它之前的延迟操作立即执行，在这之后，该Stream就不会再被使用了。

流接口--BaseStream接口

流API定义了几个流接口，这些接口包含在java.util.stream中。BaseStream是基础接口，它定义了所有流都可以使用的基本功能。我们来看一下源码：

public interface BaseStream<T, S extends BaseStream<T, S>> extends AutoCloseable {}

这是一个泛型接口，T指定流中元素的类型，S指定扩展BaseStream的流的类型。BaseStream类extends了AutoCloseable接口，所以可以使用带资源的try语句管理流。在大多数的情况下，比如数据源是集合的时候，都不需要关闭流的。

这个类基本实际编码中基本不会用到，里面的几个方法也都是些属性状态判断的方法，所以了解下就好了，这里不列出具体的API了。我们还要主要研究下Stream接口，几个基本类型的接口我们最后整理。

流接口--Stream接口

Stream也是一个接口，ReferencePipeline是它具体的实现类。具体的实现类，我们不用关心，因为一般都是直接使用这个接口的API就好了。Stream接口的定义如下：

public interface Stream<T> extends BaseStream<T, Stream<T>> {}

这个类里面好多方法我们要认真的了解下的，我们学习流API其实也就是学习这几个方法而已，在详细的整理的API之前，先来说3组概念。

1，终端操作VS中间操作

终端操作会消费流，这种操作作用于产生结果，例如找出流中最小的值，或者执行某种操作，比如forEach方法。一个流被消费后，就不能被重用了。

中间操作会产生另外一个流，所以，中间操作可以用来创建执行一系列动作的管道。

2，延迟行为

延迟机制就是说某一种操作不是立即发生的。可能在中间的某一个时刻才会发生。上面的中间操作就不是立即发生的。当在中间操作创建的新流上执行终端操作后，中间操作指定的操作才会发生。之所有有这种机制，应该是出于性能原因吧，延迟行为可以让流API更加高效的执行

3，有状态VS无状态

无状态操作就是说，独立于其他元素来处理每一个元素。在有状态的操作中，每个元素的处理可能依赖于其他的元素。举个例子吧：比如说排序就应该是有状态操作，因为元素的顺序依赖于其他的元素的值。比如说过滤就应该是无状态操作，因为每个元素都是被单独处理的。当需要并行处理流的时候，无状态和有状态的区别最为重要，因为有状态操作可能需要多次处理才能完成。

其实学习流API挺简单的，就是获取一个流，然后调相关的流API来操作就OK了。

1，如何获取流？

想要获取一个流，肯定要有一个数据源。

1），如果数据源是集合的话，有2个方法可以获得一个流，下面是Collections的2个获取流的源码：

//该方法默认返回一个顺序流

		default Stream<E> stream() {

	        return StreamSupport.stream(spliterator(), false);

	    }

	    //该方法默认返回一个并行流，如果无法获得一个并行流，也有可能返回一个顺序流

	    default Stream<E> parallelStream() {

	        return StreamSupport.stream(spliterator(), true);

	    }

2），如果数据源是数组的话，用Arrays工具类的一个stream()静态方法，

public static <T> Stream<T> stream(T[] array) {

        return stream(array, 0, array.length);

    }

该方法还有几个重载方法，用来返回处理基本类型的数组，他们返回的类型有IntStream，DoubleStream，LongStream。

3），通过对一个流做中间操作来获取一个新的流。

4），创建包含指定元素集合的流，使用of()方法。

下面是获取流的一段代码：

/**

 * @创建作者: LinkinPark

 * @创建时间: 2015年11月3日

 * @功能描述: 获取流

 */

public class Test

{

	public static void main(String[] args)

	{

		//1，数据源是集合，从集合中获取一个流

		List<Integer> list = new ArrayList<>(3);

		list.add(1);

		list.add(2);

		list.add(3);

		Stream<Integer> stream1 = list.stream();

		//2，数据源是一个数组，从数组中获取一个流

		Integer[] array = list.toArray(new Integer[0]);

		Stream<Integer> stream2 = Arrays.stream(array);

		//3，使用原来的一个流来生成一个新的流

		Stream<Integer> stream3 = stream1.filter((i) -> true);

		//4，直接使用Stream接口的静态方法of

		Stream<Integer> stream4 = Stream.of(1, 2, 3);

		stream4.forEach(System.out::println);

	}

}

2，OK，现在我来整理下具体的流的API：

先来整理中间操作的方法：

filter()，过滤掉Steam中所有不符合predicate接口的元素

mapToXxx()，对流中的元素执行一对一的转换，该方法返回的新流中包含了ToXxxFunction接口的元素

peek()，依次对每个元素执行一些操作，该方法返回的流与原来流包含相同的元素，该方法主要用于调试。

distinct()，排序流中所有重复的元素，注意，这里元素重复的标准是使用equals()返回true。该方法有状态

sorted()，保证流中的元素在后续的访问中出于有序状态。该方法有状态

limit()，用于保证对流的后续访问中最大允许访问的元素个数。该方法有状态

整理几个终端操作的方法：

forEach()，遍历流中的所有元素，对每个元素执行Consumer接口

toArray()，将流中所有的元素转换成一个数组

reduce()，用于通过某种操作来合并流中的元素

min()，返回流中所有元素的最小值

max()，返回流中所有元素的最大值

count()，返回流中所有元素的数量

anyMatch()，判断流中是否至少包含一个元素符合Predicate接口

allMatch()，判断流中是否每个元素都符合Predicate接口

noneMatch()，判断流中是否所有元素都不符合Predicate接口

findFirst()，返回流中的第一个元素

findAny()，返回流中的任意一个元素

3，一个简单的流示例

OK，现在通过一段代码来做一个简单的流示例：

public static void main(String[] args) throws Exception

	{

		//这里初始化一个list，下面Stream所有的操作都不会影响这个数据源的

		List<Integer> list = new ArrayList<>(3);

		list.add(1);

		list.add(2);

		list.add(3);

		//获取一个流，来演示下min取最小值的操作

		Stream<Integer> stream = list.stream();

		Optional<Integer> min = stream.min(Integer::compare);

		min.ifPresent(System.out::println);

		//上面的min是终端操作，所以流被消费了。下面演示下链式操作，这也是Optional类和Stream流推荐的方式

		list.stream().filter((value) -> value < 2).forEach(System.out::println);

		list.stream().max(Integer::compare).filter((value) -> value > 5).orElseThrow(() -> new Exception("这里随便一个异常"));

	}

相关文章