LOADING

加载过慢请开启缓存 浏览器默认开启

java8的streamAPI

2023/7/6 java
  1. Stream的使用
    1. 遍历/匹配(foreach/find/match)
    2. 筛选(filter)
    3. 聚合(max/min/count)
    4. 映射(map/flatMap)
    5. 归约(reduce)
    6. 收集(collect)
      1. 归集(toList/toSet/toMap)
      2. 统计(count/averaging)
      3. 分组(partitioningBy/groupingBy)
      4. 接合(joining)
      5. 归约(reducing)
    7. 排序(sorted)
    8. 提取/组合

Java 8 版本新增的Stream 支持Lambda编程 ,操作集合(Collection)提供了极大的便利。
Stream将要处理的元素集合看作一种流,Stream API对流中的元素进行操作,比如:筛选、排序、聚合等。
Stream可以由数组或集合创建
Stream特性:

  • stream不存储数据,而是按照特定的规则对数据进行计算,一般会输出结果。
  • stream不会改变数据源,通常情况下会产生一个新的集合或一个值。
  • stream具有延迟执行特性,只有调用终端操作时,中间操作才会执行。

Stream的使用

遍历/匹配(foreach/find/match)

Stream中的元素以Optional类型存在

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(7, 6, 9, 3, 8, 2, 1);

        // 遍历输出符合条件的元素,对于每一个符合元素进行调用(foreach)
        list.stream().filter(x -> x > 6).forEach(System.out::println);

        // 匹配第一个
        Optional<Integer> findFirst = list.stream().filter(x -> x > 6).findFirst();
        System.out.println("匹配第一个值:" + findFirst.get());

        // 匹配任意(适用于并行流(对顺序没有要求的多线程运行方式--parallelStream))
        Optional<Integer> findAny = list.parallelStream().filter(x -> x > 6).findAny();
        System.out.println("匹配任意一个值:" + findAny.get());

        // 是否包含符合特定条件的元素
        boolean anyMatch = list.stream().anyMatch(x -> x < 6);
        System.out.println("是否存在大于6的值:" + anyMatch);
    }
}

筛选(filter)

按照一定的规则校验流中的元素,将符合条件的元素提取到新的流中。
案例一:筛选出Integer集合中大于8的元素,并打印出来

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(6, 7, 3, 8, 1, 2, 9);
        Stream<Integer> stream = list.stream();

        stream.filter(x -> x > 8).forEach(System.out::println);
    }
}

案例二: 筛选员工中工资高于8000的人,并形成新的集合
(首次展示员工类 后面默认此员工类)
形成新集合依赖collect(收集),后文有详细介绍。

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = new ArrayList<Person>();
        //姓名-工资-年龄-性别-地区
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
        personList.add(new Person("Anni", 8200, 24, "female", "New York"));
        personList.add(new Person("Owen", 9500, 25, "male", "New York"));
        personList.add(new Person("Alisa", 7900, 26, "female", "New York"));

        List<String> fiterList = personList.stream().filter(x -> x.getSalary() > 8000).map(Person::getName)
                .collect(Collectors.toList());
        System.out.print("高于8000的员工姓名:" + fiterList);
    }
}

聚合(max/min/count)

Java stream中也引入了mysql中的概念和用法,方便对集合、数组的数据统计工作。
案例一:获取String集合中最长的元素

public class StreamTest {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("adnm", "admmt", "pot", "xbangd", "weoujgsd");

        Optional<String> max = list.stream().max(Comparator.comparing(String::length));
        System.out.println("最长的字符串:" + max.get());
    }
}

案例二:获取Integer集合中的最大值

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(7, 6, 9, 4, 11, 6);

        // 自然排序
        Optional<Integer> max = list.stream().max(Integer::compareTo);
        // 自定义排序
        Optional<Integer> max2 = list.stream().max(new Comparator<Integer>() {
            @Override
            public int compare(Integer o1, Integer o2) {
                return o1.compareTo(o2);
            }
        });
        System.out.println("自然排序的最大值:" + max.get());
        System.out.println("自定义排序的最大值:" + max2.get());
    }
}

在这里,max引用比较器的compare方法来比较大小,而min使用compare的相反逻辑来寻找最小值
因此,如果修改compare的方法,那么max与min的比较逻辑会同时变化

案例三:获取员工工资最高的人

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 员工list;

        Optional<Person> max = personList.stream().max(Comparator.comparingInt(Person::getSalary));
        System.out.println("员工工资最大值:" + max.get().getSalary());
    }
}

映射(map/flatMap)

将一个流的元素按照一定的映射规则(y=f(x))映射到另一个流中。
分为map和flatMap:

  • map:接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。
  • flatMap:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。

案例一(Map):1.英文字符串数组的元素全部改为大写。2.整数数组每个元素+3

public class StreamTest {
    public static void main(String[] args) {
        String[] strArr = { "abcd", "bcdd", "defde", "fTr" };
        List<String> strList = Arrays.stream(strArr).map(String::toUpperCase).collect(Collectors.toList());
        System.out.println("每个元素大写:" + strList);

        List<Integer> intList = Arrays.asList(1, 3, 5, 7, 9, 11);
        List<Integer> intListNew = intList.stream().map(x -> x + 3).collect(Collectors.toList());
        System.out.println("每个元素+3:" + intListNew);
    }
}

案例二(Map):将员工的薪资全部增加10000

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 员工list;

        // 不改变原来员工集合的方式
        List<Person> personListNew = personList.stream().map(person -> {
            Person personNew = new Person(person.getName(), 0, person.getAge(), person.getSex(), person.getRegion());
            personNew.setSalary(person.getSalary() + 10000);
            return personNew;
        }).collect(Collectors.toList());
        System.out.println("一次改动前:" + personList.get(0).getName() + "-->" + personList.get(0).getSalary());
        System.out.println("一次改动后:" + personListNew.get(0).getName() + "-->" + personListNew.get(0).getSalary());

    }
}

改变原来员工集合的方式 可用forEach或person.setSalary,这里不再赘述。

  • flatMap:接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流。

使用场景: 处理嵌套集合,处理多个集合之间的关系,从对象属性中提取元素 (案例三)

案例三(flatMap):将两个字符数组合并成一个新的字符数组

public class StreamTest {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("m,k,l,a", "1,3,5,7");
        List<String> listNew = list.stream().flatMap(s -> {
            // 将每个元素转换成一个stream
            String[] split = s.split(",");
            Stream<String> s2 = Arrays.stream(split);
            return s2;
        }).collect(Collectors.toList());

        System.out.println("处理前的集合:" + list);
        System.out.println("处理后的集合:" + listNew);
    }
}

be like :

处理前的集合:[m-k-l-a, 1-3-5]
处理后的集合:[m, k, l, a, 1, 3, 5]

归约(reduce)

也称缩减,顾名思义,是把一个流缩减成一个值($ z=f(\vec{x} ,\vec{y},…) $ ),能实现对集合求和、求乘积,与,求最值操作。
案例一:求Integer集合的元素之和、乘积和最大值

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 3, 2, 8, 11, 4);
        // 自定义求和方式1
        Optional<Integer> sum = list.stream().reduce((x, y) -> x + y);
        // 求和方式2
        Optional<Integer> sum2 = list.stream().reduce(Integer::sum);
        // 求和方式3
        Integer sum3 = list.stream().reduce(0, Integer::sum);
        
        // 求乘积
        Optional<Integer> product = list.stream().reduce((x, y) -> x * y);

        // 求最大值方式1
        Optional<Integer> max = list.stream().reduce((x, y) -> x > y ? x : y);
        // 求最大值写法2
        Integer max2 = list.stream().reduce(1, Integer::max);

        System.out.println("list求和:" + sum.get() + "," + sum2.get() + "," + sum3);
        System.out.println("list求积:" + product.get());
        System.out.println("list求和:" + max.get() + "," + max2);
    }
}

显然,求和方式1和3可以混用,在1的重载方法下不需要提供identity元素(初始值)(如0)。
这意味着,如果流是空的,将返回一个空的Optional对象。否则,将使用流的第一个元素作为初始值,并执行归约操作。
有一种更通用的参数方法

<U> U reduce(U identity, BiFunction<U, ? super T, U> accumulator, BinaryOperator<U> combiner)
如
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int result = numbers.parallelStream().reduce(0, (a, b) -> a + b, Integer::sum);
System.out.println(result); // 输出15

注意这种方式使用的是并行重载形式
这要求 累加器函数(accumulator)与组合器函数(combiner)必须满足结合律
并且应确保identity值满足唯一性并适用于归约操作,以避免出现无法正确获得结果的情况。(如字符串拼接的null、乘法的0等)
如果不显式提供combiner,并且使用并行重载形式,则使用accumulator作为combiner
如这段代码

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int result = numbers.parallelStream().reduce(2, (a, b) -> a * b, (x, y) -> x * y);
System.out.println(result);

int result2 = numbers.stream().reduce(2, (a, b) -> a * b, (x, y) -> x * y);
System.out.println(result2);

并行流中,每次都会对计算赋予初始值,所以result应该是$ 2^5 \times 120 = 3840 $
而在串行流中,初始值只使用一次,所以result应该是$ 2 \times 120 = 240 $
(经本人测验)在串行流中并不会执行额外的组合器函数,
另外,请不要尝试在并行流中使用不一样的累加器和组合器函数,以及可能会影响结果的初始值
也许会导致不可预估的结果,因为并行的线程数是不可预估的
如果必要,可以使用线程安全的AtomicInteger作为累加器(没用过)

收集(collect)

字面上理解,就是把流收集起来,可以收集成值,也可以收集成新的集合。
collect主要依赖java.util.stream.Collectors类内置的静态方法。

归集(toList/toSet/toMap)

流不存储数据,那么在流中的数据完成处理后,需要将流中的数据重新归集到新的集合里。
比较常用的有toList、toSet和toMap,另外还有toCollection、toConcurrentMap等一些复杂的用法。

案例演示toList、toSet和toMap:

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 6, 3, 4, 6, 7, 9, 6, 20);
        List<Integer> listNew = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toList());
        Set<Integer> set = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toSet());

        List<Person> personList = 员工list;
        
        Map<?, Person> map = personList.stream().filter(p -> p.getSalary() > 8000)
                .collect(Collectors.toMap(Person::getName, p -> p));
    
        System.out.println("toList:" + listNew);
        System.out.println("toSet:" + set);
        System.out.println("toMap:" + map);
    }
}

结果belike:

toList:[6, 4, 6, 6, 20]
toSet:[4, 20, 6]
toMap:{Tom=mutest.Person@5fd0d5ae, Anni=mutest.Person@2d98a335}

统计(count/averaging)

Collectors提供了一系列用于数据统计的静态方法:

计数:count
平均值:averagingInt、averagingLong、averagingDouble
最值:maxBy、minBy
求和:summingInt、summingLong、summingDouble
统计以上所有:summarizingInt、summarizingLong、summarizingDouble

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));

        // 求总数
        Long count = personList.stream().collect(Collectors.counting());
        // 求平均工资
        Double average = personList.stream().collect(Collectors.averagingDouble(Person::getSalary));
        // 求最高工资
        Optional<Integer> max = personList.stream().map(Person::getSalary).collect(Collectors.maxBy(Integer::compare));
        // 求工资之和
        Integer sum = personList.stream().collect(Collectors.summingInt(Person::getSalary));
        // 一次性统计所有信息
        DoubleSummaryStatistics collect = personList.stream().collect(Collectors.summarizingDouble(Person::getSalary));

        System.out.println("员工总数:" + count);
        System.out.println("员工平均工资:" + average);
        System.out.println("员工工资总和:" + sum);
        System.out.println("员工工资所有统计:" + collect);
    }
}

belike:

员工总数:3
员工平均工资:7900.0
员工工资总和:23700
员工工资所有统计:DoubleSummaryStatistics{count=3, sum=23700.000000,min=7000.000000, average=7900.000000, max=8900.000000}

分组(partitioningBy/groupingBy)

分区:将stream按条件分为两个对立Map,比如员工按薪资是否高于8000分为两部分。
分组:将集合分为多个Map,比如员工按性别分组。有单级分组和多级分组。
案例:将员工按薪资是否高于8000分为两部分;将员工按性别和地区分组

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 员工list;
        // 将员工按薪资是否高于8000分组
        Map<Boolean, List<Person>> part = personList.stream().collect(Collectors.partitioningBy(x -> x.getSalary() > 8000));
        // 将员工按性别分组
        Map<String, List<Person>> group = personList.stream().collect(Collectors.groupingBy(Person::getSex));
        // 将员工先按性别分组,再按地区分组
        Map<String, Map<String, List<Person>>> group2 = 
            personList.stream().collect(Collectors.groupingBy(Person::getSex, Collectors.groupingBy(Person::getArea)));
        System.out.println("员工按薪资是否大于8000分组情况:" + part);
        System.out.println("员工按性别分组情况:" + group);
        System.out.println("员工按性别、地区:" + group2);
    }
}

接合(joining)

joining可以将stream中的元素用特定的连接符(没有的话,则直接连接)连接成一个字符串。

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 3员工list;

        String names = personList.stream().map(p -> p.getName()).collect(Collectors.joining(","));
        System.out.println("所有员工的姓名:" + names);
        List<String> list = Arrays.asList("A", "B", "C");
        String string = list.stream().collect(Collectors.joining("-"));
        System.out.println("拼接后的字符串:" + string);
    }
}

belike:

所有员工的姓名:Tom,Jack,Lily
拼接后的字符串:A-B-C

归约(reducing)

Collectors类提供的reducing方法.
相比于stream本身的reduce方法,增加了对自定义归约的支持。

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 3员工list;

        // 每个员工减去起征点后的薪资之和(这个例子并不严谨,但一时没想到好的例子)
        Integer sum = personList.stream().collect(Collectors.reducing(0, Person::getSalary, (i, j) -> (i + j - 5000)));
        System.out.println("员工扣税部分的薪资总和:" + sum);

        // stream的reduce
        Optional<Integer> sum2 = personList.stream().map(Person::getSalary).reduce(Integer::sum);
        System.out.println("员工薪资总和:" + sum2.get());
    }
}

reducing()方法可以处理原始类型和引用类型的Stream。可以用于处理IntStream的归约操作,避免了装箱和拆箱操作。
而Stream.reduce()方法只适用于引用类型的Stream,因此会涉及到装箱和拆箱操作。
当然,Java 8也引入了特殊的原始类型Stream如IntStream、LongStream、DoubleStream等来处理原始类型数据。
(Collectors类结束)


排序(sorted)

  • sorted():自然排序,流中元素需实现Comparable接口
  • sorted(Comparator com):Comparator排序器自定义排序
public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 5员工list;
        // 按工资升序排序(自然排序)
        List<String> newList = personList.stream()
            .sorted(Comparator.comparing(Person::getSalary)).map(Person::getName)
            .collect(Collectors.toList());
        // 按工资倒序排序
        List<String> newList2 = personList.stream()
            .sorted(Comparator.comparing(Person::getSalary).reversed())
            .map(Person::getName).collect(Collectors.toList());
        // 先按工资再按年龄升序排序
        List<String> newList3 = personList.stream()
            .sorted(Comparator.comparing(Person::getSalary).thenComparing(Person::getAge)).map(Person::getName)
            .collect(Collectors.toList());
        // 先按工资再按年龄自定义排序(降序)
        List<String> newList4 = personList.stream()
            .sorted((p1, p2) -> {
                if (p1.getSalary() == p2.getSalary()) {
                    return p2.getAge() - p1.getAge();
                } else {
                	return p2.getSalary() - p1.getSalary();
                }
            })
            .map(Person::getName).collect(Collectors.toList());

        System.out.println("按工资升序排序:" + newList);
        System.out.println("按工资降序排序:" + newList2);
        System.out.println("先按工资再按年龄升序排序:" + newList3);
        System.out.println("先按工资再按年龄自定义降序排序:" + newList4);
    }
}

提取/组合

流也可以进行合并、去重、限制、跳过等操作.

public class StreamTest {
    public static void main(String[] args) {
        String[] arr1 = { "a", "b", "c", "d" };
        String[] arr2 = { "d", "e", "f", "g" };

        Stream<String> stream1 = Stream.of(arr1);
        Stream<String> stream2 = Stream.of(arr2);
        // concat:合并两个流 distinct:去重
        List<String> newList = Stream.concat(stream1, stream2).distinct().collect(Collectors.toList());
        // limit:限制从流中获得前n个数据
        List<Integer> collect = Stream.iterate(1, x -> x + 2).limit(10).collect(Collectors.toList());
        // skip:跳过前n个数据
        List<Integer> collect2 = Stream.iterate(1, x -> x + 2).skip(1).limit(5).collect(Collectors.toList());

        System.out.println("流合并:" + newList);
        System.out.println("limit:" + collect);
        System.out.println("skip:" + collect2);
    }
}

belike:

流合并:[a, b, c, d, e, f, g]
limit:[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
skip:[3, 5, 7, 9, 11]

其中Stream.iterate(1, x -> x + 2)是一个无限顺序流,从1开始,每次迭代都增加2。
除此之外 还有:
IntStream/LongStream.range(1, 10) 生成1-9的顺序流;(仅适用于这两种流)
通用的:生成了一个包含随机数的无限流,并限制了流的大小为 5:

Stream.generate(() -> new Random().nextInt(100))
.limit(5)
.forEach(System.out::println);