java8的streamAPI

2023/7/6 java

Stream的使用

Java 8 版本新增的Stream 支持Lambda编程，操作集合（Collection）提供了极大的便利。
Stream将要处理的元素集合看作一种流，Stream API对流中的元素进行操作，比如：筛选、排序、聚合等。
Stream可以由数组或集合创建
Stream特性:

stream不存储数据，而是按照特定的规则对数据进行计算，一般会输出结果。
stream不会改变数据源，通常情况下会产生一个新的集合或一个值。
stream具有延迟执行特性，只有调用终端操作时，中间操作才会执行。

Stream的使用

遍历/匹配（foreach/find/match）

Stream中的元素以Optional类型存在

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(7, 6, 9, 3, 8, 2, 1);

        // 遍历输出符合条件的元素,对于每一个符合元素进行调用(foreach)
        list.stream().filter(x -> x > 6).forEach(System.out::println);

        // 匹配第一个
        Optional<Integer> findFirst = list.stream().filter(x -> x > 6).findFirst();
        System.out.println("匹配第一个值：" + findFirst.get());

        // 匹配任意（适用于并行流(对顺序没有要求的多线程运行方式--parallelStream)）
        Optional<Integer> findAny = list.parallelStream().filter(x -> x > 6).findAny();
        System.out.println("匹配任意一个值：" + findAny.get());

        // 是否包含符合特定条件的元素
        boolean anyMatch = list.stream().anyMatch(x -> x < 6);
        System.out.println("是否存在大于6的值：" + anyMatch);
    }
}

筛选（filter）

按照一定的规则校验流中的元素，将符合条件的元素提取到新的流中。
案例一：筛选出Integer集合中大于8的元素，并打印出来

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(6, 7, 3, 8, 1, 2, 9);
        Stream<Integer> stream = list.stream();

        stream.filter(x -> x > 8).forEach(System.out::println);
    }
}

案例二：筛选员工中工资高于8000的人，并形成新的集合
(首次展示员工类后面默认此员工类)
形成新集合依赖collect（收集），后文有详细介绍。

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = new ArrayList<Person>();
        //姓名-工资-年龄-性别-地区
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));
        personList.add(new Person("Anni", 8200, 24, "female", "New York"));
        personList.add(new Person("Owen", 9500, 25, "male", "New York"));
        personList.add(new Person("Alisa", 7900, 26, "female", "New York"));

        List<String> fiterList = personList.stream().filter(x -> x.getSalary() > 8000).map(Person::getName)
                .collect(Collectors.toList());
        System.out.print("高于8000的员工姓名：" + fiterList);
    }
}

聚合（max/min/count)

Java stream中也引入了mysql中的概念和用法，方便对集合、数组的数据统计工作。
案例一：获取String集合中最长的元素

public class StreamTest {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("adnm", "admmt", "pot", "xbangd", "weoujgsd");

        Optional<String> max = list.stream().max(Comparator.comparing(String::length));
        System.out.println("最长的字符串：" + max.get());
    }
}

案例二：获取Integer集合中的最大值

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(7, 6, 9, 4, 11, 6);

        // 自然排序
        Optional<Integer> max = list.stream().max(Integer::compareTo);
        // 自定义排序
        Optional<Integer> max2 = list.stream().max(new Comparator<Integer>() {
            @Override
            public int compare(Integer o1, Integer o2) {
                return o1.compareTo(o2);
            }
        });
        System.out.println("自然排序的最大值：" + max.get());
        System.out.println("自定义排序的最大值：" + max2.get());
    }
}

在这里，max引用比较器的compare方法来比较大小，而min使用compare的相反逻辑来寻找最小值
因此，如果修改compare的方法，那么max与min的比较逻辑会同时变化。

案例三：获取员工工资最高的人

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 员工list;

        Optional<Person> max = personList.stream().max(Comparator.comparingInt(Person::getSalary));
        System.out.println("员工工资最大值：" + max.get().getSalary());
    }
}

映射(map/flatMap)

将一个流的元素按照一定的映射规则(y=f(x))映射到另一个流中。
分为map和flatMap:

map：接收一个函数作为参数，该函数会被应用到每个元素上，并将其映射成一个新的元素。
flatMap：接收一个函数作为参数，将流中的每个值都换成另一个流，然后把所有流连接成一个流。

案例一(Map)：1.英文字符串数组的元素全部改为大写。2.整数数组每个元素+3

public class StreamTest {
    public static void main(String[] args) {
        String[] strArr = { "abcd", "bcdd", "defde", "fTr" };
        List<String> strList = Arrays.stream(strArr).map(String::toUpperCase).collect(Collectors.toList());
        System.out.println("每个元素大写：" + strList);

        List<Integer> intList = Arrays.asList(1, 3, 5, 7, 9, 11);
        List<Integer> intListNew = intList.stream().map(x -> x + 3).collect(Collectors.toList());
        System.out.println("每个元素+3：" + intListNew);
    }
}

案例二(Map)：将员工的薪资全部增加10000

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 员工list;

        // 不改变原来员工集合的方式
        List<Person> personListNew = personList.stream().map(person -> {
            Person personNew = new Person(person.getName(), 0, person.getAge(), person.getSex(), person.getRegion());
            personNew.setSalary(person.getSalary() + 10000);
            return personNew;
        }).collect(Collectors.toList());
        System.out.println("一次改动前：" + personList.get(0).getName() + "-->" + personList.get(0).getSalary());
        System.out.println("一次改动后：" + personListNew.get(0).getName() + "-->" + personListNew.get(0).getSalary());

    }
}

改变原来员工集合的方式可用forEach或person.setSalary，这里不再赘述。

flatMap：接收一个函数作为参数，将流中的每个值都换成另一个流，然后把所有流连接成一个流。

使用场景: 处理嵌套集合，处理多个集合之间的关系，从对象属性中提取元素 (案例三)

案例三(flatMap)：将两个字符数组合并成一个新的字符数组

public class StreamTest {
    public static void main(String[] args) {
        List<String> list = Arrays.asList("m,k,l,a", "1,3,5,7");
        List<String> listNew = list.stream().flatMap(s -> {
            // 将每个元素转换成一个stream
            String[] split = s.split(",");
            Stream<String> s2 = Arrays.stream(split);
            return s2;
        }).collect(Collectors.toList());

        System.out.println("处理前的集合：" + list);
        System.out.println("处理后的集合：" + listNew);
    }
}

be like :

处理前的集合：[m-k-l-a, 1-3-5]
处理后的集合：[m, k, l, a, 1, 3, 5]

归约(reduce)

也称缩减，顾名思义，是把一个流缩减成一个值($ z=f(\vec{x} ,\vec{y},…) $ )，能实现对集合求和、求乘积,与,求最值操作。
案例一：求Integer集合的元素之和、乘积和最大值

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 3, 2, 8, 11, 4);
        // 自定义求和方式1
        Optional<Integer> sum = list.stream().reduce((x, y) -> x + y);
        // 求和方式2
        Optional<Integer> sum2 = list.stream().reduce(Integer::sum);
        // 求和方式3
        Integer sum3 = list.stream().reduce(0, Integer::sum);
        
        // 求乘积
        Optional<Integer> product = list.stream().reduce((x, y) -> x * y);

        // 求最大值方式1
        Optional<Integer> max = list.stream().reduce((x, y) -> x > y ? x : y);
        // 求最大值写法2
        Integer max2 = list.stream().reduce(1, Integer::max);

        System.out.println("list求和：" + sum.get() + "," + sum2.get() + "," + sum3);
        System.out.println("list求积：" + product.get());
        System.out.println("list求和：" + max.get() + "," + max2);
    }
}

显然，求和方式1和3可以混用，在1的重载方法下不需要提供identity元素(初始值)(如0)。
这意味着，如果流是空的，将返回一个空的Optional对象。否则，将使用流的第一个元素作为初始值，并执行归约操作。
有一种更通用的参数方法

<U> U reduce(U identity, BiFunction<U, ? super T, U> accumulator, BinaryOperator<U> combiner)
如
List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int result = numbers.parallelStream().reduce(0, (a, b) -> a + b, Integer::sum);
System.out.println(result); // 输出15

注意这种方式使用的是并行重载形式
这要求 累加器函数(accumulator)与组合器函数(combiner)必须满足结合律
并且应确保identity值满足唯一性并适用于归约操作，以避免出现无法正确获得结果的情况。(如字符串拼接的null、乘法的0等)
如果不显式提供combiner，并且使用并行重载形式，则使用accumulator作为combiner。
如这段代码

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int result = numbers.parallelStream().reduce(2, (a, b) -> a * b, (x, y) -> x * y);
System.out.println(result);

int result2 = numbers.stream().reduce(2, (a, b) -> a * b, (x, y) -> x * y);
System.out.println(result2);

在并行流中，每次都会对计算赋予初始值，所以result应该是$ 2^5 \times 120 = 3840 $
而在串行流中，初始值只使用一次，所以result应该是$ 2 \times 120 = 240 $
(经本人测验)在串行流中并不会执行额外的组合器函数，
另外，请不要尝试在并行流中使用不一样的累加器和组合器函数，以及可能会影响结果的初始值。
也许会导致不可预估的结果，因为并行的线程数是不可预估的
如果必要，可以使用线程安全的AtomicInteger作为累加器(没用过)

收集(collect)

字面上理解，就是把流收集起来，可以收集成值，也可以收集成新的集合。
collect主要依赖java.util.stream.Collectors类内置的静态方法。

归集(toList/toSet/toMap)

流不存储数据，那么在流中的数据完成处理后，需要将流中的数据重新归集到新的集合里。
比较常用的有toList、toSet和toMap，另外还有toCollection、toConcurrentMap等一些复杂的用法。

案例演示toList、toSet和toMap：

public class StreamTest {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 6, 3, 4, 6, 7, 9, 6, 20);
        List<Integer> listNew = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toList());
        Set<Integer> set = list.stream().filter(x -> x % 2 == 0).collect(Collectors.toSet());

        List<Person> personList = 员工list;
        
        Map<?, Person> map = personList.stream().filter(p -> p.getSalary() > 8000)
                .collect(Collectors.toMap(Person::getName, p -> p));
    
        System.out.println("toList:" + listNew);
        System.out.println("toSet:" + set);
        System.out.println("toMap:" + map);
    }
}

结果belike:

toList：[6, 4, 6, 6, 20]
toSet：[4, 20, 6]
toMap：{Tom=mutest.Person@5fd0d5ae, Anni=mutest.Person@2d98a335}

统计(count/averaging)

Collectors提供了一系列用于数据统计的静态方法：

计数：count
平均值：averagingInt、averagingLong、averagingDouble
最值：maxBy、minBy
求和：summingInt、summingLong、summingDouble
统计以上所有：summarizingInt、summarizingLong、summarizingDouble

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = new ArrayList<Person>();
        personList.add(new Person("Tom", 8900, 23, "male", "New York"));
        personList.add(new Person("Jack", 7000, 25, "male", "Washington"));
        personList.add(new Person("Lily", 7800, 21, "female", "Washington"));

        // 求总数
        Long count = personList.stream().collect(Collectors.counting());
        // 求平均工资
        Double average = personList.stream().collect(Collectors.averagingDouble(Person::getSalary));
        // 求最高工资
        Optional<Integer> max = personList.stream().map(Person::getSalary).collect(Collectors.maxBy(Integer::compare));
        // 求工资之和
        Integer sum = personList.stream().collect(Collectors.summingInt(Person::getSalary));
        // 一次性统计所有信息
        DoubleSummaryStatistics collect = personList.stream().collect(Collectors.summarizingDouble(Person::getSalary));

        System.out.println("员工总数：" + count);
        System.out.println("员工平均工资：" + average);
        System.out.println("员工工资总和：" + sum);
        System.out.println("员工工资所有统计：" + collect);
    }
}

belike:

员工总数：3
员工平均工资：7900.0
员工工资总和：23700
员工工资所有统计：DoubleSummaryStatistics{count=3, sum=23700.000000,min=7000.000000, average=7900.000000, max=8900.000000}

分组(partitioningBy/groupingBy)

分区：将stream按条件分为两个对立Map，比如员工按薪资是否高于8000分为两部分。
分组：将集合分为多个Map，比如员工按性别分组。有单级分组和多级分组。
案例：将员工按薪资是否高于8000分为两部分；将员工按性别和地区分组

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 员工list;
        // 将员工按薪资是否高于8000分组
        Map<Boolean, List<Person>> part = personList.stream().collect(Collectors.partitioningBy(x -> x.getSalary() > 8000));
        // 将员工按性别分组
        Map<String, List<Person>> group = personList.stream().collect(Collectors.groupingBy(Person::getSex));
        // 将员工先按性别分组，再按地区分组
        Map<String, Map<String, List<Person>>> group2 = 
            personList.stream().collect(Collectors.groupingBy(Person::getSex, Collectors.groupingBy(Person::getArea)));
        System.out.println("员工按薪资是否大于8000分组情况：" + part);
        System.out.println("员工按性别分组情况：" + group);
        System.out.println("员工按性别、地区：" + group2);
    }
}

接合(joining)

joining可以将stream中的元素用特定的连接符（没有的话，则直接连接）连接成一个字符串。

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 3员工list;

        String names = personList.stream().map(p -> p.getName()).collect(Collectors.joining(","));
        System.out.println("所有员工的姓名：" + names);
        List<String> list = Arrays.asList("A", "B", "C");
        String string = list.stream().collect(Collectors.joining("-"));
        System.out.println("拼接后的字符串：" + string);
    }
}

belike:

所有员工的姓名：Tom,Jack,Lily
拼接后的字符串：A-B-C

归约(reducing)

Collectors类提供的reducing方法.
相比于stream本身的reduce方法，增加了对自定义归约的支持。

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 3员工list;

        // 每个员工减去起征点后的薪资之和（这个例子并不严谨，但一时没想到好的例子）
        Integer sum = personList.stream().collect(Collectors.reducing(0, Person::getSalary, (i, j) -> (i + j - 5000)));
        System.out.println("员工扣税部分的薪资总和：" + sum);

        // stream的reduce
        Optional<Integer> sum2 = personList.stream().map(Person::getSalary).reduce(Integer::sum);
        System.out.println("员工薪资总和：" + sum2.get());
    }
}

reducing()方法可以处理原始类型和引用类型的Stream。可以用于处理IntStream的归约操作，避免了装箱和拆箱操作。
而Stream.reduce()方法只适用于引用类型的Stream，因此会涉及到装箱和拆箱操作。
当然，Java 8也引入了特殊的原始类型Stream如IntStream、LongStream、DoubleStream等来处理原始类型数据。
（Collectors类结束）

排序(sorted)

sorted()：自然排序，流中元素需实现Comparable接口
sorted(Comparator com)：Comparator排序器自定义排序

public class StreamTest {
    public static void main(String[] args) {
        List<Person> personList = 5员工list;
        // 按工资升序排序（自然排序）
        List<String> newList = personList.stream()
            .sorted(Comparator.comparing(Person::getSalary)).map(Person::getName)
            .collect(Collectors.toList());
        // 按工资倒序排序
        List<String> newList2 = personList.stream()
            .sorted(Comparator.comparing(Person::getSalary).reversed())
            .map(Person::getName).collect(Collectors.toList());
        // 先按工资再按年龄升序排序
        List<String> newList3 = personList.stream()
            .sorted(Comparator.comparing(Person::getSalary).thenComparing(Person::getAge)).map(Person::getName)
            .collect(Collectors.toList());
        // 先按工资再按年龄自定义排序（降序）
        List<String> newList4 = personList.stream()
            .sorted((p1, p2) -> {
                if (p1.getSalary() == p2.getSalary()) {
                    return p2.getAge() - p1.getAge();
                } else {
                	return p2.getSalary() - p1.getSalary();
                }
            })
            .map(Person::getName).collect(Collectors.toList());

        System.out.println("按工资升序排序：" + newList);
        System.out.println("按工资降序排序：" + newList2);
        System.out.println("先按工资再按年龄升序排序：" + newList3);
        System.out.println("先按工资再按年龄自定义降序排序：" + newList4);
    }
}

提取/组合

流也可以进行合并、去重、限制、跳过等操作.

public class StreamTest {
    public static void main(String[] args) {
        String[] arr1 = { "a", "b", "c", "d" };
        String[] arr2 = { "d", "e", "f", "g" };

        Stream<String> stream1 = Stream.of(arr1);
        Stream<String> stream2 = Stream.of(arr2);
        // concat:合并两个流 distinct：去重
        List<String> newList = Stream.concat(stream1, stream2).distinct().collect(Collectors.toList());
        // limit：限制从流中获得前n个数据
        List<Integer> collect = Stream.iterate(1, x -> x + 2).limit(10).collect(Collectors.toList());
        // skip：跳过前n个数据
        List<Integer> collect2 = Stream.iterate(1, x -> x + 2).skip(1).limit(5).collect(Collectors.toList());

        System.out.println("流合并：" + newList);
        System.out.println("limit：" + collect);
        System.out.println("skip：" + collect2);
    }
}

belike:

流合并：[a, b, c, d, e, f, g]
limit：[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
skip：[3, 5, 7, 9, 11]

其中Stream.iterate(1, x -> x + 2)是一个无限顺序流，从1开始，每次迭代都增加2。
除此之外还有:
IntStream/LongStream.range(1, 10) 生成1-9的顺序流；（仅适用于这两种流）
通用的：生成了一个包含随机数的无限流，并限制了流的大小为 5：

Stream.generate(() -> new Random().nextInt(100))
.limit(5)
.forEach(System.out::println);

LOADING

java8的streamAPI

Stream的使用

遍历/匹配（foreach/find/match）

筛选（filter）

聚合（max/min/count)

映射(map/flatMap)

归约(reduce)

收集(collect)

归集(toList/toSet/toMap)

统计(count/averaging)

分组(partitioningBy/groupingBy)

接合(joining)

归约(reducing)

排序(sorted)

提取/组合