带你从零学大数据之Java篇第十八章：集合(Set)

课程重点:

Set的存储特点
数据结构-哈希表(了解)
数据结构-二叉树(了解)
TreeSet的排序去重(了解)
HashSet的去重

18.1. 存储特点

Set集合中，没有下标的概念。
Set集合，是一个去重复的集合。在Set集合中不会添加重复的元素的！
在向一个Set集合中添加元素的时候，会先判断这个元素是否已经存在了。如果存在，则不再添加。
Set集合中，数据的存储是无序的。
无序：所谓的无序，其实指的是元素的添加顺序和存储顺序是不一致的。
无序，并不意味着随机！

Set接口，是继承自Collection接口的。 Set接口中的方法，都是从Collection接口中继承下来的，并没有添加新的方法。

18.2. 哈希表

Set集合的两个实现类HashSet与LinkedHashSet，底层实现都是哈希表。

Hash，一般翻译做“散列”，也有直接音译为“哈希”的，它是基于快速存取的角度设计的，也是一种典型的“空间换时间”的做法。顾名思义，该数据结构可以理解为一个线性表，但是其中的元素不是紧密排列的，而是可能存在空隙。
散列表（Hash table，也叫哈希表），是根据键值码值(Key value)而直接进行访问的数据结构。也就是说，它通过把键值码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数。
Hash表的组成是”数组+链表”这些元素是按照什么样的规则存储到数组中呢。一般情况是通过hash(key)%len获得，也就是元素的key的哈希值对数组长度取模得到。

比如下图哈希表中，12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置

18.3. 二叉树

二叉树是一种非常重要的数据结构，它同时具有数组和链表各自的特点：它可以像数组一样快速查找，也可以像链表一样快速添加。但是他也有自己的缺点：删除操作复杂。
二叉树：是每个结点最多有两个子树的有序树，在使用二叉树的时候，数据并不是随便插入到节点中的，一个节点的左子节点的关键值必须小于此节点，右子节点的关键值必须大于或者是等于此节点，所以又称二叉查找树、二叉排序树、二叉搜索树。
叉树遍历分为三种

先序遍历
首先访问根，再先序遍历左子树，最后先序遍历右子树
中序遍历
首先中序遍历左子树，再访问根，最后中序遍历右子树
后序遍历
首先后序遍历左子树，再后序遍历右子树，最后访问根

18.4. TreeSet的排序

18.4.1. TreeSet的简介

TreeSet是一个Set接口的实现类，底层实现是二叉树。这样的集合，会对添加进集合的元素进行去重的处理。同时，这个集合会对添加进入的元素进行自动的升序排序。

18.4.2. Comparable接口

如果某一个类实现这个接口，表示自己实现了一个可以和自己的对象进行大小比较的规则。此时，这个类的对象就可以直接存储进TreeSet集合中了。因为此时TreeSet集合已经知道了怎么对两个这个类的对象进行大小比较。

 /**
 * @Description
 */
public class Person implements Comparable<Person> {
    String name;
    int age;
    int score;
    int height;
    int weight;

    public Person(String name, int age, int score, int height, int weight) {
        this.name = name;
        this.age = age;
        this.score = score;
        this.height = height;
        this.weight = weight;
    }

    @Override
    public String toString() {
        return "Person{" +
                "name='" + name + ''' +
                ", age=" + age +
                ", score=" + score +
                ", height=" + height +
                ", weight=" + weight +
                '}';
    }

    /**
     * 制定了大小比较的规则
     * @param o 和this进行比较的Person对象
     * @return 比较结果
     *      > 0 :   this > o
     *      ==0 :   this == o
     *      < 0 :   this < o
     */
    @Override
    public int compareTo(Person o) {
        return this.age - o.age;
    }
}

class TreeSetUsage2 {
    public static void main(String[] args) {
        // 1. 实例化一个TreeSet对象
        TreeSet<Person> sets = new TreeSet<>();

        sets.add(new Person("xiaoming", 10, 100, 165, 50));
        sets.add(new Person("xiaohong", 11, 99, 164, 50));
        sets.add(new Person("xiaolan", 9, 98, 164, 51));
        sets.add(new Person("xiaolv", 8, 98, 166, 48));
        sets.add(new Person("xiaozi", 10, 97, 159, 46));

        // 2. 遍历集合
        sets.forEach(System.out::println);
        System.out.println(sets.size());
    }
}

18.4.3. Comparator接口

在实例化TreeSet集合对象的时候，可以通过Comparator进行实例化。此时，这个集合有着自己的排序的依据，与集合中存储的元素对应的类无关。此时集合中存储的元素对应的类，可以不实现Comparable接口，依然可以完成排序。即便这个类真的实现了Comparable接口，最终的排序结果依然以构造方法中的Comparator为准。

 /**
 * @Description 通过Comparator进行比较
 */
public class TreeSetUsage3 {
    public static void main(String[] args) {
        // 1. 实例化一个TreeSet对象
        //    可以通过Comparator进行TreeSet的实例化。使用指定的规则进行大小比较。
        //    此时，集合中存储的元素可以不实现Comparable接口
        TreeSet<Person> sets = new TreeSet<>((p1, p2) -> p1.height - p2.height);

        sets.add(new Person("xiaoming", 10, 100, 165, 50));
        sets.add(new Person("xiaohong", 11, 99, 164, 50));
        sets.add(new Person("xiaolan", 9, 98, 164, 51));
        sets.add(new Person("xiaolv", 8, 98, 166, 48));
        sets.add(new Person("xiaozi", 10, 97, 159, 46));

        // 2. 遍历集合
        sets.forEach(System.out::println);
        System.out.println(sets.size());
    }
}

18.4.4. Comparable与Comparator的使用场景

如果这个对象，在项目中大多数的情况下，都采用相同的大小比较的方式。比如：一个Person类，在大多数情况下，都是按照年龄进行大小比较的。此时就可以让Person类实现Comparable接口。
如果某一个类的对象，在临时进行大小比较的时候，使用的与默认的比较不一样的规则。比如：一个Person类，大多数情况下，都是使用的年龄进行大小比较的，但是临时需要使用身高进行一次比较，此时就可以使用 Comparator 临时完成了。而且， Comparator的优先级要高于Comparable。

18.5. Set集合的去重原理

18.5.1. HashSet & LinkedHashSet

18.5.2. TreeSet

无论使用Comparator还是Comparable，如果两个对象进行大小比较的结果是0，此时代表这两个对象是相同的对象。在TreeSet中会完成排重的处理。

注意： TreeSet中元素的去重只与对象的大小比较结果有关。与hashCode()、equals()，没有任何关系。

智云一二三科技

带你从零学大数据之Java篇第十八章：集合(Set)

18.1. 存储特点

18.4.1. TreeSet的简介

18.4.3. Comparator接口

18.4.4. Comparable与Comparator的使用场景

18.5. Set集合的去重原理

18.5.1. HashSet & LinkedHashSet

关于作者: 智云科技

18.1. 存储特点

18.4.1. TreeSet的简介

18.4.3. Comparator接口

18.4.4. Comparable与Comparator的使用场景

18.5. Set集合的去重原理

18.5.1. HashSet & LinkedHashSet

给这篇文章的作者打赏

关于作者: 智云科技

相关文章

Map和List的几种遍历方式

全网大佬都在用的Java+Python这两套视频学习教程，学习很重要

JavaWeb快速进阶全套教程(程序员必备2020版)：视频+笔记+源码

热门文章

1分享新浪图床上传接口源码

2PHP简单实现路由Route功能

3Tideways、xhprof 和 xhgui 打造 PHP 非侵入式监控平台

4centos系统如何查看是否安装了mysql

5curl 工具简述