课程重点:
- Set的存储特点
- 数据结构-哈希表(了解)
- 数据结构-二叉树(了解)
- TreeSet的排序去重(了解)
- HashSet的去重
18.1. 存储特点
- Set集合中,没有下标的概念。
- Set集合,是一个去重复的集合。 在Set集合中不会添加重复的元素的!
在向一个Set集合中添加元素的时候, 会先判断这个元素是否已经存在了。 如果存在, 则不再添加。 - Set集合中, 数据的存储是无序的。
无序: 所谓的无序, 其实指的是元素的添加顺序和存储顺序是不一致的。
无序, 并不意味着随机!
Set接口, 是继承自Collection接口的。 Set接口中的方法, 都是从Collection接口中继承下来的, 并没有添加新的方法。
18.2. 哈希表
Set集合的两个实现类HashSet与LinkedHashSet,底层实现都是哈希表。
- Hash,一般翻译做“散列”,也有直接音译为“哈希”的,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙。
- 散列表(Hash table,也叫哈希表),是根据键值码值(Key value)而直接进行访问的数据结构。也就是说,它通过把键值码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数。
- Hash表的组成是”数组+链表”这些元素是按照什么样的规则存储到数组中呢。一般情况是通过hash(key)%len获得,也就是元素的key的哈希值对数组长度取模得到。
比如下图哈希表中,12%16=12,28%16=12,108%16=12,140%16=12。所以12、28、108以及140都存储在数组下标为12的位置
18.3. 二叉树
- 二叉树是一种非常重要的数据结构,它同时具有数组和链表各自的特点:它可以像数组一样快速查找,也可以像链表一样快速添加。但是他也有自己的缺点:删除操作复杂。
- 二叉树:是每个结点最多有两个子树的有序树,在使用二叉树的时候,数据并不是随便插入到节点中的,一个节点的左子节点的关键值必须小于此节点,右子节点的关键值必须大于或者是等于此节点,所以又称二叉查找树、二叉排序树、二叉搜索树。
- 叉树遍历分为三种
- 先序遍历
首先访问根,再先序遍历左子树,最后先序遍历右子树 - 中序遍历
首先中序遍历左子树,再访问根,最后中序遍历右子树 - 后序遍历
首先后序遍历左子树,再后序遍历右子树,最后访问根
18.4. TreeSet的排序
18.4.1. TreeSet的简介
TreeSet是一个Set接口的实现类,底层实现是二叉树。这样的集合,会对添加进集合的元素进行去重的处理。 同时, 这个集合会对添加进入的元素进行自动的升序排序。
18.4.2. Comparable接口
如果某一个类实现这个接口, 表示自己实现了一个可以和自己的对象进行大小比较的规则。 此时, 这个类的对象就可以直接存储进TreeSet集合中了。 因为此时TreeSet集合已经知道了怎么对两个这个类的对象进行大小比较。
/**
* @Description
*/
public class Person implements Comparable<Person> {
String name;
int age;
int score;
int height;
int weight;
public Person(String name, int age, int score, int height, int weight) {
this.name = name;
this.age = age;
this.score = score;
this.height = height;
this.weight = weight;
}
@Override
public String toString() {
return "Person{" +
"name='" + name + ''' +
", age=" + age +
", score=" + score +
", height=" + height +
", weight=" + weight +
'}';
}
/**
* 制定了大小比较的规则
* @param o 和this进行比较的Person对象
* @return 比较结果
* > 0 : this > o
* ==0 : this == o
* < 0 : this < o
*/
@Override
public int compareTo(Person o) {
return this.age - o.age;
}
}
class TreeSetUsage2 {
public static void main(String[] args) {
// 1. 实例化一个TreeSet对象
TreeSet<Person> sets = new TreeSet<>();
sets.add(new Person("xiaoming", 10, 100, 165, 50));
sets.add(new Person("xiaohong", 11, 99, 164, 50));
sets.add(new Person("xiaolan", 9, 98, 164, 51));
sets.add(new Person("xiaolv", 8, 98, 166, 48));
sets.add(new Person("xiaozi", 10, 97, 159, 46));
// 2. 遍历集合
sets.forEach(System.out::println);
System.out.println(sets.size());
}
}
18.4.3. Comparator接口
在实例化TreeSet集合对象的时候,可以通过Comparator进行实例化。 此时, 这个集合有着自己的排序的依据, 与集合中存储的元素对应的类无关。 此时集合中存储的元素对应的类, 可以不实现Comparable接口, 依然可以完成排序。 即便这个类真的实现了Comparable接口, 最终的排序结果依然以构造方法中的Comparator为准。
/**
* @Description 通过Comparator进行比较
*/
public class TreeSetUsage3 {
public static void main(String[] args) {
// 1. 实例化一个TreeSet对象
// 可以通过Comparator进行TreeSet的实例化。使用指定的规则进行大小比较。
// 此时,集合中存储的元素可以不实现Comparable接口
TreeSet<Person> sets = new TreeSet<>((p1, p2) -> p1.height - p2.height);
sets.add(new Person("xiaoming", 10, 100, 165, 50));
sets.add(new Person("xiaohong", 11, 99, 164, 50));
sets.add(new Person("xiaolan", 9, 98, 164, 51));
sets.add(new Person("xiaolv", 8, 98, 166, 48));
sets.add(new Person("xiaozi", 10, 97, 159, 46));
// 2. 遍历集合
sets.forEach(System.out::println);
System.out.println(sets.size());
}
}
18.4.4. Comparable与Comparator的使用场景
- 如果这个对象, 在项目中大多数的情况下, 都采用相同的大小比较的方式。 比如: 一个Person类, 在大多数情况下, 都是按照年龄进行大小比较的。 此时就可以让Person类实现Comparable接口。
- 如果某一个类的对象, 在临时进行大小比较的时候, 使用的与默认的比较不一样的规则。 比如: 一个Person类, 大多数情况下, 都是使用的年龄进行大小比较的, 但是临时需要使用身高进行一次比较, 此时就可以使用 Comparator 临时完成了。 而且, Comparator的优先级要高于Comparable。
18.5. Set集合的去重原理
18.5.1. HashSet & LinkedHashSet
18.5.2. TreeSet
无论使用Comparator还是Comparable,如果两个对象进行大小比较的结果是0, 此时代表这两个对象是相同的对象。 在TreeSet中会完成排重的处理。
注意: TreeSet中元素的去重只与对象的大小比较结果有关。 与hashCode()、equals(), 没有任何关系。