您的位置 首页 java

大数据开发必读:Java/Scala 泛型快速入门教程

泛型 (Generics)是强类型编程语言中经常使用的一种技术。很多框架的代码中都会大量使用到泛型,比如在 Java 中我们经常看到的:

 List<String> strList = new ArrayList<String>();
List<Double> doubleList = new LinkedList<Double>();  

在这段代码中,ArrayList就是一个泛型类,List就是一个泛型接口类,他们提供给开发者一个放置不同类型的集合容器,我们可以向这个集合容器中添加String、Double以及其他各类数据类型。无论内部存储的是什么类型,集合容器提供给开发者的功能都是相同的,比如添加add,get等。有了泛型,我们就没必要创建StringArrayList、DoubleArrayList等集合了,否则代码量太大,维护起来成本极高。

在Java中,泛型一般有三种使用方式:泛型类,泛型方法和泛型接口类。一般使用尖括号<>来接收泛型参数。

Java泛型类

假如我们自己定义一个支持泛型的MyArrayList,这个列表类可以简单支持初始化和数据写入。只要在类名后面加上<T>就可以让这个类支持泛型,类内部的一些属性和方法都可以使用泛型类型T。当然我们给这个类也可以添加多个泛型参数,比如<K,V>, <T,E,K>等。在类中设置泛型会作用到整个类上。

 public class MyArrayList<T> {

    private int size;
    T[] elements;

    public MyArrayList(int capacity) {
        this.size = capacity;
        this.elements = (T[]) new Object[capacity];
    }

    public void set(T element, int position) {
        elements[position] = element;
    }

    @Override
    public String  toString () {
        String result = "";
        for (int i = 0; i < size; i++) {
            result += elements[i].toString();
        }
        return result;
    }

    public static void main(String[] args){
        MyArrayList<String> strList = new MyArrayList<String>(2);
        strList.set("first", 0);
        strList.set("second", 1);

        System.out.println(strList.toString());
    }
}  

我们也可以从父类中继承并扩展泛型,比如Flink源码中有这样一个类定义,子类继承了父类的T,同时自己增加了泛型KEY:

 public class KeyedStream<T, KEY> extends DataStream<T> {
  ...
}  

Java泛型接口类

Java泛型接口类的定义和Java泛型类基本相同。下面的代码展示了List接口中定义subList方法,该方法截取原来列表的一部分。

 public interface List<E> {
    ...
    public List<E> subList(int fromIndex, int toIndex);
}  

继承并实现这个接口类的代码如下:

 public class ArrayList<E> implements List<E> {
    ...
    public List<E> subList(int fromIndex, int toIndex) {
        subListRangeCheck(fromIndex, toIndex, size);
        return new SubList(this, 0, fromIndex, toIndex);
    }
}  

Java泛型方法

泛型方法可以存在于泛型类(包括接口类)中,也可以存在于普通的类中。

 public class MyArrayList<T> {
    ...
    // public关键字和返回值E之间的<E>表明这是一个泛型方法
    // 泛型方法中的类型E和泛型类中的类型T可以不一样
  public <E> E processElement(E element) {
        ...
        return E;
    }
}  

从上面的代码示例可以看出,public或private关键字和方法返回值之间的尖括号<E>表示这是一个泛型方法。泛型方法的类型E和泛型类中的T可以不一样,或者说,如果泛型方法是泛型类的一个成员,泛型方法既可以继续使用类中的T,也可以自己定义新的类型E。

通配符

除了用 <T>表示泛型外,还有 <?>这种形式。<?> 被称为通配符,用来适应各种不同的泛型。

泛型小结

对Java的泛型总结下来发现,虽然它的语法有时候让人有些眼花缭乱,其本质是为了接受不同的数据类型,增强代码的复用性。

我们可以在一个类里使用多个泛型,每个泛型一般使用大写字母表示。Java为此提供了一些大写字母使用规范:

  1. T 代表一般的任何类。
  2. E 代表元素(Element)或异常(Exception)。
  3. K 代表键(Key)。
  4. V 代表值(Value),通常与K一起配合使用,比如<K, V>。

Java的泛型给开发者提供了不少便利,尤其是保证了底层代码简洁性,因为这些底层代码通常被封装为一个框架,会有各种各样的上层应用调用这些底层代码进行特定的业务处理,每次调用都可能涉及泛型问题。比如,大数据框架Spark和Flink中都需要开发者基于泛型进行数据处理。

以上只对泛型做了一个简单的介绍,实际上在具体使用时还有一些细节需要注意。

类型擦除

Java的泛型有一个遗留问题,那就是类型擦除(Type Erasure)。我们先看一下下面的代码:

 Class<?> strListClass = new ArrayList<String>().getClass();
Class<?> intListClass = new ArrayList<Integer>().getClass();
// 输出:class java.util.ArrayList
System.out.println(strListClass);
// 输出:class java.util.ArrayList
System.out.println(intListClass);
// 输出:true
System.out.println(strListClass.equals(intListClass));  

虽然声明时我们分别使用了String和Integer,但运行时关于泛型的信息被擦除了,我们无法区别strListClass和intListClass这两个类型。这是因为, 泛型信息只存在于代码编译阶段,当程序运行到JVM上时,与泛型相关的信息会被擦除掉 。类型擦除对于绝大多数应用系统开发者来说关系不太大,但是对于一些框架开发者来说,必须要注意。比如,Spark和Flink的开发者都使用了一些办法来解决类型擦除问题,对于API调用者来说,受到的影响不大。

Scala 中的泛型

对Java的泛型有了基本了解后,我们接着来了解一下Scala中的泛型。相比而言,Scala的类型系统更复杂,本文只介绍一些简单语法,帮助读者能够读懂一些源码。

Scala中,泛型放在了中括号[]中。或者我们可以简单地理解为,原来Java的泛型类<T>,现在改为[T]即可。

我们创建一个Stack[T]的泛型类,并实现了两个简单的方法,类中各成员和方法都可以使用泛型T。我们也定义了泛型方法,形如isStackPeekEquals[T],方法中可以使用泛型T。

 object MyStackDemo {

  // Stack泛型类
  class Stack[T] {
   private var elements: List[T] = Nil
   def  push (x: T) { elements = x :: elements }
   def peek: T = elements.head
  }

  // 泛型方法,检查两个Stack顶部是否相同
  def isStackPeekEquals[T](p: Stack[T], q: Stack[T]): Boolean = {
   p.peek == q.peek
  }

  def main(args: Array[String]): Unit = {
    val stack = new Stack[Int]
    stack.push(1)
    stack.push(2)
    println(stack.peek)

    val stack2 = new Stack[Int]
    stack2.push(2)
    val stack3 = new Stack[Int]
    stack3.push(3)
    println(isStackPeekEquals(stack, stack2))
    println(isStackPeekEquals(stack, stack3))
  }
}  

总结

本文简单介绍了Java/Scala的泛型,它允许数据类型是可变,提升了代码的复用性,是很多框架都会采用的技术,开发者非常有必要了解泛型的基本用法。

文章来源:智云一二三科技

文章标题:大数据开发必读:Java/Scala 泛型快速入门教程

文章地址:https://www.zhihuclub.com/196785.shtml

关于作者: 智云科技

热门文章

网站地图