您的位置 首页 java

详解大数据Scala,懂行情的都已收藏

在给大家分享之前,小编有常看到大家询问有没有一个学习交流的基地什么的,在这里就给大家推荐一下交流群吧,里面都是一群热爱并在学习大数据&架构的小伙伴们,只要自己主动,一般问题都可以得到解决,特别喜欢看到这种大家一起交流解决难题的氛围,希望也可以给到你些帮助。大数据&架构群:489034603

scala 具有很完整又很强大的集合处理能力,准确而言是现代语言中最有优势的一个。Scala拥有庞大而完整的集合类库,比如Set, List, Vector, Tuple, Map,而有效的泛型能让你肆意组合这些类型得到新的类型,比如像这样的类别:List[Map[String, (Int, List[String)]]],这是一个 链表 ,每个链表元素是一个映射,映射中用字符做key,另一个Tuple 元组 做value(值)这个元组的第一个元素是整数,第二个元素是一个链表,这样的集合在其他语言中不是不可以做到,但很难,想想在Java中定义个三元数组有多么令人恶心,并且让人难以直观理解:

ArrayList<ArrayList<ArrayList<Integer>>>,并且Java还不支持元组的表达。Scala不仅有函数式语言对集合处理的先天优势:map, fold, zip, foreach, collect, filter等等,还有OOP面向对象语言的辅助函数(比如take(5)可以取得前五个元素,takeRight(5)是最后五个),这点上完虐Lisp或者 Haskell 这些也许在函数式表达上胜过Scala,但在简单省事以及有工业产出(Industrialized)能力上完全比不上Scala的语言。Scala对集合预制的辅助方法(Helper functions)数量之多甚至超过了Java。同时Scala还提供immutable(不可变)结构与mutable(可变)结构,让程序员可以在命令式与函数式中自由切换。

1、什么是Scala

Scala是一种相对较新的语言,是一种多范式的编程语言,类似于java的编程,但是我们认为最有意义的是,不要把Scala看做是改进的Java,而是把它作为一门新的语言。所以这里不会介绍Java的使用经验,而将聚焦在解释器和“对象-函数式”的风格,以及特别强调可维护性,清晰的表达,和利用类型系统的优势。

2、为什么选择 Scala?

  • 表达能力

  • 函数是一等公民

  • 闭包

  • 简洁

  • 类型推断

  • 函数创建的文法支持

  • Java互操作性

  • 可重用Java库

  • 可重用Java工具

  • 没有性能惩罚

Scala 如何工作?

  • 编译成Java字节码

  • 可在任何标准 JVM 上运行

  • 甚至是一些不规范的JVM上,如Dalvik

  • Scala编译器是Java编译器的作者写的

用 Scala 思考

Scala不仅仅是更好的Java。你应该用全新的头脑来学习它。

启动解释器

使用自带的 sbt console 启动。

$ sbt console 

表达式

scala> 1 + 1 

res0是解释器自动创建的变量名称,用来指代表达式的计算结果。它是Int类型,值为2。

Scala中(几乎)一切都是表达式。

你可以给一个表达式的结果起个名字赋成一个不变量(val)。

scala> val two = 1 + 1 

你不能改变这个不变量的值.

变量

如果你需要修改这个名称和结果的绑定,可以选择使用 var

scala> var name = "steve" 

函数

你可以使用def创建函数.

scala> def addOne(m: Int): Int = m + 1 

在Scala中,你需要为函数参数指定类型签名。

scala> val three = addOne(2) 

如果函数不带参数,你可以不写括号。

scala> def three() = 1 + 2 

匿名函数

你可以创建匿名函数。

scala> (x: Int) => x + 1 

这个函数为名为x的Int变量加1。

scala> res2(1) 

你可以传递匿名函数,或将其保存成不变量。

scala> val addOne = (x: Int) => x + 1 

如果你的函数有很多表达式,可以使用{}来格式化代码,使之易读。

def timesTwo(i: Int): Int = { 

对匿名函数也是这样的。

scala> { i: Int => 

在将一个匿名函数作为参数进行传递时,这个语法会经常被用到。

部分应用(Partial application)

你可以使用下划线“_”部分应用一个函数,结果将得到另一个函数。Scala使用下划线表示不同上下文中的不同事物,你通常可以把它看作是一个没有命名的神奇通配符。在 { _ + 2 } 的上下文中,它代表一个匿名参数。你可以这样使用它:

scala> def adder(m: Int, n: Int) = m + n 
scala> val add2 = adder(2, _:Int) 

你可以部分应用参数列表中的任意参数,而不仅仅是最后一个。

柯里化函数

有时会有这样的需求:允许别人一会在你的函数上应用一些参数,然后又应用另外的一些参数。

例如一个乘法函数,在一个场景需要选择乘数,而另一个场景需要选择被乘数。

scala> def  multiply (m: Int)(n: Int): Int = m * n 

你可以直接传入两个参数。

scala> multiply(2)(3) 

你可以填上第一个参数并且部分应用第二个参数。

scala> val timesTwo = multiply(2) _ 

你可以对任何多参数函数执行柯里化。例如之前的 adder 函数

scala> (adder _).curried 

可变长度参数

这是一个特殊的语法,可以向方法传入任意多个同类型的参数。例如要在多个字符串上执行String的 capitalize 函数,可以这样写:

def capitalizeAll(args: String*) = { 

scala> class Calculator { 

上面的例子展示了如何在类中用def定义方法和用val定义字段值。方法就是可以访问类的状态的函数。

构造函数

构造函数不是特殊的方法,他们是除了类的方法定义之外的代码。让我们扩展计算器的例子,增加一个构造函数参数,并用它来初始化内部状态。

class Calculator(brand: String) { 

注意两种不同风格的注释。

你可以使用构造函数来构造一个实例:

scala> val calc = new Calculator("HP") 

表达式

上文的Calculator例子说明了Scala是如何面向表达式的。颜色的值就是绑定在一个if/else表达式上的。Scala是高度面向表达式的:大多数东西都是表达式而非指令。

旁白: 函数 vs 方法

函数和方法在很大程度上是可以互换的。由于函数和方法是如此的相似,你可能都不知道你调用的东西是一个函数还是一个方法。而当真正碰到的方法和函数之间的差异的时候,你可能会感到困惑。

scala> class C { 

当你可以调用一个不带括号的“函数”,但是对另一个却必须加上括号的时候,你可能会想哎呀,我还以为自己知道Scala是怎么工作的呢。也许他们有时需要括号?你可能以为自己用的是函数,但实际使用的是方法。

在实践中,即使不理解方法和函数上的区别,你也可以用Scala做伟大的事情。如果你是Scala新手,而且在读两者的差异解释,你可能会跟不上。不过这并不意味着你在使用Scala上有麻烦。它只是意味着函数和方法之间的差异是很微妙的,只有深入语言内部才能清楚理解它。

继承

class ScientificCalculator(brand: String) extends Calculator(brand) { 

参考 Effective Scala 指出如果子类与父类实际上没有区别,类型别名是优于 继承 的。A Tour of Scala 详细介绍了子类化。

重载方法

class EvenMoreScientificCalculator(brand: String) extends ScientificCalculator(brand) { 

抽象类

你可以定义一个抽象类,它定义了一些方法但没有实现它们。取而代之是由扩展抽象类的子类定义这些方法。你不能创建抽象类的实例。

scala> abstract class Shape { 

特质(Traits)

特质 是一些字段和行为的集合,可以扩展或混入(mixin)你的类中。

trait Car { 
class BMW extends Car { 

通过 with 关键字,一个类可以扩展多个特质:

class BMW extends Car with Shiny { 

参考 Effective Scala 对特质的观点。

什么时候应该使用特质而不是抽象类? 如果你想定义一个类似接口的类型,你可能会在特质和抽象类之间难以取舍。这两种形式都可以让你定义一个类型的一些行为,并要求继承者定义一些其他行为。一些经验法则:

  • 优先使用特质。一个类扩展多个特质是很方便的,但却只能扩展一个抽象类。

  • 如果你需要构造函数参数,使用抽象类。因为抽象类可以定义带参数的构造函数,而特质不行。例如,你不能说 trait t(i: Int) {} ,参数 i 是非法的。

你不是问这个问题的第一人。可以查看更全面的答案: stackoverflow: Scala特质 vs 抽象类 , 抽象类和特质的区别, and Scala编程: 用特质,还是不用特质?

类型

此前,我们定义了一个函数的参数为 Int ,表示输入是一个数字类型。其实函数也可以是泛型的,来适用于所有类型。当这种情况发生时,你会看到用方括号语法引入的类型参数。下面的例子展示了一个使用泛型键和值的缓存。

trait Cache[K, V] { 

方法也可以引入类型参数。

def remove[K](key: K) 

文章来源:智云一二三科技

文章标题:详解大数据Scala,懂行情的都已收藏

文章地址:https://www.zhihuclub.com/191987.shtml

关于作者: 智云科技

热门文章

网站地图