Scala光速入门

2025-08-01 02:40:39

1、变量var声明可变筐毙险裆变量;val声明不可变变量。val声明的不可变变量,不希望数据被改变,RDD内部的数据都是不可变,所以在Spark中一般都是使用val。//下面声明了一个不可变变量result,result的值不可改变。scala> val result=2+10result: Int = 12//假若修改result的值,会提示出错,如下:scala> result=13<console>:8: error: reassignment to val result=13//var声明可变变量:scala> var name="Spark"name: String = Sparkscala> name="Scala"//可以修改变量name的值name: String = Scalascala> name //name的值现在为Scalares4: String = Scala//val声明不可变变量//age被声明为Int类型的不可变变量scala> val age:Int=0age: Int = 0//声明为String类型scala> valname:String=nullname: String = null一行代码声明多个变量scala> val age1,age2,age3=0age1: Int = 0age2: Int = 0age3: Int = 0

2、基本数据类型的自动转换操作Scala自己可以完成基本数据类型的自动转换操作。//输入整数10,按Tab键盘,可以看见它本身的很多方法:scala> 10.totoByte toChar toDouble toFloat toInt toLong toShort toStringscala> 10.toStringres5: String = 10scala> 0.to(5)res6:scala.collection.immutable.Range.Inclusive = Range(0, 1, 2, 3, 4, 5)给了我们一个不可变的集合,获得的结果是:0~5,所以Scala一切皆对象!

3、Scala隐式转换当类型本身没有没有这个方法,但是又需要调用这个方法时,内部就会自动触发隐式转换。刚才的示例中,Int本身没有to这样的方法,Scala引擎内部会隐式自动转换成RichInt,就像上面0.to(5)这样的调用,RichInt对象类型才有to这样的函数。scala> 1+1res7: Int = 2//因为Scala一切皆对象,所以以上示例又可以写成:scala> 1.+(1)res9: Double = 2.0//这个示例,内部其实就是Int的一个隐式转换,+是类的一个方法。//Scala没有++、---操作运算:scala> var age=10age: Int = 10scala> age++<console>:9: error: value ++ is not a member of Int age++ ^//但是++运算可以用下面方式实现:scala> age +=1scala> ageres12: Int = 11

4、求最大、最小值 scala> min(20,4)<console>:8: error: not found: valuemin min(20,4) ^//该示例因为没有导入库,所以出错。scala>import scala.math._ //导入math库importscala.math._scala>min(20,4)res14:Int = 4

5、apply工厂构造实现方法在Spark中,大量的实例的构造都是使用了apply方式。scala> Array(1,2,3,4)res15: Array[Int] = Array(1, 2, 3, 4)scala> val array=Array(1,2,3,4)array: Array[Int] = Array(1, 2, 3, 4)//array是一个声明整数类型的数组变量, 其实内部是自动调用了Array.apply方法,等同如下:scala> val array =Array.apply(1,2,3,4)array: Array[Int] = Array(1, 2, 3, 4)

6、条件控制、循环// if表达式示例:scala> if(age>=18) "成年人" else "小孩"res16: String = 成年人scala> val result=if(age>=18) "成年人"else "小孩"result: String = 成年人scala> resultres17: String = 成年人scala> val result = if(age>=18){ | "adult" | buffered=10 | buffered | }//以上一个代码块,代码块后面有个返回值buffered,代码块的返回值就是最后一行的值。

7、打印值scala> println("Spark") //输出一行字符串并换行Sparkscala> println("\nSpark") //换行,输出一行字符串再换行。\n是换行转义符。Sparkscala> print("Spark")//输出一行字符串,不换行Sparkscala>

8、填充占位符scala>printf("%s是大数据框架的未来", "Spark") //%s是占位符Spark是大数据框架的未来

9、读取内容readLine用于读取输入的内容scala> readLine //此时敲入Scala之后,然后回车res28: String =Scalascala> res28res29: String =Scala//补充说明,readLine是一个方法,如果方法如果没有参数,那么可以不带括号,readLine()跟readLine效果一样。

10、循环//声明一个可变变量,初始值为100scala> var element=100element: Int = 100//while循环示例:scala媪青怍牙> while(element>90){ | println(element) | element -= 1 | }100999897969594939291scala> 0 to elementres32:scala.collection.immutable.Range.Inclusive = Range(0, 1, 2, 3, 4, 5, 6, 7, 8,9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28,29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48,49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68,69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88,89, 90)//for循环遍历并打印scala> for(i<-80 to element)println(i) 8081828384858687888990//循环并增加条件判断scala> for(i<-0 to element ifi%2==0) print(i+" ") 0 2 4 6 8 10 12 14 16 18 20 22 24 26 2830 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 8082 84 86 88 90//for循环,并break退出scala> importscala.util.control.Breaks._ //添加break引用importscala.util.control.Breaks._scala> for(i<-1 to 10){ | if(i==4) break | println(i) | }123scala.util.control.BreakControl//循环,并returnscala> val n=5n: Int = 5scala> def f1:Any = { | for(i <-1 to 10){ | if(i==n) return i | println(i) | } | }f1: Anyscala> f11234res1: Any = 5//解释以上代码块,def是定义一个函数。f1就是一个函数。

11、Scala函数入门实战函数示例函数的定义使用def关键字,并且函数体最后有返回值。//声明了一个函数f3,两个参数:param1是String类型,param2为Int类型。param2默认值为30,因为有了默认值,那么在调用上可以不传param2。scala> deff3(param1:String, param2:Int=30) = param1 + param2f3: (param1: String, param2: Int)String//调用函数f3,传入第一个参数param1值为Spark,没有传入第二个参数,默认为30。scala> f3("Spark")res4: String = Spark30//带名参数调用,即在函数调用时,显示指定参数名,并不按顺序传入。scala> f3(param2=100, param1="Scala")res5: String = Scala100//变长参数, 定义了一个sum函数,参数numbers是变成参数,即传入的Int变量个数不定。在函数体中,对传入的全部Int变量进行循环遍历并累计求和,最后把结果返回。scala> def sum(numbers: Int*)={varresult=0; for(element<-numbers)result +=element; result}sum: (numbers: Int*)Intscala> sum(1,2,3,4,5,6,7,8,9,10)res1: Int = 55//下面示例是一个非常经典的语法scala> sum(1 to 10: _*) // _* 表示提取里面的每个元素,然后作为变长参数传递res3: Int = 55过程——没有返回值的函数就是过程。//这是一个函数scala> def morning(content:String) = "Good" +contentmorning: (content: String)String//这是一个过程scala> def morning(content:String) { println("Good" + content)}morning: (content: String)Unit//强制声明一个过程scala> def morning(content:String):Unit = "Good" + contentmorning: (content: String)Unit声明lazy类型scala> import scala.io.Source._ //导入引用库import scala.io.Source._//声明一个lazy类型的变量content,打开一个不存在的文件。scala> lazy val content = fromFile("/root/txt")content: scala.io.BufferedSource = <lazy>以上示例执行不会出错,表明content变量并没有执行。//如果去掉lazy关键字,那么会出错,提示文件不存在。scala> val content = fromFile("/root/txt")java.io.FileNotFoundException: /root/txt (No such file or directory) at java.io.FileInputStream.open0(NativeMethod) atjava.io.FileInputStream.open(FileInputStream.java:195) atjava.io.FileInputStream.<init>(FileInputStream.java:138)//耗时的操作,在大型分布式系统中,比较常见。声明lazy类型的变量,在需要的时候才去执行。异常//首先导入相关引用包scala> import java.io._import java.io._scala>//示例打开一个存在的文件,使用try…catch捕获异常scala> try{ | val content =fromFile("/root/.bashrc").mkString | }catch{ | //case是一个偏函数 | case _: FileNotFoundException =>println("Oh, file not found!") | }finally{ | println("Ok!") | }Ok!scala>//示例打开一个不存在的文件,使用try…catch捕获异常scala> try{ | val content =fromFile("/root/.bashrc111").mkString | }catch{ | //case是一个偏函数 | case _: FileNotFoundException =>println("Oh, file not found!") | }finally{ | println("Ok!") | }Oh, file not found!Ok!

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢