日韩av手机在线免费观看_四虎免看黄_亚洲一区中文字幕_亚洲小视频网站_国产一区日韩在线_国产欧美精品一区二区

下載吧 - 綠色安全的游戲和軟件下載中心

軟件下載吧

當前位置:軟件下載吧 > 數(shù)據(jù)庫 > MS_SQL > Spark SQL 2.4.8 操作 Dataframe的兩種方式

Spark SQL 2.4.8 操作 Dataframe的兩種方式

時間:2024-02-07 12:09作者:下載吧人氣:22

一、測試數(shù)據(jù)

7369,SMITH,CLERK,7902,1980/12/17,800,20
7499,ALLEN,SALESMAN,7698,1981/2/20,1600,300,30
7521,WARD,SALESMAN,7698,1981/2/22,1250,500,30
7566,JONES,MANAGER,7839,1981/4/2,2975,20
7654,MARTIN,SALESMAN,7698,1981/9/28,1250,1400,30
7698,BLAKE,MANAGER,7839,1981/5/1,2850,30
7782,CLARK,MANAGER,7839,1981/6/9,2450,10
7788,SCOTT,ANALYST,7566,1987/4/19,3000,20
7839,KING,PRESIDENT,1981/11/17,5000,10
7844,TURNER,SALESMAN,7698,1981/9/8,1500,0,30
7876,ADAMS,CLERK,7788,1987/5/23,1100,20
7900,JAMES,CLERK,7698,1981/12/3,9500,30
7902,FORD,ANALYST,7566,1981/12/3,3000,20
7934,MILLER,CLERK,7782,1982/1/23,1300,10

二、創(chuàng)建DataFrame

方式一:DSL方式操作

  • 實例化SparkContext和SparkSession對象
  • 利用StructType類型構建schema,用于定義數(shù)據(jù)的結構信息
  • 通過SparkContext對象讀取文件,生成RDD
  • 將RDD[String]轉換成RDD[Row]
  • 通過SparkSession對象創(chuàng)建dataframe
  • 完整代碼如下:
package com.scala.demo.sql

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.types.{DataType, DataTypes, StructField, StructType}

object Demo01 {
  def main(args: Array[String]): Unit = {
    // 1.創(chuàng)建SparkContext和SparkSession對象
    val sc = new SparkContext(new SparkConf().setAppName("Demo01").setMaster("local[2]"))
    val sparkSession = SparkSession.builder().getOrCreate()

    // 2. 使用StructType來定義Schema
    val mySchema = StructType(List(
      StructField("empno", DataTypes.IntegerType, false),
      StructField("ename", DataTypes.StringType, false),
      StructField("job", DataTypes.StringType, false),
      StructField("mgr", DataTypes.StringType, false),
      StructField("hiredate", DataTypes.StringType, false),
      StructField("sal", DataTypes.IntegerType, false),
      StructField("comm", DataTypes.StringType, false),
      StructField("deptno", DataTypes.IntegerType, false)
    ))
    // 3. 讀取數(shù)據(jù)
    val empRDD = sc.textFile("file:///D:\TestDatas\emp.csv")

    // 4. 將其映射成ROW對象
    val rowRDD = empRDD.map(line => {
      val strings = line.split(",")
      Row(strings(0).toInt, strings(1), strings(2), strings(3), strings(4), strings(5).toInt,strings(6), strings(7).toInt)
    })

    // 5. 創(chuàng)建DataFrame
    val dataFrame = sparkSession.createDataFrame(rowRDD, mySchema)

    // 6. 展示內(nèi)容 DSL
	dataFrame.groupBy("deptno").sum("sal").as("result").sort("sum(sal)").show()
  }
}
標簽MSSQL,SQLServer,技術文檔,數(shù)據(jù)庫,SQLSERVER

相關下載

查看所有評論+

網(wǎng)友評論

網(wǎng)友
您的評論需要經(jīng)過審核才能顯示

熱門閱覽

最新排行

公眾號

主站蜘蛛池模板: 欧美成人精品一区二区三区 | 中文字幕国产精品 | 欧美 日韩 国产 在线 | 国产日韩欧美一区二区 | 久久精品91久久久久久再现 | 99精品国自产在线 | 欧美日韩不卡在线 | 国产精品自产拍在线观看蜜 | 久久久久国产精品免费免费搜索 | 黄色一级大片在线免费看产 | 天天操操操操操 | 免费在线观看成人 | 国产精品国产精品国产专区不片 | 久视频在线 | 国产成人精品一区二区三区四区 | 国产视频1区2区 | 国产在线不卡 | 国产偷录叫床高潮录音 | 亚州精品天堂中文字幕 | 狠狠操狠狠操 | 丝袜美腿一区二区三区 | 丁香婷婷久久久综合精品国产 | 涩涩视频网站在线观看 | 成人三级网址 | 色婷婷久久综合 | 国产精品久久久久久久久久尿 | 欧洲一区在线观看 | 成人毛片视频免费 | 日韩欧美电影在线 | 美国一级黄色片 | 亚洲免费观看视频 | 亚洲男人的天堂网站 | 欧美成人精品激情在线观看 | 中文字幕第一页在线 | 91精品在线观看入口 | 欧美激情一区 | 午夜在线观看视频 | 亚洲 欧美 日韩在线 | 日韩精品一区二区三区在线播放 | 欧美久久久久久久久中文字幕 | a久久|