首页

文章

spark SQL和hive到底什么关系

发布网友 发布时间:2022-03-24 14:25

我来回答

4个回答

热心网友 时间:2022-03-24 15:55

Hive是一种基于HDFS的数据仓库,并且提供了基于SQL模型的,针对存储了大数据的数据仓库,进行分布式交互查询的查询引擎。

SparkSQL并不能完全替代Hive,它替代的是Hive的查询引擎,SparkSQL由于其底层基于Spark自身的基于内存的特点,因此速度是Hive查询引擎的数倍以上,Spark本身是不提供存储的,所以不可能替代Hive作为数据仓库的这个功能。

SparkSQL相较于Hive的另外一个优点,是支持大量不同的数据源,包括hive、json、parquet、jdbc等等。SparkSQL由于身处Spark技术堆栈内,基于RDD来工作,因此可以与Spark的其他组件无缝整合使用,配合起来实现许多复杂的功能。比如SparkSQL支持可以直接针对hdfs文件执行sql语句。

热心网友 时间:2022-03-24 17:13

Spark SQL解决了这两个问题。
第一,Spark SQL在Hive兼容层面仅依赖HQL parser、Hive Metastore和Hive SerDe。也就是说,从HQL被解析成抽象语法树(AST)起,就全部由Spark SQL接管了。执行计划生成和优化都由Catalyst负责。借助Scala的模式匹配等函数式语言特性,利用Catalyst开发执行计划优化策略比Hive要简洁得多。去年Spark summit上Catalyst的作者Michael Armbrust对Catalyst做了一个简要介绍:2013 | Spark Summit。
第二,相对于Shark,由于进一步削减了对Hive的依赖,Spark SQL不再需要自行维护打了patch的Hive分支。Shark后续将全面采用Spark SQL作为引擎,不仅仅是查询优化方面。

热心网友 时间:2022-03-24 18:47

spark SQL和hive到底什么关系
Spark SQL解决了这两个问题。
第一,Spark SQL在Hive兼容层面仅依赖HQL parser、Hive Metastore和Hive SerDe。也就是说,从HQL被解析成抽象语法树(AST)起,就全部由Spark SQL接管了。执行计划生成和优化都由Catalyst负责。借助Scala的模式匹配等函数式语言特性,利用Catalyst开发执行计划优化策略比Hive要简洁得多。去年Spark summit上Catalyst的作者Michael Armbrust对Catalyst做了一个简要介绍:2013 | Spark Summit。
第二,相对于Shark,由于进一步削减了对Hive的依赖,Spark SQL不再需要自行维护打了patch的Hive分支。Shark后续将全面采用Spark SQL作为引擎,不仅仅是查询优化方面。

热心网友 时间:2022-03-24 20:39

历史上存在的原理,以前都是使用hive来构建数据仓库,所以存在大量对hive所管理的数据查询的需求。而hive、shark、sparlSQL都可以进行hive的数据查询。shark是使用了hive的sql语法解析器和优化器,修改了执行器,使之物理执行过程是跑在spark上;而sparkSQL是使用了自身的语法解析器、优化器和执行器,同时sparkSQL还扩展了接口,不单单支持hive数据的查询,可以进行多种数据源的数据查询。
土地入股的定义 ups快递客服电话24小时 贷款记录在征信保留几年? 安徽徽商城有限公司公司简介 安徽省徽商集团新能源股份有限公司基本情况 安徽省徽商集团有限公司经营理念 2019哈尔滨煤气费怎么有税? 快手删除的作品如何恢复 体育理念体育理念 有关体育的格言和理念 什么是体育理念 万里挑一算彩礼还是见面礼 绿萝扦插多少天后发芽 绿萝扦插多久发芽 扦插绿萝多久发芽 炖牛排骨的做法和配料 网络诈骗定罪标准揭秘 “流水不争先”是什么意思? mc中钻石装备怎么做 为什么我的MC里的钻石块是这样的?我想要那种。是不是版本的问题?如果是... 带“偷儿”的诗句 “君不见巴丘古城如培塿”的出处是哪里 带“奈何”的诗句大全(229句) 里翁行()拼音版、注音及读音 带“不虑”的诗句 “鲁肃当年万人守”的出处是哪里 无尘防尘棚 进出口报关流程,越详细越好。谢谢大家指教。 双线桥不是看化合价升多少就标多少的吗?为什么CL2+2KI=2KCL+I2中I失... 出师表高锰酸钾有画面了吗 2021年幼儿园新学期致家长一封信 电脑屏幕一条黑线怎么办? 销售代理商销售代理商的特点 商业代理商业代理的特征 如何看微信有没有开通微众银行 为什么微众没有开户 微众银行怎么开户 微众银行APP开户流程是什么? 唐古拉山海拔唐古拉山海拔是多少 怎么看待取消跳广场舞的人的退休金 如何选购新鲜的蓝田水柿? 恭城水柿柿树作用 创维洗衣机使用教程 创维全自动洗衣机怎么使用 自动开门器 狗羊属相婚姻相配吗 3岁的小孩不会说话怎么办 3岁孩子不会说话,应该挂什么科? 3岁小孩不会说话正常吗 鹿茸炖乌鸡怎么做? 新型冠状肺炎吃什么药可以预防 冰箱上电后一直响 数据集的最基本组成单位是指rdd的什么属性 hadoop,storm和spark的区别,比较 如何把Spark RDD中的内容按行打印出来 请简要描述一下hadoop,spark,mpi三种计算框架的特点以及分别适用于什么样的场景 Storm Spark Hadoop 这三个流行并行计算框架有什么不同 如何学习Spark大数据 如何理解spark中RDD和DataFrame的结构 RDD,DataFrame和DataSet的区别 谈谈RDD,DataFrame,Dataset的区别和各自的优势 为什么vivo手机没有小V vivo小v在哪里打开 oppo r9s怎么部分截屏 oppo r9s 截图功能怎么开启 oppor9s怎么截屏,截屏后怎么发 oppor9s怎么截长屏? oppo r9s如何超级截屏? OPPOR9s这么截屏? OPPOR9s截图怎么截 oppor9s怎么长截屏 oppo r9s怎么截图 Spark RDD,DataFrame和DataSet的区别 大数据技术是学什么的? 大数据专业成热门,该如何转行做大数据分析师 肝硬化晚期救治疗方 rc.conf和rc.local的区别 写秋天的特点的作文 早期的肝硬化可以逆转吗 手机屏幕显示原理是什么? 太阳能电池板可以直接接在蓄电池上给蓄电池充电吗? 太阳能板可以直接给电瓶充电吗 太阳能电池板能给汽车电瓶充电吗?我只有一个太阳能面板,可以直接给电瓶冲吗?需要什么配件吗?? 太阳能板可以直接接电瓶吗? 太阳能电池板能直接给12v电瓶充电吗 太阳能电池板能直接给12v电瓶充电吗? 光伏太阳能板能不能给电瓶充电 太阳能板发的电能给电动车充电吗 12V的太阳能发电板可不可以直接接在12V的电瓶给它充电 太阳能板,能直接给电瓶充电吗? 可以用18V太阳能板直接给12V锂电池充电吗? 太阳能板怎样给电瓶车冲电?
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com