面试系列-各种组件问一下(二)

这篇具有很好参考价值的文章主要介绍了面试系列-各种组件问一下(二)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

欢迎大家对答案进行补充、勘误,可以私信或者文章底部评论

1、spark宽窄依赖区分
    宽依赖:是指一个父RDD分区对应多个子RDD的分区,比如map、filter等算子
    窄依赖:是指多个父RDD分区对应一个子RDD分区,比如groupByKey,reduceByKey等算子,会产生shuffler操作
    区分:可以通过stage划分,stage是根据是否产生shuffle(宽依赖)操作,将前后划分成2个stage
2、hbase元数据、数据写入
3、hdfs读写原理
4、hive内部表、外部表区别
    a.建表时外部表会多一个external关键字
    b.删除表时,内部表的原始数据、元数据全删,而外部表只删除外部表
5、hive分区与分桶区别
    a.从表现形式上:分区是目录形式,分桶是文件形式
    b.从建表语句上:分区是使用partitioned by指定,分桶是clustered by指定
    c.从作用上:分区是避免全表扫描,分桶是提高查询效率
6、hive为什么要分桶
    a. 获得更高的查询处理效率
    b. 使取样效率更高
7、kafka数据倾斜怎么处理
    a.在设计数据写入时,需要考虑key是否会重复
    b.如果数据确实发生了不均匀,需要重新增加随机前缀将数据重新分区
8、kafka如何保证数据一致性
    a.从生产者角度看:可以设置acks=-1,保证不丢数据
    b.kafka是有事务的,可以开启幂等性,保证了发送重复数据时,broker都指挥持久化一条,保证了数据不重复
    c.从消费者角度看:可以手动提交offset,保证数据不重复消费
9、flink水位介绍一下
    a.watermark是衡量event time的机制,可以理解为逻辑始终
    b.watermark是和窗口一起使用,触发窗口计算,用于处理迟到数据
10、hbase的rowkey设计原则有哪些
    a.rowkey长度原则
    b.rowkey散列原则
    c.rowkey唯一原则
11、clickhouse用过哪些组件
    a.replacingMergeTree引擎会根据主键去重
12、hbase中hmaster作用
    a.管理元数据
    b.接受用户的命令请求
    c.负责监控集群中所有的regionserver,进行负载均衡、故障转移和region的拆分
13、hbase中region server的作用   
    a.负责数据cell的处理,比如数据写入和查询
    b.拆分和合并region的执行
14、介绍下region
    a.region是Hbase数据管理的基本单位
    
15、hdfs数据块损坏怎么处理?
    a.检查数据块丢失情况
    b.修复指定路径的hdfs文件
    
    
    文章来源地址https://www.toymoban.com/news/detail-427708.html

到了这里,关于面试系列-各种组件问一下(二)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Android快速入门-----用户界面(上)UI组件(1),附面试答案

    @Override public void onCheckedChanged(CompoundButton buttonView, boolean isChecked) { if(isChecked){ // 提示 Toast.makeText(SimpleComponActivity.this, cd_simple_pingpang.getText().toString(), 0).show(); } } }); cd_simple_foot.setOnCheckedChangeListener(new CompoundButton.OnCheckedChangeListener() { @Override public void onCheckedChanged(CompoundButton but

    2024年04月25日
    浏览(50)
  • 给大家科普一下什么是APN及配置方法

    欢迎来到东用知识小课堂,今天东东来给大家简单科普一下APN以及它在路由器上面的配置方法 APN(Access Point Name)指一种网络接入技术,它决定了手机通过哪种接入方式来进行拨号。在拨号上网时这些参数都是必须设置的,比如你平时在通过手机上网或在家有线上网时,都需

    2024年02月12日
    浏览(33)
  • 马上五一了,带大家玩一下五子棋——C语言

    因为这篇博文实在五一这天完成的,所以呢,在介绍五子棋之前,先祝各位支持小白的大佬都五一快乐! 花了点时间下了个“五一快乐”的五子棋,哈哈哈哈哈哈,还不太熟练,所以写的有点丑,勉强过的去就行,不知道佬们看不看得出来,还是说实在一点都不像,不过没关

    2024年02月02日
    浏览(35)
  • 和大家分享一下学习清风老师的数学建模课的过程

    作为一名大一数学系的新生,就读于某中上游985大学,为了锻炼自己的能力和为以后保研做准备,所以想参加数学建模大赛,于是便早早的组好了队友,想着早起的鸟儿有虫吃,起初是在学长学姐的建议下买了司守奎老师的《数学建模算法与应用》想着看书自学大干一番,可

    2024年04月25日
    浏览(32)
  • 今天给大家介绍一下华为智选手机与华为手机的区别

    华为智选手机是由华为品牌方与其他公司合作推出的手机产品,虽然其机身上没有“华为”标识,但是其品质和技术水平都是由华为来保证的。这些手机在制造、设计和使用方面都采用了华为的相关技术和标准,因此可以享受到和华为旗舰手机相同的优质使用体验。    目前

    2024年02月09日
    浏览(51)
  • 今天跟大家好好介绍一下接口工具(jmeter、postman、swagger等)

    一、接口都有哪些类型? 接口一般分为两种:1.程序内部的接口 2.系统对外的接口 系统对外的接口:比如你要从别的网站或服务器上获取资源或信息,别人肯定不会把 数据库共享给你,他只能给你提供一个他们写好的方法来获取数据,你引用他提供的接口就能使用他写好的

    2024年02月05日
    浏览(54)
  • 做程序员累了想要转行?我想给大家分享一下看法

    今天早上起床时,我看到有粉丝评论说关于程序员的话题,如果做着觉得累了,就会觉得自己不适合这个工作,想转行。我想给大家分享一下我的看法。 在我刚开始工作时,有人说我不适合做这个工作,但是我坚持了下来,做了3年。一开始,我学习的专业技术上还可以,但

    2023年04月19日
    浏览(45)
  • 作为一名普通的java程序员,我想和大家分享一下4年来的工作内容

    我是16届毕业生,我的第一份工作是做外包,第一年的时间里测试偏多,比如用Excel文档生成测试代码进行单元测试,也会写一些简单的增删改查,以及用shell处理数据,还有一些纯测试的工作,比如点页面啊截图。到了第二年,开发的工作也变得多了一些,但大部分还是增删

    2024年02月05日
    浏览(53)
  • 50个最受欢迎的大数据面试问题

    大数据时代才刚刚开始。随着越来越多的公司倾向于大数据来运营他们的业务,对人才的需求空前高涨。这对您意味着什么?如果您想在任何大数据岗位上工作,它只会转化为更好的机会。您可以选择成为数据分析师,数据科学家,数据库管理员,大数据工程师,Hadoop大数据

    2023年04月14日
    浏览(43)
  • 记录-因为写不出拖拽移动效果,我恶补了一下Dom中的各种距离

    最近在项目中要实现一个拖拽头像的移动效果,一直对JS Dom拖拽这一块不太熟悉,甚至在网上找一个示例,都看得云里雾里的,发现遇到最大的拦路虎就是JS Dom各种各样的距离,让人头晕眼花,看到一个距离属性,大脑中的印象极其模糊,如同有一团雾一样,不知其确切含义

    2023年04月25日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包