interview record 0
一轮
Java
- 10亿数取TOPK
Hive SQL - 最近7天连续登陆3天的用户
- 每科排名前3的学生
自我介绍
项目经历
kafka isr集合作用
kafka副本同步机制
kafka如何保证数据不丢失
项目和airflow、dolphinscheduler相比优势是什么?事件驱动,延迟队列(没说出来)
项目设计比较好的地方?延迟队列(没说出来),批处理优化(没说出来),dag运行干预(没说出重点)
依赖上游任务情况下,希望最晚等到几点就开始执行,怎么设计?弱依赖最晚等待时间
java基本数据类型?说的比较混乱
jvm内存模型
类加载器
java垃圾回收算法
jdk11默认的垃圾回收器
hdfs文件读取流程
小文件处理流程
spark提交任务流程
spark为什么比mr快
怎么解决数据倾斜问题
老鼠试毒药最少多少只老鼠可以试出来
二轮
项目经历
画一下项目架构图
DAG存储形式
如何解决成环的问题
项目中遇到的难点问题,怎么解决的?
资产治理平台
怎么定义无效资产的?递归下游存在有效使用
sorted set跳表数据结构
hashmap结构与扩容原理
ck为什么这么快 mpp引擎向量化查询
三轮
职业规划?大数据基架是成本部门,怎么和业务成果挂钩,bi
说一下自己的三个优点和缺点
interview record 0