interview record 0

一轮

Java

  1. 10亿数取TOPK
    Hive SQL
  2. 最近7天连续登陆3天的用户
  3. 每科排名前3的学生
    自我介绍
    项目经历
    kafka isr集合作用
    kafka副本同步机制
    kafka如何保证数据不丢失
    项目和airflow、dolphinscheduler相比优势是什么?事件驱动,延迟队列(没说出来)
    项目设计比较好的地方?延迟队列(没说出来),批处理优化(没说出来),dag运行干预(没说出重点)
    依赖上游任务情况下,希望最晚等到几点就开始执行,怎么设计?弱依赖最晚等待时间
    java基本数据类型?说的比较混乱
    jvm内存模型
    类加载器
    java垃圾回收算法
    jdk11默认的垃圾回收器
    hdfs文件读取流程
    小文件处理流程
    spark提交任务流程
    spark为什么比mr快
    怎么解决数据倾斜问题
    老鼠试毒药最少多少只老鼠可以试出来

二轮

项目经历
画一下项目架构图
DAG存储形式
如何解决成环的问题
项目中遇到的难点问题,怎么解决的?
资产治理平台
怎么定义无效资产的?递归下游存在有效使用
sorted set跳表数据结构
hashmap结构与扩容原理
ck为什么这么快 mpp引擎向量化查询

三轮

职业规划?大数据基架是成本部门,怎么和业务成果挂钩,bi
说一下自己的三个优点和缺点

作者

jszero

发布于

2025-05-19

更新于

2025-08-09

许可协议

评论