dcard

Dcard – Machine Learning Backend Engineer 面試紀錄

  • Misc
  • Title: Backend [email protected] Learning Team
  • Interviewer: Bruce(一面)Bruce, Chris, James, Hao cheng / HR Aria(二面)
  • Location: 遠端 Google Meets
  • Date: 2021.5.17 / 2021.06.04

Intro

透過內部的朋友介紹,因為有相關經歷決定投投看,準備的方向是:

  • 一面:

    • 快速刷了一個 leetcode 的線上課程,可以在短時間複習資料結構與演算法,以及歸納好的題目能更好掌握解法
    • 複習了 Redis In Action 如何設計 Twitter 系統的部份
  • 二面:

    • 複習了 DDIA (Design Data Intensive Application) 的批處理與串流處理章節
    • 重讀了 BigQuery 的文件
    • 統整之前做過的專案,找回已經忘記的經驗與知識點
    • 準備主流面試問題的回答

希望這份筆記能幫助到下一位挑戰者~

Questions

  • 一面

    1. 請你自我介紹
    2. 為什麼選擇使用 Kubeflow?
    3. 你設計的事件系統的 qps 多少?
    4. (子題)有沒有做負載測試?
    5. (子題)你設計的事件系統如果超過 BigQuery 的 insert quota,怎麼處理?
    6. 為什麼喜歡容器技術?
    7. 你所建制的 ML 基礎設施是否對團隊帶來實體的幫助?
    8. 你會怎麼實作一個 Set 資料結構?
    9. (子題)如果不用 Dictionary,要怎麼做?
    10. (子題)你使用 BST 的排序只適用 numeric,如果插入不同的 Data Type 要怎麼改?
    11. 如果要你設計一個 API 服務使用者資料,你會怎麼優化效能?
    12. (子題)使用 python lru cache 或連外部的 cache server 有什麼差別?
    13. (子題)如果想要針對快取做統一的設定,怎麼做?
    14. 有什麼問題想問?
  • 二面(HR)

    1. 請你自我介紹
    2. 之前為什麼會做農科院的研究助理?
    3. 為什麼想換工作?
    4. 未來五年生涯規劃?
    5. 有什麼問題想問?
  • 二面(ML Team)

    1. 請你自我介紹
    2. 你設計的事件系統如果造成阻塞,怎麼處理?
    3. 你設計的事件系統怎麼優化串流的速度?
    4. 你導入 ML 生產流程時,有幫 Data Engineer 解決過哪些問題?
    5. ML 生產流程的資源如何規劃?
    6. 如果 Log 量太大,怎麼處理?
    7. 你如何監控系統?
    8. 如果要你蒐集使用者點擊廣告的資料,並能在 1 分鐘內搜尋到結果,要怎麼設計?(白板題)
    9. (子題)如果要縮短時間,要怎麼優化?
    10. (子題)你的解決方案在查詢資料時要 scan,怎麼避免 scan?
    11. 有什麼問題想問?

Read More »Dcard – Machine Learning Backend Engineer 面試紀錄