Google 內部數據承認：面試表現與工作績效零相關｜Reskill Lab

Reskill Lab Blog · 職涯資產管理

Google 內部數據承認：面試表現與工作績效零相關

Google 前人資副總裁 Laszlo Bock 公開揭露：腦筋急轉彎和演算法白板題，無法預測任何事情。那外商面試到底在測什麼？

April 2026 · 閱讀時間約 7 分鐘

2015 年，Max Howell 在 Twitter 上寫了一段話，至今仍然是工程師圈子裡最被廣泛轉發的面試故事之一：

「Google：90% 的工程師使用你寫的軟體（Homebrew），但你無法在白板上反轉二元樹，所以滾開。」

Homebrew 是 macOS 上最廣泛使用的套件管理器之一。它的創始人去面試 Google，因為一道白板演算法題被拒了。

這個故事之所以讓人不舒服，不是因為它荒謬 — 而是因為每一個有實力的工程師都在裡面看到了自己的影子。

你可能沒有創造過 Homebrew。但你可能有過類似的經驗：你的技術實力不差，甚至在某些領域比面試你的人還強。但因為你在一個限時、高壓、跟真實工作完全無關的白板環境下表現不好，你就被篩掉了。

問題是：那個篩選機制，真的有效嗎？

Google 自己的數據說：沒有

Google 前人力營運資深副總裁 Laszlo Bock 在 2013 年公開揭露了一份內部分析的結果：在分析了數以萬計的面試資料後，他們發現腦筋急轉彎與演算法白板題，與候選人入職後的實際工作績效之間的相關性是 : 零。

Bock 在接受紐約時報訪問時直言：「這些問題完全是浪費時間。它們無法預測任何事情。唯一的功用是讓面試官覺得自己很聰明。」

這不是某個教練或顧問的觀點。這是 Google 自己承認的。

白板面試測量的是什麼？焦慮

如果白板題不能預測工作表現，那它到底在測量什麼？

North Carolina State University 在 2020 年發表的一項研究給出了答案：傳統的技術面試帶來的壓力，會讓候選人的表現僅僅因為「被觀看」就下降超過 50%。

研究的結論是：白板面試測量的不是程式設計能力，而是「表演焦慮」。

你在一個限時的、有人在旁邊盯著你的環境裡，被要求解一道跟你真實工作幾乎沒有關係的題目。你的表現主要取決於你多擅長「在壓力下表演」，而不是你多擅長「做工程」。

我在 Arm 和 Intel 做 Hiring Manager 的時候，親眼見過這種情況太多次了。有一次，一位極資深的工程師在白板前緊張到連 for-loop 都寫錯。但我後來讓他坐下來，用紙筆畫他做過的系統——半小時後，他畫出了我見過最清楚的架構圖之一。

白板題判定他「不合格」。但他在真實工作中解決的問題，比大多數通過白板題的人都複雜得多。

不同面試方式的預測效度

那什麼樣的面試方式能真正預測工作表現？數據告訴我們：

面試方式	與工作績效的相關係數	意義
非結構化面試（閒聊型）	r = 0.20 – 0.38	幾乎沒有預測力
演算法白板題	≈ 0（Google 數據）	零預測力
Take-Home 實作測試	r = 0.62	強預測力
程式碼品質 vs 可維護性	r = 0.67	最強預測力

數據來源：McDaniel et al. (1994) 面試效度元分析、Google 內部數據（Bock, 2013）、IEEE Software Journal (2023) Take-Home 測試研究。

模式很清楚：越接近真實工作情境的測試，預測力越強。越遠離真實情境的測試（白板題），預測力越低。

LeetCode 獎勵的是「在封閉環境中找到單一最優解」的能力。但真實的工程工作充滿模糊性、妥協和跨部門溝通。這兩者之間的距離，就是面試結果和工作表現之間零相關的原因。

那外商面試到底在測什麼？

如果你理解了「白板題不能預測工作表現」，下一個問題自然就是：那什麼能？

Microsoft Research 在 2019 年發表的一份研究報告指出，高效能的工程師有兩個關鍵特徵：

第一，能處理模糊性。在有限的資訊和不完整的需求下，能獨立判斷該做什麼、不該做什麼。

第二，能避免分析癱瘓。知道什麼時候該停止分析、開始行動。不是追求完美方案，而是在限制條件下交付「夠好」的方案。

這兩個能力，白板題完全測不出來。白板題的環境恰恰相反 – 任何題目是精確定義的、有唯一最優解的、不需要跟任何人溝通的。

而在真實面試中（不是白板環節，而是 behavioral 和 system design 環節），好的 Hiring Manager 在聽的就是這兩件事：你能不能在模糊中做判斷？你做判斷的邏輯是什麼？

（如果你想更詳細了解 Hiring Manager 在面試的每一分鐘到底在評估什麼，我在另一篇文章裡用了三個場景做了詳細拆解：外商面試官真正在聽什麼: 來自一個做了十年 Hiring Manager 的人）

這對你意味著什麼？

你不需要刷更多 LeetCode。你需要改變你準備面試的方式。

具體來說：

停止把所有準備時間花在演算法題上。演算法是基本功，你需要會，但它不是決定你是否拿到 offer 的因素。數據已經告訴我們了 — 面試官最終的判斷，跟你的白板表現幾乎無關。

把更多時間花在準備你的「判斷力故事」。找出你工作中做過的三到五個真實決策 — 你面對了什麼模糊的情境、你有哪些選項、你為什麼選了這個、結果對公司有什麼影響。這些才是 behavioral interview 和 system design interview 的核心。

（如果你不確定怎麼把你的工程經歷轉換成 Hiring Manager 聽得懂的語言，這篇有三個真實案例的 before/after：同一段經歷，兩種寫法：為什麼一個拿到面試、一個石沉大海）

理解你被拒的真正原因。如果你曾經技術沒問題卻被拒，原因很可能不是「你不夠強」，而是「你用了錯誤的語言」。面試官的大腦在前 30 秒就會把你分類為 Worker 或 Architect 而這個分類幾乎完全取決於你說話的角度，不是你說話的內容。

（為什麼技術最強的人反而最容易被低估？這篇有結構性的解釋：為什麼解了 1000 個 Bug 的人，薪水反而最低？）

而在面試之前，還有一個更基本的問題：你的履歷有沒有通過 ATS 的第一關？如果連面試機會都沒拿到，準備再多故事也沒用。（你的履歷在外商 ATS 的第一秒發生了什麼事）

一個簡單的自我檢測

回想你最近一次面試（或模擬面試）。你花了多少時間準備演算法題，又花了多少時間準備你的「判斷力故事」？

如果比例是 80% 演算法、20% 故事 — 你正在把大部分時間花在 Google 自己承認「無法預測任何事情」的環節上。

翻轉這個比例。把 80% 的時間花在整理你的決策經歷、練習用商業語言描述它們。把 20% 留給演算法基本功。

這不是一個激進的建議。這只是把你的準備時間分配到數據告訴我們真正有效的地方。

參考資料

Laszlo Bock (2013). “On GPAs and Brain Teasers: New Insights From Google on Recruiting and Hiring.” 揭露 Google 內部數據顯示面試與績效的零相關性。LinkedIn

NC State University (2020). “Tech Sector Job Interviews Assess Anxiety, Not Software Skills.” 研究發現白板面試導致表現下降超過 50%。NC State News

McDaniel et al. (1994). “The Validity of Employment Interviews: A Comprehensive Review and Meta-Analysis.” 非結構化面試效度 r = 0.20-0.38。PDF

IEEE Software Journal (2023). Take-Home 編程測試與首年績效評估的相關性 r = 0.62。Analysis

Microsoft Research (2019). “What Predicts Software Developer Productivity?” 高效能工程師的關鍵特徵：處理模糊性與避免分析癱瘓。Microsoft Research

面試系統是有缺陷的——但你還是得通過它。關鍵是：把你的準備時間花在數據告訴我們真正有效的地方。如果你想看到完整的分析 : Hiring Manager 真正在評估的四個維度、工程語言和商業語言的具體差距、以及我們的 E2B 轉譯框架 — 我們把它寫成了一份完整報告。

免費下載《2026 科技菁英錯價報告》→

Paul Yang

Founder, Reskill Lab · 前 Arm/Intel/Microsoft 技術主管

Google 內部數據承認：面試表現與工作績效零相關

Google 自己的數據說：沒有

白板面試測量的是什麼？焦慮

不同面試方式的預測效度

那外商面試到底在測什麼？

這對你意味著什麼？

一個簡單的自我檢測

參考資料

Stop Rejecting Your Best Engineers

為什麼解了 1000 個 Bug 的人，薪水反而最低？

外商面試官真正在聽什麼 : 來自一個做了十年 Hiring Manager 的人

你的履歷在外商 ATS 的第一秒發生了什麼事

發佈留言取消回覆

資源

接受所有主流信用卡

Google 內部數據承認：面試表現與工作績效零相關

Google 自己的數據說：沒有

白板面試測量的是什麼？焦慮

不同面試方式的預測效度

那外商面試到底在測什麼？

這對你意味著什麼？

一個簡單的自我檢測

參考資料

Similar Posts

發佈留言 取消回覆

資源

接受所有主流信用卡

發佈留言取消回覆