Google 內部數據承認:「面試與績效零相關。」

一個前 Intel/MSFT/Arm 總監的分析:你不是不夠好,你是被一個「測量焦慮」的錯誤系統刷掉了。

📊 數據有依據: 本文所有敘事與數據皆有出處,點此檢視完整參考文獻

你是否也錯殺了你的 Homebrew 創辦人?

“Google:90% 的工程師使用你寫的軟體(Homebrew),但你無法在白板上反轉二元樹,所以滾開。”

這是 Max Howell,Homebrew 套件管理器的創始人,在面試 Google 時的真實諷刺經歷 [R1]。在我於Intel, MSFT 跟 Arm 超過 15 年的生涯中,這種荒謬的「錯殺」屢見不鮮。

這個案例之所以刺耳,是因為它精準地戳破了你的共同挫折:為什麼你明明實力堅強,卻總是被一個荒謬的白板題刷掉?

rejecting the A-level problem-solvers


Fig. 1: rejecting the A-level problem-solvers we desperately need?

你,一個潛在的 A 級人才,很可能正因為一個與績效零相關的白板題,而讓你付出高昂的「錯殺成本」— 你錯失了本該屬於你的機會。而企業因為錯殺你而支付的代價,遠比他們想像的更昂貴 [KRQ-1]。

1

診斷失靈:「演算法」篩選器,為何只會測量焦慮而非實力?

我們陷入了一個集體迷思:相信「解謎能力」等於「工程實戰力」。

我在外商的 15 年間,我們早就懷疑『聰明的謎題』根本篩不出好工程師。而 Google 後來的內部數據,完美證實了我們的懷疑:前人力營運資深副總裁 Laszlo Bock 公開揭露,在分析了數以萬計的面試數據後,這類問題與候選人的實際工作績效之間,顯示的相關性為「零」[P1]。

Bock 直言,這類問題「完全是浪費時間」,它們「無法預測任何事情」,唯一的功用是「讓面試官感覺聰明而已」。

They serve primarily to make the interviewer feel smart


Fig. 2: They serve primarily to make the interviewer feel smart

為什麼?因為 LeetCode 測驗的是在「完美、封閉環境中」找到「單一最優解」的能力。更糟的是,這根本是錯誤的測量儀器。NC State 的研究證實,傳統技術面試帶來的壓力,會讓候選人的表現僅僅因為「被觀看」,就驟降超過 50%。

這揭示了白板面試測量的根本不是編程能力,而是「表演焦慮」[KRQ-3]。

我還記得有一次,我面試一位極度資深的工程師,他在白板前緊張到發抖,連一個簡單的 for-loop 都寫錯。但我把他拉到旁邊的會議室,只給他紙筆,半小時後,他畫出了一套我見過最優雅的系統。

Anxiety


Fig. 3: Anxiety

而真正的戰場需要的是什麼?關鍵在於「處理模糊性 (Handling ambiguity)」。根據 Microsoft Research 的診斷 [P2],這意味著高效能工程師必須同時具備「自立 (Self-reliant)」— 在有限指導下獨立解決複雜問題——以及「執行力 (Executes; no analysis paralysis)」,知道何時該停止分析、開始行動,以避免陷入「分析癱瘓」。

LeetCode 獎勵的是「分析癱瘓」前的完美解;而真實世界獎勵的是在模糊中「避免分析癱瘓」並交付成果的執行力。這證實了這個機制不是在篩選「實戰者」,而是在獎勵「解謎演員」。

看到這裡,你是否也開始反思自己過去的面試準備方式?

別擔心,這正是轉變的開始。在文章最後,我會提供一個機會,讓我親自帶你檢視你的專案故事

2

用「實戰力鑑別」取代「演算法劇場」

我的建議是:停止用「演算法劇場」來篩選人才。我們需要的不是「演員」,而是「職人(Craftsman)」

Actor vs. Craftsman


Fig. 4: Actor vs. Craftsman

我提倡的解決方案,是轉向模擬真實工作情境的「實戰力鑑別」。數據的對比是震撼的。傳統的「非結構化面試」,其預測效度低得可憐,相關係數僅有 r = 0.20-0.38 [KRQ-2]。

然而,根據 2023 年 IEEE Software Journal 的研究 [S2], 一旦轉向採用「Take-Home 編程測試」一種非同步、模擬真實專案的鑑別方式 — 其結果與候選人的「首年績效評估」的相關性便飆升至 r = 0.62

這對我來說一點也不意外。因為後者(Take-Home)測量的是『工藝 (Craft)』,而前者(LeetCode)測量的只是『記憶 (Memory)』。

該研究甚至發現,程式碼品質指標與「可維護的生產程式碼」相關性高達 r = 0.67 [S1]。

這向我證實了:越接近實際工作情境的測驗,預測力越強。我所建立的鑑別模型的核心,就是「非同步項目」、「Debugging 挑戰」與「權衡對話」。

這些機制之所以有效,是因為它們刻意模擬了真實工作中的「不確定性」、「模糊需求」和「溝通成本」,迫使候選人走出白板的真空環境,真正展示他們在壓力下的「權衡決策能力」與「工程心態」,這才是「Ownership」的真實樣貌。

來自 Reskill Lab, Paul Yang 的 90 秒訊息

在我們深入探討之前,我想先用這 90 秒的影片,快速為您拆解核心觀念 – 為什麼頂尖外商要的不是「完美的英文」,而是「清晰的思考結構」。

3

找回「錯殺成本」:打造高 Ownership 的工程團隊

這對你意味著什麼?這意味著你不必再玩這場「記憶」遊戲。你的時間應該花在打造「工藝 (Craft)」,而不是刷題。

這套機制篩選出的,是那些「知道『做事』和『正確做事』區別」的人。他們「不走捷徑」,對自己的產出感到自豪。更關鍵的是,他們在程式碼 commit 後「不會停止關心」,會將 Ownership 延伸到部署和維護。

這,就是我定義的 A 級人才。

A-Player definition


Fig. 5: A-Player definition

這才是你真正的 ROI:證明你的價值不必通過「解謎」,而是通過交付「高維護性的程式碼」。當你遇到一個懂得用「實戰鑑別」的面試官(像我)時,你就會立刻勝出。

4

你的「鑑別機制」正在為你工作,還是在反噬你?

我的核心信念是:企業最大的招募成本不是「錯招 (False Positives)」,而是「錯殺 (False Negatives)」

作為一個「實戰者」,你的挑戰不是去背誦答案,而是去找到「能鑑別你實戰力」的舞台。

你是否也曾是「Max Howell」?你是否也因為一個爛問題,而錯失一個好機會?

歡迎在評論區分享你的故事。Reskill Lab 的使命,就是幫助像你一樣的 A 級人才,停止被「錯殺」,並拿回你應得的價值。

5

下一步,選擇最適合你的路徑

這篇文章為你揭示了外商面試的「隱藏規則」。當你準備好將這些理論轉化為行動時,這裡有三種方式可以幫助你:

🧠

適合想優化履歷、持續學習的你

領取免費《科技業履歷斷捨離清單》& 加入電子報

立即下載涵蓋 15 項關鍵檢查點的實戰清單,搞定 AI 與人資篩選。訂閱後,你將持續收到更多將「減分項」變「加分項」的深度技巧。

👉 立即訂閱,保持領先
📝

適合想立刻動手、應用於實戰的你

下載免費的「STAR 原則面試準備清單」

我將本文的精華濃縮成一份可立即使用的 PDF 清單,幫助你系統化梳理專案經歷,確保面試中能清晰展現價值。

👉 免費下載實戰清單
🚀

適合尋求最快路徑、渴望專家反饋的你

預約 1:1 線上影響力溝通診斷

理論是基礎,但個人化的反饋是讓你實現躍遷的火箭。30 分鐘內,我會親自為你分析回答盲點,給你一套能立即改善的行動方案。

👉 預約我的 30 分鐘 (早鳥價 NT$390)
📚

Reference

主要引用來源

  • [R1] 共鳴數據/洞察: “Max Howell (Homebrew 創始人) 的諷刺案例: 「Google:90% 的工程師使用你寫的軟體(Homebrew),但你無法在白板上反轉二元樹,所以滾開。」 閱讀來源 [https://www.quora.com/Whats-the-logic-behind-Google-rejecting-Max-Howell-the-author-of-Homebrew-for-not-being-able-to-invert-a-binary-tree]
  • [KRQ-1] Brian Acton 的故事是矽谷史上最著名的錯殺人才案例 。它可能會讓招聘人員和招聘經理感到擔憂。 閱讀文章 [https://medium.com/better-programming/why-software-companies-often-reject-awesome-programmers-38bea2ca3cc7]
  • [P1] 機制揭秘: “Google 數據: 腦筋急轉彎與工作績效之間顯示 零相關性” LinkedIn Business Insider [https://www.linkedin.com/pulse/20130620142512-35894743-on-gpas-and-brain-teasers-new-insights-from-google-on-recruiting-and-hiring] [https://www.businessinsider.com/google-brain-teaser-interview-questions-dont-work-2015-10]
  • [KRQ-2] 非結構化面試:相關係數 r = 0.20-0.38, The Validity of Employment Interviews: A Comprehensive Review and Meta-Analysis 閱讀報告 [https://home.ubalt.edu/tmitch/645/articles/McDanieletal1994CriterionValidityInterviewsMeta.pdf]
  • [KRQ-3] Tech Sector Job Interviews Assess Anxiety, Not Software Skills 閱讀報導 [https://news.ncsu.edu/2020/07/tech-job-interviews-anxiety/]
  • [S2] 2023 IEEE Software Journal:Take-Home 編程測試與首年績效評估的相關性 r = 0.62 閱讀分析 [https://fullscale.io/blog/take-home-coding-tests-vs-live-coding-interviews/]
  • [S1] 解決方案案例: “Take-Home 編程測試: 與首年績效評估的相關性 r = 0.62 / 與可維護生產程式碼相關性 r = 0.67” 閱讀分析 [https://fullscale.io/blog/take-home-coding-tests-vs-live-coding-interviews/]
  • [P2] 行為診斷: “處理模糊性: 自立(Self-reliant),在有限指導下獨立完成複雜和新穎問題” Microsoft Research [https://www.microsoft.com/en-us/research/wp-content/uploads/2019/03/Paul-Li-MSR-Tech-Report.pdf]

免責聲明:本文數據與案例僅供職涯規劃參考,實際結果會因個人背景、產業需求與面試官標準而異。

Similar Posts

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *