如果想了解 Cloud Architect 證照介紹和準備方法,可以來這裡查看。
Data Engineer 證照是什麼?
Google Cloud Professional Data Engineer 是 GCP 推出的證照之一,
Data Engineer 就是針對 GCP 資料處理各項服務,
對它們的使用方法、資料處理流程、資料管道 (Data Pipeline)、
最佳實務和解決方案的相關知識所推出的證照。
而證照的有效期限只有兩年,所以快到期了,必須要趕快去考,
我是 9/18 到期,它有給予一個月的寬限期,所以趕在 9/23 去考,
目前第三次考過 Date Engineer,這是證照的公開連結。

為什麼要考這 Data Engineer 證照?
我之前一直都在 GCP 代理商擔任雲端架構師,
幫客戶執行各種上雲專案、教育訓練、技術支援和解決方案的建議,
其中也有不少關於資料方面的需求,所以對代理商而言,是一張很重要的證照。
現在我自己出來教 GCP,為了維持知識的更新,就繼續考來延長有效期。
近年來大數據、雲端和 AI 的蓬勃發展,資料的重要性不言而喻,
如果你的公司也在用 GCP,你的工作又和資料相關,
則這張證照一定是必備的。
Data Engineer 考試資格
沒有資格限制。
官網希望你至少有 3 年產業經驗,包含 1 年使用 GCP 設計解決方案的經驗,
有經驗去考會比較有感覺,至少你知道題目都在問什麼,
如果對 GCP 的資料各項服務都不懂,直接去考,
就像是在背題目跟答案,考完學到的不多。
PS.其實你根本背不完,還不如乖乖回去研讀相關知識。
Data Engineer 到底在考什麼?
常見的考試情境如下:
1. 資料建模
資料應該放在哪裡?怎麼放比較便宜?
效能比較好?看到的資料比較新?
2. 批次和即時資料處理
用什麼工具抓資料?多久抓一次?
資料有問題怎麼處理?如何確保資料不會掉?
3. 機器學習
機器學習的基本概念,資料放哪裡適合做機器學習?
資料要整理成什麼樣子?什麼情境之下,該用什麼模型?
4. 資料管道建立
地端資料如何上 GCP?其他雲端資料如何抓過來?
怎麼傳速效能比較快?比較便宜?比較安全?
GCP 的資料如何放到 BigQuery?
Data Engineer 各服務出題比例
先看這張圖就對了:

你可以看得出幾個重點:
1.核心服務
(1) BigQuery
資料倉儲和分析工具,它一直保持資料一哥的地位,你也可以說它是雲端界陳浩南。
(2) Dataflow
資料處理最重要的自動化工具,是原生的 Apache Beam,
寫 Java 或 Python 程式讓它可以自動處理資料,還能夠依照資料量大小 Autoscale。
(3) Pubsub
接住串流資料最重要的工具,如果你的串流資料來源,流量大小不固定,
有時1秒1筆,有時1秒10萬筆,就可以用 PusSub 幫你把資料接住,不會漏掉。
這三個弄熟就可以當選總統掌握 40% 的考試了,未來應該還是持續佔據很大的比例。
2.機器學習知識
因為資料是 AI 跟機器學習的原料,所以機器學習的基礎知識都納入考試,
也包含機器學習相關服務 BigQueryML、AutoML、Dialogflow。
奇怪怎麼沒有 Vertex AI?最近生成式 AI 的興起,Google 大推 Vertex AI 開發平台,
各種 AI 應用工具例如 Agent Builder、Model Builder 和 Model Garden 推陳出新。
不過,這些服務 Google 自己也一直改來改去的,功能和命名都一直改,還沒穩定下來,
我猜是這樣的原因,所以都還沒納入考題,也好,不然考了之後,服務又改名或下架,就太尷尬了。
3.基本資料服務
Cloud SQL – 雲端版的 MySQL、Postgre SQL、SQL Server
Dataproc – 雲端版的 Hadoop、Spark、Pig、Hive 等資料處理工具
Bigtable – 雲端版低延遲的 NoSQL 資料庫
Cloud Storage – 無限大的雲端檔案儲存空間和 API 服務
Spanner – 全球即時同步的關聯式資料庫
Cloud Composer – 資料管道管理與編排,可以控制整個資料的旅程,
從資料的產生、處理到分析都可以納入管理,近年來考題越來越多。
4.資料搬遷
各種情境題,像是:
地端資料如何搬上雲端?
怎麼傳比較快?或比較便宜?
其他雲端的資料怎麼傳到 GCP?
GCP 的其他服務,怎麼倒入 BigQuery?
資料放哪裡比較便宜?
這種題目蠻需要你對各種工具和服務都很了解,才有辦法回答正確。
5.資安跟資料治理
在這部分當中,Cloud KMS (加密金鑰管理) 和 Cloud DLP (資料外洩防護) 一直都會考,
最近又出了像是 Dataplex、Analytics Hub、Data Catalog 和 Dataform 比較新的服務。
就是因為公司的資料太多,然後到處放,沒有管好怕會造成外洩,
所以這些服務就是要幫助公司管好資料,未來這塊考題應該會越來越多,
我也是因為考試才碰到這些東西,有機會一定要實際操作看看。
官方宣布的考試範圍可以參考這個連結,以前有考 Case 題組,
就是一個 Case 考個 3~5 題,大概考 1~3 個 Case,
你可以從官網先了解公司的背景,考試的時候就不用從頭開始看。
但 2024 年又沒考了,所以不用再讀 Case。
準備方式
官方資源
如果要真的懂 GCP 的各項資料服務,還是先以官網文件為準。
但是文件非常多,是「非常非常非常多」,所以你只要大概知道每個服務大概在做什麼就好,
你可以讀像是:
Overview 和 Introduction: 大概了解用途。
Best Practice:應該怎麼用比較快、效能比較好、比較便宜、比較安全等等。
Troubleshooting:有問題時應該怎麼處理,要檢查什麼地方。
不要求看完全部的文件,因為根本看不完。
你可以上這個 Skillbost ,裡面有一個 Data Engineer Learning Path:

它除了免費提供線上課程之外,
課程中還有免費的 Lab,至少都做一下,
這樣你學東西才會有感覺,不會都在死記硬背,學不到東西。
官網還有提供範例考題,一定要做,不要送分題都拿不到。
網路資源
說真的,有些服務在台灣的企業,真的很少用到,
除非你是在專門做資料分析的公司,或是技術領先的公司。
要不然,很多考試的內容,在工作上很難用到。
所以官方文件大概看過之後,
你就直接搜尋 “google cloud data engineer questions” 找到相關資源,例如 Exam Topic。
要注意的是,內容「非常多」,而且 Google 一直都在更新考試內容,
像我今年第三次考,發現跟上次 2022 年比起來,根本就是大改,
這段時間我 K 書 K 到懷疑人生,難度指數從 4 顆星升到 5 顆星。
考試規則和題型
單選題和多選題,50 題,2 個小時考完。
進考場前所有東西都要給考場人員保管,手機要關機,手錶要拿下來。
中途可以上廁所,但時間會繼續算。
冷氣有點冷,可以帶件外套。
考完會馬上告訴你 Pass 或 Fail,官方是說需要人工確認後再發正式 Email 給你,
另外這個考試結果,不會講分數,不會跟你說哪一題做錯,
我猜他們要看考試的監控影片,看你有沒有作弊。
報名考試
註冊帳號與報名考試
直接從這個網站報名,先註冊帳號,記得姓名要用護照名稱喔!
我以前用一般的英文名字,跟護照羅馬拼音的名字不同,
結果到考場被拒絕,盧了半天才能進去考試,讓我有夠緊張。
我當天考完馬上聯絡客服,請他們幫我改成護照名稱 (因為自己無法改)。
然後點擊 “Register For An Exam”:

找到你要考的科目,選擇你要遠端 (Remote) 還是去考場 (Onsite) 考,
我一律建議去考場,因為遠端你要安裝軟體,然後在家找一個安靜的地方,
對方還會在線上看你考試,確認你有沒有異常的舉止。
萬一考試那天網路不通,或是你家的貓咪突然攻擊你,你就無法專心完成考試了。

選好就可以選擇考場,像我都去恆毅資訊考試,
因為恆毅資訊有喝到飽的快樂肥宅水,
考前喝一杯,考完開心再喝一杯,不香嗎?
對了不要喝太多,不然考試中會很想上廁所。
考試費用
像上面選擇科目的時候,它跟你說要 200 美金,但你真的要付款的時候,
它又自動打 6 折,所以才 120 美金。

而且它還有 Coupon/Voucher Code,後面會跟你說如何取得。
但要注意沒考過的話,
第一次沒考過,要 14 天後才能重考,
第二次沒考過,要 60 天後才能重考,
第三次沒考過,要 365 天後才能重考,
重考都要重新付費喔!詳情看這份官方的重考政策。
列印考試確認單
報名刷卡完成之後,你會收到一封 Email,
上面有考試相關資訊,
更重要的是 Test Taker Authorization Code,考場要比對這個 Code,

強烈建議你印出來,不然考場人員無法讓你進去考試喔!
考完試之後會收到什麼福利?
收正式通知信
我這次是 9/23 去考試的,然後在 9/25 收到下面這封信,
這才是正式確認你有成功考過。

註冊 Credly 帳號並下載證照 PDF 檔
如果你是第一次考到 GCP 證照,請先去 Credly 註冊一個帳號,
先點擊第一個連結:

然後你可以參考這篇,我當初花半小時才找到下載的地方,
所以特別寫了這篇分享,方便你投履歷表或跟公司報帳。
取得考過禮物和考試折扣券
往下看有一條很重要,
這一條是給你拿考試禮物和考試折扣券的地方。
PS.如果你是第一次考證照,強烈建議每一個連結都點進去,
有很多重要權益可能是你想要的喔!

點擊 “Account” 之後,會進到 https://cp.certmetrics.com/google/en/benefits/program
這時點擊 Claim benefit:

你會拿到一個折扣碼,再點擊 Access Benefit:
(前後兩張圖不一樣,因為原本的圖沒截到)

補充一下,像左邊的 Exam Discount,就可以讓你下次報名考試的時候,
輸入折扣碼,取得半價優惠,也就是已經 120 美金的費用,再變成 60 美金,所以根本沒有到 6000 台幣那麼貴。
我們再回來,點擊 Access Benefit,會跳出新的視窗,
你會進入 Google 的商店,你可以免費選一個禮物:

把折扣碼貼上之後,就進入選禮物的頁面。

像我就選了一件外套:

最後再填寫一下地址,記得都要用英文喔,
你可以去郵局網站來翻譯成英文地址:

完成囉!接下來就靜候 Google 從國外發貨到你家!

證照持有者目錄
還有一個我覺得很有趣,有點類似證照名人榜的東西,
你可以在這裡查到你自己的名字。

你可以用下面的 Search Directory,用證照篩檢考過的人有哪些:

像我把我 6 張證照都加入篩選,看看有多少人跟我一樣,結果竟然有 531個人。

我再加一個過濾條件 Location 選台灣看看,結果台灣還有 16 個人至少 6 張證照以上,
可見人外有人,天外有天啊!!

可見台灣這麼小的地方,還是臥虎藏龍,高手在民間!
我要持續努力,不可以此自滿!
以上分享到這裡,謝謝大家!