GCP 證照 Data Engineer 介紹、考試心得、準備方式和考過福利分享

如果想了解 Cloud Architect 證照介紹和準備方法,可以來這裡查看

Data Engineer 證照是什麼?

Google Cloud Professional Data Engineer 是 GCP 推出的證照之一,

Data Engineer 就是針對 GCP 資料處理各項服務,

對它們的使用方法、資料處理流程、資料管道 (Data Pipeline)、

最佳實務和解決方案的相關知識所推出的證照。

而證照的有效期限只有兩年,所以快到期了,必須要趕快去考,

我是 9/18 到期,它有給予一個月的寬限期,所以趕在 9/23 去考,

目前第三次考過 Date Engineer,這是證照的公開連結

為什麼要考這 Data Engineer 證照?

我之前一直都在 GCP 代理商擔任雲端架構師,

幫客戶執行各種上雲專案、教育訓練、技術支援和解決方案的建議,

其中也有不少關於資料方面的需求,所以對代理商而言,是一張很重要的證照。

現在我自己出來教 GCP,為了維持知識的更新,就繼續考來延長有效期。

近年來大數據、雲端和 AI 的蓬勃發展,資料的重要性不言而喻,

如果你的公司也在用 GCP,你的工作又和資料相關,

則這張證照一定是必備的。

Data Engineer 考試資格

沒有資格限制。

官網希望你至少有 3 年產業經驗,包含 1 年使用 GCP 設計解決方案的經驗,

有經驗去考會比較有感覺,至少你知道題目都在問什麼,

如果對 GCP 的資料各項服務都不懂,直接去考,

就像是在背題目跟答案,考完學到的不多。

PS.其實你根本背不完,還不如乖乖回去研讀相關知識。

Data Engineer 到底在考什麼?

常見的考試情境如下:

1. 資料建模

資料應該放在哪裡?怎麼放比較便宜?

效能比較好?看到的資料比較新?

2. 批次和即時資料處理

用什麼工具抓資料?多久抓一次?

資料有問題怎麼處理?如何確保資料不會掉?

3. 機器學習

機器學習的基本概念,資料放哪裡適合做機器學習?

資料要整理成什麼樣子?什麼情境之下,該用什麼模型?

4. 資料管道建立

地端資料如何上 GCP?其他雲端資料如何抓過來?

怎麼傳速效能比較快?比較便宜?比較安全?

GCP 的資料如何放到 BigQuery?

Data Engineer 各服務出題比例

先看這張圖就對了:

你可以看得出幾個重點:

1.核心服務

(1) BigQuery 

資料倉儲和分析工具,它一直保持資料一哥的地位,你也可以說它是雲端界陳浩南

(2) Dataflow 

資料處理最重要的自動化工具,是原生的 Apache Beam,

寫 Java 或 Python 程式讓它可以自動處理資料,還能夠依照資料量大小 Autoscale。

(3) Pubsub 

接住串流資料最重要的工具,如果你的串流資料來源,流量大小不固定,

有時1秒1筆,有時1秒10萬筆,就可以用 PusSub 幫你把資料接住,不會漏掉。

這三個弄熟就可以當選總統掌握 40% 的考試了,未來應該還是持續佔據很大的比例。

2.機器學習知識

因為資料是 AI 跟機器學習的原料,所以機器學習的基礎知識都納入考試,

也包含機器學習相關服務 BigQueryMLAutoMLDialogflow

奇怪怎麼沒有 Vertex AI?最近生成式 AI 的興起,Google 大推 Vertex AI 開發平台,

各種 AI 應用工具例如 Agent BuilderModel BuilderModel Garden 推陳出新。

不過,這些服務 Google 自己也一直改來改去的,功能和命名都一直改,還沒穩定下來,

我猜是這樣的原因,所以都還沒納入考題,也好,不然考了之後,服務又改名或下架,就太尷尬了。

3.基本資料服務

Cloud SQL – 雲端版的 MySQL、Postgre SQL、SQL Server

Dataproc – 雲端版的 Hadoop、Spark、Pig、Hive 等資料處理工具

Bigtable – 雲端版低延遲的 NoSQL 資料庫

Cloud Storage – 無限大的雲端檔案儲存空間和 API 服務

Spanner – 全球即時同步的關聯式資料庫

Cloud Composer – 資料管道管理與編排,可以控制整個資料的旅程,

從資料的產生、處理到分析都可以納入管理,近年來考題越來越多。

4.資料搬遷

各種情境題,像是:

地端資料如何搬上雲端?

怎麼傳比較快?或比較便宜?

其他雲端的資料怎麼傳到 GCP?

GCP 的其他服務,怎麼倒入 BigQuery?

資料放哪裡比較便宜?

這種題目蠻需要你對各種工具和服務都很了解,才有辦法回答正確。

5.資安跟資料治理

在這部分當中,Cloud KMS (加密金鑰管理)Cloud DLP (資料外洩防護) 一直都會考,

最近又出了像是 DataplexAnalytics HubData CatalogDataform 比較新的服務。

就是因為公司的資料太多,然後到處放,沒有管好怕會造成外洩,

所以這些服務就是要幫助公司管好資料,未來這塊考題應該會越來越多,

我也是因為考試才碰到這些東西,有機會一定要實際操作看看。

官方宣布的考試範圍可以參考這個連結,以前有考 Case 題組,

就是一個 Case 考個 3~5 題,大概考 1~3 個 Case,

你可以從官網先了解公司的背景,考試的時候就不用從頭開始看。

但 2024 年又沒考了,所以不用再讀 Case。

準備方式

官方資源

如果要真的懂 GCP 的各項資料服務,還是先以官網文件為準。

但是文件非常多,是「非常非常非常多」,所以你只要大概知道每個服務大概在做什麼就好,

你可以讀像是:

Overview 和 Introduction: 大概了解用途。

Best Practice:應該怎麼用比較快、效能比較好、比較便宜、比較安全等等。

Troubleshooting:有問題時應該怎麼處理,要檢查什麼地方。

不要求看完全部的文件,因為根本看不完。


你可以上這個 Skillbost ,裡面有一個 Data Engineer Learning Path

它除了免費提供線上課程之外,

課程中還有免費的 Lab,至少都做一下,

這樣你學東西才會有感覺,不會都在死記硬背,學不到東西。

官網還有提供範例考題,一定要做,不要送分題都拿不到。

網路資源

說真的,有些服務在台灣的企業,真的很少用到,

除非你是在專門做資料分析的公司,或是技術領先的公司。

要不然,很多考試的內容,在工作上很難用到。

所以官方文件大概看過之後,

你就直接搜尋 “google cloud data engineer questions” 找到相關資源,例如 Exam Topic。

要注意的是,內容「非常多」,而且 Google 一直都在更新考試內容,

像我今年第三次考,發現跟上次 2022 年比起來,根本就是大改,

這段時間我 K 書 K 到懷疑人生,難度指數從 4 顆星升到 5 顆星。

考試規則和題型

單選題和多選題,50 題,2 個小時考完。

進考場前所有東西都要給考場人員保管,手機要關機,手錶要拿下來。

中途可以上廁所,但時間會繼續算。

冷氣有點冷,可以帶件外套。

考完會馬上告訴你 Pass 或 Fail,官方是說需要人工確認後再發正式 Email 給你,

另外這個考試結果,不會講分數,不會跟你說哪一題做錯,

我猜他們要看考試的監控影片,看你有沒有作弊。

報名考試

註冊帳號與報名考試

直接從這個網站報名,先註冊帳號,記得姓名要用護照名稱喔!

我以前用一般的英文名字,跟護照羅馬拼音的名字不同,

結果到考場被拒絕,盧了半天才能進去考試,讓我有夠緊張。

我當天考完馬上聯絡客服,請他們幫我改成護照名稱 (因為自己無法改)。

然後點擊 “Register For An Exam”:

找到你要考的科目,選擇你要遠端 (Remote) 還是去考場 (Onsite) 考,

我一律建議去考場,因為遠端你要安裝軟體,然後在家找一個安靜的地方,

對方還會在線上看你考試,確認你有沒有異常的舉止。

萬一考試那天網路不通,或是你家的貓咪突然攻擊你,你就無法專心完成考試了。

選好就可以選擇考場,像我都去恆毅資訊考試,

因為恆毅資訊有喝到飽的快樂肥宅水,

考前喝一杯,考完開心再喝一杯,不香嗎?

對了不要喝太多,不然考試中會很想上廁所。

考試費用

像上面選擇科目的時候,它跟你說要 200 美金,但你真的要付款的時候,

它又自動打 6 折,所以才 120 美金。

而且它還有 Coupon/Voucher Code,後面會跟你說如何取得。

但要注意沒考過的話,

第一次沒考過,要 14 天後才能重考,

第二次沒考過,要 60 天後才能重考,

第三次沒考過,要 365 天後才能重考,

重考都要重新付費喔!詳情看這份官方的重考政策

列印考試確認單

報名刷卡完成之後,你會收到一封 Email,

上面有考試相關資訊,

更重要的是 Test Taker Authorization Code,考場要比對這個 Code,

強烈建議你印出來,不然考場人員無法讓你進去考試喔!

考完試之後會收到什麼福利?

收正式通知信

我這次是 9/23 去考試的,然後在 9/25 收到下面這封信,

這才是正式確認你有成功考過。

註冊 Credly 帳號並下載證照 PDF 檔

如果你是第一次考到 GCP 證照,請先去 Credly 註冊一個帳號,

先點擊第一個連結

然後你可以參考這篇,我當初花半小時才找到下載的地方,

所以特別寫了這篇分享,方便你投履歷表或跟公司報帳。

取得考過禮物和考試折扣券

往下看有一條很重要,

這一條是給你拿考試禮物和考試折扣券的地方。

PS.如果你是第一次考證照,強烈建議每一個連結都點進去,

有很多重要權益可能是你想要的喔!

點擊 “Account” 之後,會進到 https://cp.certmetrics.com/google/en/benefits/program 

這時點擊 Claim benefit:

你會拿到一個折扣碼,再點擊 Access Benefit:

(前後兩張圖不一樣,因為原本的圖沒截到)

補充一下,像左邊的 Exam Discount,就可以讓你下次報名考試的時候,

輸入折扣碼,取得半價優惠,也就是已經 120 美金的費用,再變成 60 美金,所以根本沒有到 6000 台幣那麼貴。

我們再回來,點擊 Access Benefit,會跳出新的視窗,

你會進入 Google 的商店,你可以免費選一個禮物:

把折扣碼貼上之後,就進入選禮物的頁面。

像我就選了一件外套:

最後再填寫一下地址,記得都要用英文喔,

你可以去郵局網站來翻譯成英文地址:

完成囉!接下來就靜候 Google 從國外發貨到你家!

證照持有者目錄

還有一個我覺得很有趣,有點類似證照名人榜的東西,

你可以在這裡查到你自己的名字。

你可以用下面的 Search Directory,用證照篩檢考過的人有哪些:

像我把我 6 張證照都加入篩選,看看有多少人跟我一樣,結果竟然有 531個人。

我再加一個過濾條件 Location 選台灣看看,結果台灣還有 16 個人至少 6 張證照以上,

可見人外有人,天外有天啊!!

可見台灣這麼小的地方,還是臥虎藏龍,高手在民間!

我要持續努力,不可以此自滿!

以上分享到這裡,謝謝大家!

返回頂端