國泰數數發8大著數2025!專家建議咁做…
Data Team旗下又設有資料科學實驗室(Data Science Lab),專門研究最新的資料科技或AI技術。 不只是內部分析時使用,國泰將ML模型上線到金融場景應用時背後的API,也是用Python來開發。 以客服中心的客戶進線問題預測模型為例,國泰會透過蒐集過去客戶行為軌跡,比如在ATM領錢、刷卡失敗、或剛繳完帳單等行為,將這些行為軌跡資料轉換成特徵變數並建立預測模型,再將預測模型打包成API,再提供給面對客服人員的前端客戶端儀表板程式呼叫使用。 然而有團隊、有資料權還不夠,數數發數據團隊也開始建立一套資料科學能力的基本要求,包括專業領域知識、商業分析能力與技術能力,資料工程與資料分析人員各有不同的標準,例如資料分析人員得學會Python和R,或像資料工程人員就得熟悉自家HIPPO這套資料基礎架構所用的開源Spark軟體。 不只原有分析團隊要重新學習才能留下來,就算新進人員各有其專業,人人都得具備同樣的基礎能力。 梁明喬指出,數數發應用場景選擇先從銀行落地,就是因為銀行資料種類多元,數位金融發展腳步也較快。 國泰金控數位數據暨科技發展中心已發展到近500人規模,最近重新規畫辦公空間和設計,未來考慮將部分空間變成可供外部社群舉辦小型技術分享的場所。 國泰數數發 國泰金控不是沒有數據團隊,但在2016年當時,各部門大多將分析團隊視為類似MIS的角色,主要任務是產出各式各樣的報表,其次則是負責資料探勘工作。 國泰數數發 尤其當時的數據團隊以業務思維為重,往往會認為資料工程人才不熟悉金融的產業知識,因而較難受到重視,所以,團隊中的資料工程人力也很少。 最後一個新設立的團隊,則是要站在金控角度,設計和規畫全集團的企業架構,「企業資訊架構也開始有專責團隊。」梁明喬表示。 國泰數數發 資料分析團隊還將慣用的Python套件,比如Pandas、Scikit-Learn等,依照不同功能,重新打包成一個資料分析團隊內部的「常用套件包」。 國泰數數發: 打造數據團隊4關鍵 孫至德表示,KPI並不是成功與否,成功合作固然是美事一樁,但更重要的是讓國泰的業務單位有跟新創公司合作的經驗。 後端工程團隊的杜政家也提到,由於後端開發的語言選擇很多,「只要程式底子夠的話,要轉換程式語言不困難。」因此,他更看重具有後端相關工作經驗、優秀的程式設計能力,甚至有前端開發經驗但想往後端嘗試的求職者,都是這個團隊要的人才。 這個自製的Rocket框架,也能串接到後端Airflow的自動化監控,讀取Log數據,再串接到後端進行監控。 在CI/CD的部分,國泰也在Rocket框架中,先完成了一套單元測試的方式,開發團隊成員可以透過幾個指令,快速執行測試任務,並自動輸出成報告。 也因為部署環節中,開發、測試、上線不同環境的設定檔都不同,所以國泰也在Rocket框架中,預先內建了一套標準的配置檔,以利各種快速部署之用。 國泰世華銀行數據生態營運部協理吳香妮說:「我們的目的是,透過相同的Python開發,讓工程人員跟資料分析人員對接時,有共通的語言。」國泰的資料科學團隊和數位體驗開發團隊也現身說法,揭露各自在實務開發上的經驗。 數位金融服務導入的新挑戰,傳統銀行如何因應轉型,甚至加速面對用戶紛紛行動化考驗,將是一大課題。 數數發將同一名顧客一段時間內的行為序列資料,比如上述不同時間的三個行為記錄,串起來變成了一篇短文,來描述這個顧客一連串的行為,就像流水帳日記一樣。 此外,國泰人壽與國泰世華銀行內部,各有一組Chatbot標籤訓練團隊,每天都要重新調整Chatbot無法回應的問題,再次訓練Chatbot,使它變得更聰明。 第三個線下產品層,則主要是資料處理流程的中後段,除了傳統的ETL處理和資料倉儲系統之外,數數發還建置一套資料湖,資料湖的數據還可以提取出來進行不同的ETL處理,再匯入資料倉儲或資料湖中,反覆循環再利用,另外在線下產品層中,還有一個關鍵的模組就是分析平臺,可以快速套用數據團隊建立的各種AI模型來進行分析。 RTDM引擎正是改用了Event Sourcing結構的設計,信用卡系統會將顧客刷卡的狀態,變成了一個事件,不論成功與否,都發布到事件平臺上。 另外,還打造了一個類似臉書動態牆設計的顧客視圖功能,將一個顧客的記錄,按照事件發生時間的順序一一列出。 國泰的目標是,希望當有一名顧客每天使用了不同集團子公司的各種服務通路時,能不能透過現有可用的資料,結合機器學習技術,來猜測這個顧客可能的喜好,作為後續分析的重要基礎。 數數發目前分為三個主要團隊,第一個以數位服務、產品開發和設計為主的Digital Team,包括了數位行銷團隊、數位體驗設計團隊、數位平臺開發人力等。 第二團隊則是Data Team,任務是從數據中運用新興科技,如大數據、雲端、機器學習,來協助業務開拓。 國泰數數發: 數數發 ●…