top of page

爬蟲程式撰寫

幫忙教授撰寫其需要的資料爬蟲,過程中使用學到了如何使用Optical Character Recognition, OCR(光學字元辨識)與Python連結資料庫的操作。是目前筆者所寫過其複雜度較高的爬蟲程式,完成後成就感很高、也學到了不少事物。

Correspondence Analysis

幫忙教授撰寫其介面所需要呈現的Correspondence Analysis (CA)圖之產生程式,過程中需要做一些簡單運算以及較為複雜的資料庫操作,在此便不贅述。最後再將多張圖片進行生成並將之存入資料夾以及產生相關讀取圖片路徑所需的Excel檔,以便呈現在教授所需之QlikVIew介面。

​過程中學到非常多利用輿論資料視覺化的方式,算是讓自己大開眼界。

電信議題QlikView

暑假幫忙教授製作其教授所需要的全新QlikView電信議題資料視覺化介面,好配合呈現其目前實驗室所發展的深度學習Bert之成果將之呈現。

其他

平時會幫忙教授做資料庫的資料管理​

888888888.png

示意圖、藉由CA圖可看出各家公司與其對應議題的關係

bottom of page