Archives › R語言教學
[R語言專題] 運用R語言玩轉文字探勘 – 正規表達式
就我的經驗來說,平常若打交道的以數值資料為主,確實是這個比例;但如果是文字資料,恐怕比例會更極端到清資料就要花上9成時間。在清理文字資料的過程中,一定會用上一個神兵利器:「正規表達式」(regular expression,簡稱為 regex 或 regexp)。底下,我們就來介紹正規表達式的用途與用法。
[R語言專題] 運用R語言玩轉文字探勘 – 套件篇
開發者們打造許多套件,替人們處理文字探勘。有些針對特定任務,例如在主題模型章節中我會介紹stm、LDA,在詞向量章節中則以gensim、word2vec為範例;也有些套件能夠貫穿整個文字探勘流程,例如這篇文章將要介紹的tidytext和quanteda。
[資訊整理] 深度學習大師吳恩達 Andrew Ng
吳恩達的產學經歷完整。他曾任教於史丹佛大學資工系,並領導該校人工智慧實驗室,現在則為客座教授。他曾和Google研究員共同在Google X實驗室開啟Google Brain專案,接著進入百度擔任首席科學家,離職後則接續創辦Landing AI、DeepLearning.AI、AI Fund,同時還是Coursea的共同創辦人。
[R語言圖表]用ggplot畫散布圖 scatter plot
想畫散布圖(scatter plot),但是不知道怎麼在R語言中使用相關函數嗎?什麼時候該用散布圖?要怎麼加上文字標籤?如何強調特定資料點?散布圖(scatter plot)用於呈現數值資料之間的關係(relationship),散布在圖表中的點點,位置由兩個變數的數值共同決定。它能夠讓我們看出資料點之間的分布,也能迅速變異出所謂的離群值。此外,在其他的散布圖中,我們可以看出兩個變數之間的趨勢係。
[R語言初學] R語言當中的資料結構
這個章節則要帶大家認識資料結構(data type)。R語言當中也有多種資料結構,每種資料結構都各自代表獨特的、將資料拼湊組合在一起的方法。我會在這篇文章介紹R語言當中的資料結構,配上實際程式碼,從向量一路討論到資料表,一網打盡。資料結構R語言的資料結構包含一維的向量(vector)與因子(factor)、二維的矩陣(matrix)與資料表(dataframe)、多維度的列表(list)與陣列(array)。