您找過以下的關鍵字

尚無搜尋紀錄

前言

在巨量資料時代,資料採擷無疑將是最炙手可熱的技術。資料採擷的理論和方法正日新月異地發展,資料採擷的技術及工具,已經滲透到網際網路、金融、電子商務、管理、生產、決策等各個領域,資料採擷的軟體也是層出不窮,其中R 是最引人關注的軟體。

R 是一個免費的開放原始碼軟體,它提供了首屈一指的統計計算和繪圖功能,尤其是大量的資料採擷方面的演算法套件,使得它成為一款優秀的、不可多得的資料採擷工具軟體。

本書的主要目的是向讀者介紹如何用R 進行資料採擷,透過大量的精選實例,循序漸進、全面系統地說明R 在資料採擷領域的應用。

本書以資料前置處理、基本演算法及應用和進階演算法及應用這三篇展開。

資料前置處理篇

由第1~5 章組成,首先簡介資料採擷流程、演算法和工具,然後介紹R 中的資料分類和資料集,以及使用R 取得資料的多種靈活的方法。最後說明對資料進行探索性分析和前置處理的方法。這些內容是使用R 進行資料採擷的最基礎內容。

基本演算法及應用篇

由第6~9 章組成,主要說明資料採擷的基本演算法及應用,包含連結分析、分群分析、判別分析和決策樹,這些演算法也是資料採擷使用最多最普遍的演算法。R 中提供了豐富的、功能強大的演算法套件和實現函數,資料採擷的初級和中級使用者務必掌握。

進階演算法及應用篇

由第10~14 章組成,主要說明資料採擷的進階演算法及應用,包含整合學習、隨機森林、支援向量機和神經網路,以及使用R 中的工具對資料採擷的模型進行評估與選擇。對於中進階的使用者,可以深入學習一下本篇的內容。

R 的特點是入門非常容易,使用也非常簡單,因此本書不需要讀者具備R 和資料採擷的基礎知識。不管是R 初學者,還是熟練的R 使用者都能從書中找到對自己有用的內容,快速入門和加強。讀者既可以把本書作為學習如何應用R 的一本優秀的教材,也可以作為資料採擷的工具書。

全書以實際問題、解決方案和對解決方案的討論為主線來組織內容,脈絡清晰,並且各章自成系統。讀者可以從頭至尾逐章學習,也可以根據自己的需要進行學習,根據自己在實際中遇到的問題尋找解決方案。

本書所撰寫的來源程式,都通過了反覆偵錯,讀者可在www.topteam.cc 網站下載,方便讀者使用。

本書主要由黃文、王正林撰寫,其他參與撰寫的人員有付東旭、王思琪、鐘太平、劉擁軍、陳菜枚、李燦輝、鐘事沅、王曉麗、王龍躍、夏路生、鐘頌飛、鐘杜清、王殿祜等。在此對所有參與撰寫的人員表示感謝!對關心、支援我們的讀者表示感謝!

由於時間倉促,作者水平和經驗有限,書中錯漏之處在所難免,敬請讀者指正,我們的電子郵件是:wa_2003@126.com。