分享機械學習的一本書。當時下載了,沒時間看。所以分享給大家(wo kan bu dong!!)。感謝~~
3.png (30.81 KB, 下載次數: 178)
下載附件
2018-8-2 22:02 上傳
Machine Learning(機器學習)是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。它是人工智能的核心,是使計算機具有智能的根本途徑,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。在過去的十年中,機器學習幫助我們自動駕駛汽車,有效的語音識別,有效的網絡搜索,并極大地提高了人類基因組的認識。機器學習是當今非常普遍,你可能會使用這一天幾十倍而不自知。很多研究者也認為這是最好的人工智能的取得方式。在本課中,您將學習最有效的機器學習技術,并獲得實踐,讓它們為自己的工作。更重要的是,你會不僅得到理論基礎的學習,而且獲得那些需要快速和強大的應用技術解決問題的實用技術。最后,你會學到一些硅谷利用機器學習和人工智能的最佳實踐創新。本課程提供了一個廣泛的介紹機器學習、數據挖掘、統計模式識別的課程。主題包括:
(一)監督學習(參數/非參數算法,支持向量機,核函數,神經網絡)。
(二)無監督學習(聚類,降維,推薦系統,深入學習推薦)。
(三)在機器學習的最佳實踐(偏差/方差理論;在機器學習和人工智能創新過程)。
本課程還將使用大量的案例研究,您還將學習如何運用學習算法構建智能機器人(感知,控制),文本的理解(Web 搜索,反垃圾郵件),計算機視覺,醫療信息,音頻,數據挖掘),文本的理解(Web 搜索,反垃圾郵件),計算機視覺,醫療信息,音頻,數據挖掘,和其他領域。
本課程需要 10 周共 18 節課,相對以前的機器學習視頻,這個視頻更加清晰,而且每課都有 ppt 課件,推薦學習。
我和我的團隊翻譯了部分視頻,目前已經翻譯完畢,內嵌中英文字幕,推薦使用potplayer。此外,我無償把字幕貢獻給了網易云課堂,他們開了免費課:吳恩達機器學習。
這篇中文筆記,主要是根據視頻內容和中文字幕以及 ppt 來制作,部分來源于網絡,如“小小人_V”的筆記,并持續更新。
本人水平有限,如有公式、算法錯誤,請及時指出,發郵件給我,也可以加我 qq。今日發現這個筆記被下載超過 10 萬次,應該說這個筆記有點用,我發現以前一些翻譯小錯誤,進行了修改,以免誤導初學者。
目錄
第 1 周 1
1、 引言(Introduction)1
11 歡迎1
12 機器學習是什么?4
13 監督學習6
14 無監督學習10
2、 單變量線性回歸(Linear Regression with One Variable) 15
21 模型表示15
22 代價函數17
23 代價函數的直觀理解 I19
24 代價函數的直觀理解 II20
25 梯度下降21
26 梯度下降的直觀理解24
27 梯度下降的線性回歸27
28 接下來的內容29
3、 線性代數回顧(Linear Algebra Review)30
31 矩陣和向量30
32 加法和標量乘法31
33 矩陣向量乘法32
34 矩陣乘法33
35 矩陣乘法的性質34
36 逆、轉置35
第 2 周 36
4、 多變量線性回歸(Linear Regression with Multiple Variables)36
41 多維特征36
42 多變量梯度下降37
43 梯度下降法實踐 1-特征縮放 39
44 梯度下降法實踐 2-學習率 40
45 特征和多項式回歸41
46 正規方程42
47 正規方程及不可逆性(選修)44
5、 Octave 教程(Octave Tutorial)47
51 基本操作47
52 移動數據54
53 計算數據62
54 繪圖數據70
55 控制語句:for,while,if 語句 76
56 向量化82
57 工作和提交的編程練習86
第 3 周 88
6、 邏輯回歸(Logistic Regression)88
61 分類問題88
II
62 假說表示90
63 判定邊界92
64 代價函數94
65 簡化的成本函數和梯度下降98
66 高級優化101
67 多類別分類:一對多105
7、 正則化(Regularization) 108
71 過擬合的問題108
72 代價函數110
73 正則化線性回歸112
74 正則化的邏輯回歸模型113
第 4 周 115
8、 神經網絡:表述(Neural Networks: Representation)115
81 非線性假設115
82 神經元和大腦117
83 模型表示 1121
84 模型表示 2124
85 特征和直觀理解 1126
86 樣本和直觀理解 II128
87 多類分類130
第 5 周 131
9、 神經網絡的學習(Neural Networks: Learning) 131
91 代價函數131
92 反向傳播算法133
93 反向傳播算法的直觀理解136
94 實現注意:展開參數138
95 梯度檢驗139
96 隨機初始化141
97 綜合起來142
98 自主駕駛143
第 6 周 146
10、 應用機器學習的建議(Advice for Applying Machine Learning) 146
101 決定下一步做什么146
102 評估一個假設149
103 模型選擇和交叉驗證集151
104 診斷偏差和方差153
105 正則化和偏差/方差155
106 學習曲線157
107 決定下一步做什么159
11、 機器學習系統的設計(Machine Learning System Design) 161
111 首先要做什么161
112 誤差分析162
113 類偏斜的誤差度量165
114 查準率和查全率之間的權衡166
III
115 機器學習的數據168
第 7 周 172
12、 支持向量機(Support Vector Machines) 172
121 優化目標172
122 大邊界的直觀理解178
123 數學背后的大邊界分類(選修)183
124 核函數 1190
125 核函數 2192
126 使用支持向量機194
第 8 周 197
13、 聚類(Clustering)197
131 無監督學習:簡介197
132 K-均值算法 200
133 優化目標202
134 隨機初始化203
135 選擇聚類數204
14、 降維(Dimensionality Reduction)207
141 動機一:數據壓縮207
142 動機二:數據可視化210
143 主成分分析問題211
144 主成分分析算法213
145 選擇主成分的數量214
146 重建的壓縮表示215
147 主成分分析法的應用建議217
第 9 周 218
15、 異常檢測(Anomaly Detection) 218
151 問題的動機218
152 高斯分布220
153 算法221
154 開發和評價一個異常檢測系統223
155 異常檢測與監督學習對比224
156 選擇特征225
157 多元高斯分布(選修)227
158 使用多元高斯分布進行異常檢測(選修)230
16、 推薦系統(Recommender Systems)233
161 問題形式化233
162 基于內容的推薦系統235
163 協同過濾237
164 協同過濾算法239
165 向量化:低秩矩陣分解240
166 推行工作上的細節:均值歸一化242
第 10 周 243
17、 大規模機器學習(Large Scale Machine Learning)243
171 大型數據集的學習243
IV
172 隨機梯度下降法244
173 小批量梯度下降245
174 隨機梯度下降收斂246
175 在線學習248
176 映射化簡和數據并行250
18、 應用實例:圖片文字識別(Application Example: Photo OCR) 251
181 問題描述和流程圖251
182 滑動窗口252
183 獲取大量數據和人工數據254
184 上限分析:哪部分管道的接下去做255
19、 總結(Conclusion)256
191 總結和致謝256
附件 258
機器學習的數學基礎258
高等數學258
線性代數266
概率論和數理統計276
機器學習是目前信息技術中最激動人心的方向之一。在這門課中,你將學習到這門技術的前沿,并可以自己實現學習機器學習的算法。你或許每天都在不知不覺中使用了機器學習的算法每次,你打開谷歌、必應搜索到你需要的內容,正是因為他們有良好的學習算法。谷歌和微軟實現了學習算法來排行網頁每次,你用 Facebook 或蘋果的圖片分類程序他能認出你朋友的照片,這也是機器學習。每次您閱讀您的電子郵件垃圾郵件篩選器,可以幫你過濾大量的垃圾郵件這也是一種學習算法。對我來說,我感到激動的原因之一是有一天做出一個和人類一樣聰明的機器。實現這個想法任重而道遠,許多 AI 研究者認為,實現這個目標最好的方法是通過讓機器試著模仿人的大腦學習我會在這門課中介紹一點這方面的內容。在這門課中,你還講學習到關于機器學習的前沿狀況。但事實上只了解算法、數學并不能解決你關心的實際的問題。所以,我們將花大量的時間做練習,從而你自己能實現每個這些算法,從而了解內部機理。
那么,為什么機器學習如此受歡迎呢?原因是,機器學習不只是用于人工智能領域。我們創造智能的機器,有很多基礎的知識。比如,我們可以讓機器找到 A 與 B 之間的最短路徑,但我們仍然不知道怎么讓機器做更有趣的事情,如 web 搜索、照片標記、反垃圾郵件。我們發現,唯一方法是讓機器自己學習怎么來解決問題。所以,機器學習已經成為計算機的一個能力。
現在它涉及到各個行業和基礎科學中。我從事于機器學習,但我每個星期都跟直升機飛行員、生物學家、很多計算機系統程序員交流(我在斯坦福大學的同事同時也是這樣)和平均每個星期會從硅谷收到兩、三個電子郵件,這些聯系我的人都對將學習算法應用于他們自
己的問題感興趣。這表明機器學習涉及的問題非常廣泛。有機器人、計算生物學、硅谷中大量的問題都收到機器學習的影響。
這里有一些機器學習的案例。比如說,數據庫挖掘。機器學習被用于數據挖掘的原因之一是網絡和自動化技術的增長,這意味著,我們有史上最大的數據集比如說,大量的硅谷公司正在收集 web 上的單擊數據,也稱為點擊流數據,并嘗試使用機器學習算法來分析數據,更好的了解用戶,并為用戶提供更好的服務。這在硅谷有巨大的市場。再比如,醫療記錄。隨著自動化的出現,我們現在有了電子醫療記錄。如果我們可以把醫療記錄變成醫學知識,我們就可以更好地理解疾病。再如,計算生物學。還是因為自動化技術,生物學家們收集的大量基因數據序列、DNA 序列和等等,機器運行算法讓我們更好地了解人類基因組,大家都知道這對人類意味著什么。再比如,工程方面,在工程的所有領域,我們有越來越大、越來越大的數據集,我們試圖使用學習算法,來理解這些數據。另外,在機械應用中,有些人不能直接操作。例如,我已經在無人直升機領域工作了許多年。我們不知道如何寫一段程序讓直升機自己飛。我們唯一能做的就是讓計算機自己學習如何駕駛直升機。手寫識別:現在我們能夠非常便宜地把信寄到這個美國甚至全世界的原因之一就是當你寫一個像這樣的信封,一種學習算法已經學會如何讀你信封,它可以自動選擇路徑,所以我們只需要花幾個美分把這封信寄到數千英里外。事實上,如果你看過自然語言處理或計算機視覺,這些語言理解或圖像理解都是屬于 AI領域。大部分的自然語言處理和大部分的計算機視覺,都應用了機器學習。學習算法還廣泛用于自定制程序。每次你去音樂站點,它都會給出其他電影或產品或音樂的建議,這是一種學習算法。仔細想一想,他們有百萬的用戶;但他們沒有辦法為百萬用戶,編寫百萬個不同程序。軟件能給這些自定制的建議的唯一方法是通過學習你的行為,來為你定制服務。
最后學習算法被用來理解人類的學習和了解大腦。
我們將談論如何用這些推進我們的 AI 夢想。幾個月前,一名學生給我一篇文章關于最頂尖的 12 個 IT 技能。擁有了這些技能 HR 絕對不會拒絕你。這是稍顯陳舊的文章,但在這個列表最頂部就是機器學習的技能。
在斯坦福大學,招聘人員聯系我,讓我推薦機器學習學生畢業的人遠遠多于機器學習的畢業生。所以我認為需求遠遠沒有被滿足現在學習“機器學習”非常好,在這門課中,我希望能告訴你們很多機器學習的知識。
在接下來的視頻中,我們將開始給更正式的定義,什么是機器學習。然后我們會開始學習機器學習的主要問題和算法你會了解一些主要的機器學習的術語,并開始了解不同的算法,用哪種算法更合適。
0.png (176.44 KB, 下載次數: 147)
下載附件
2018-8-3 17:24 上傳
0.png (148.27 KB, 下載次數: 151)
下載附件
2018-8-3 17:24 上傳
0.png (170.27 KB, 下載次數: 142)
下載附件
2018-8-3 17:24 上傳
0.png (267.95 KB, 下載次數: 124)
下載附件
2018-8-3 17:25 上傳
0.png (310.96 KB, 下載次數: 143)
下載附件
2018-8-3 17:26 上傳
完整的pdf格式文檔51黑下載地址(共294頁):
機器學習個人筆記完整版v5.22-A4打印版.pdf
(8.26 MB, 下載次數: 263)
2018-8-2 22:02 上傳
點擊文件名下載附件
下載積分: 黑幣 -5
|