毛片在线视频观看,一级日韩免费大片,在线网站黄色,澳门在线高清一级毛片

薈聚奇文、博采眾長、見賢思齊
當(dāng)前位置:公文素材庫 > 優(yōu)質(zhì)公文 > 《機器學(xué)習(xí)實踐應(yīng)用》讀書筆記

《機器學(xué)習(xí)實踐應(yīng)用》讀書筆記

網(wǎng)站:公文素材庫 | 時間:2019-09-03 23:10:44 | 移動端:《機器學(xué)習(xí)實踐應(yīng)用》讀書筆記

《機器學(xué)習(xí)實踐應(yīng)用》讀書筆記

  這次的讀書筆記主要介紹機器學(xué)習(xí)背景和基礎(chǔ)概念

  1 機器學(xué)習(xí)背景

  數(shù)據(jù)現(xiàn)狀

  20世紀(jì)70年代曾遇巨大瓶頸,原因有計算能力 + 數(shù)據(jù)量的不足。隨著互聯(lián)網(wǎng)的普及和對用戶數(shù)據(jù)的大量采集,數(shù)據(jù)量不足的問題已逐漸彌補,機器學(xué)習(xí)算法的價值越來越大。但在傳統(tǒng)領(lǐng)域,如建筑行業(yè),數(shù)據(jù)產(chǎn)生于工地的一磚一瓦,采集起來會更困難和麻煩,隨著圖像識別技術(shù)的進步和普及,這樣的問題能夠慢慢解決,但不得不說,傳統(tǒng)領(lǐng)域的數(shù)據(jù)智能化仍然是比較慢的進程。(這里可以自行了解下百度在傳統(tǒng)領(lǐng)域的AI技術(shù)落地情況)。目前主流的機器學(xué)習(xí)算法是監(jiān)督學(xué)習(xí)算法,該算法需要的是打標(biāo)過的數(shù)據(jù),而數(shù)據(jù)的打標(biāo)十分依賴人工標(biāo)記,之前在實習(xí)的時候,給短視頻的標(biāo)簽做標(biāo)記都能把我搞得頭昏腦漲。人工打標(biāo)有幾個問題:成本高 + 量級小

  機器學(xué)習(xí)算法現(xiàn)狀

  機器學(xué)習(xí)已滲透到生活的各個方面,特別是在互聯(lián)網(wǎng)領(lǐng)域。用網(wǎng)購場景來舉例。

  1)你在路上看到陌生人的一件T恤你很喜歡 → 使用淘寶的【拍立淘】(圖像識別技術(shù))

  2)在淘寶搜索框語音輸入商品名稱(語音轉(zhuǎn)文字技術(shù))

  3)商品的個性化推薦(推薦算法)

  4)商品下單 → 若錢不夠用 → 借錢 → 貸款額度顯示(由機器學(xué)習(xí)算法計算)

  5)下單后 → 短時間完成商品包裝、庫存發(fā)貨到中轉(zhuǎn)庫存、從低級倉庫到高級倉庫配送、向下分發(fā)(機器學(xué)習(xí)算法)

  6)快遞員配送 → 系統(tǒng)設(shè)計最優(yōu)路線(機器學(xué)習(xí)算法規(guī)劃)

  7)商品投訴 → 智能客服立即回復(fù)(文本的語義分析算法,精準(zhǔn)確定問題)

  以上的過程涉及了模型的訓(xùn)練和預(yù)測、語義分析、文本情感分析、圖像識別以及語音識別技術(shù)

  機器學(xué)習(xí)高頻場景

  1)聚類場景

  人群劃分和產(chǎn)品種類劃分等

  2)分類場景

  廣告投放預(yù)測和網(wǎng)站用戶點擊預(yù)測等

  3)回歸場景

  降雨量預(yù)測、商品購買量預(yù)測和股票成交額預(yù)測等

  4)文本分析場景

  新聞標(biāo)簽提取、文本自動分類和文本關(guān)鍵信息抽取

  5)關(guān)系圖算法

  社交網(wǎng)絡(luò)關(guān)系網(wǎng)絡(luò)關(guān)系挖掘和金融風(fēng)險控制等

  6)模式識別

  語音識別、圖像識別和手寫字識別

  總評

  機器學(xué)習(xí)+ 是大趨勢

  2 基本概念

  機器學(xué)習(xí)流程

  1)場景解析

  把業(yè)務(wù)邏輯和算法進行匹配

  2)數(shù)據(jù)預(yù)處理

  清洗數(shù)據(jù),將數(shù)據(jù)進行歸一化或標(biāo)準(zhǔn)化,減少量綱和噪音。

  3)特征工程

  機器學(xué)習(xí)最重要步驟。在算法固定的情況下,特征的選擇決定了模型的效果

  4)模型訓(xùn)練

  訓(xùn)練數(shù)據(jù)經(jīng)過了預(yù)處理 + 特征工程后進入訓(xùn)練階段。

  5)模型評估

  對各模型的預(yù)測結(jié)果評估

  6)離線/在線服務(wù)

  數(shù)據(jù)源結(jié)構(gòu)

  1)結(jié)構(gòu)化數(shù)據(jù)

  矩陣結(jié)構(gòu)存儲,通常包含特征列+目標(biāo)列。機器學(xué)習(xí)算法通常只支持結(jié)構(gòu)化數(shù)據(jù)

  2)非結(jié)構(gòu)化數(shù)據(jù)

  圖像、文本或語音文件,不以矩陣機構(gòu)存儲,是目前技術(shù)熱點,通常將其轉(zhuǎn)化為二進制存儲格式

  3)半結(jié)構(gòu)化數(shù)據(jù)

  典型的半結(jié)構(gòu)化數(shù)據(jù)是XML拓展名的存儲數(shù)據(jù)

  算法分類

  1)監(jiān)督學(xué)習(xí)

  有特征值+目標(biāo)隊列,依賴打標(biāo),常用于回歸和分類算法

  2)無監(jiān)督學(xué)習(xí)

  無目標(biāo)值,不依賴數(shù)據(jù)的打標(biāo),通常用于聚類算法

  3)半監(jiān)督學(xué)習(xí)

  對樣本的部分進行打標(biāo),一種半監(jiān)督算法 —— 標(biāo)簽傳播算法

  4)強化學(xué)習(xí)

  人工智能領(lǐng)域熱點。系統(tǒng)與外界不斷交互,從而決定自身的行為,如無人汽車駕駛和阿法狗下圍棋

  使用機器學(xué)習(xí)算法常見問題

  過擬合問題

  算法結(jié)果評估

  1、精確率、召回率、F1值

  2、ROC和AUC

  另外還需要了解的指標(biāo):TP、FP、TN、FN

  總評

  基礎(chǔ)概念的理解有利于幫助入門

來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時刪除。


《機器學(xué)習(xí)實踐應(yīng)用》讀書筆記》由互聯(lián)網(wǎng)用戶整理提供,轉(zhuǎn)載分享請保留原作者信息,謝謝!
鏈接地址:http://www.seogis.com/gongwen/784589.html