導(dǎo)讀:機(jī)器學(xué)習(xí)作為一個(gè)概念,與提高計(jì)算機(jī)使用算法和神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的能力有關(guān),并能更快更有效地執(zhí)行各種任務(wù)。機(jī)器學(xué)習(xí)或ML通過使用數(shù)據(jù)或數(shù)據(jù)集來幫助建立模型來做出決策。
機(jī)器學(xué)習(xí)的概念分析
機(jī)器學(xué)習(xí)作為一個(gè)概念,與提高計(jì)算機(jī)使用算法和神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的能力有關(guān),并能更快更有效地執(zhí)行各種任務(wù)。機(jī)器學(xué)習(xí)或ML通過使用數(shù)據(jù)或數(shù)據(jù)集來幫助建立模型來做出決策。它可用于精簡組織的決策和執(zhí)行績效。這個(gè)詞是1959年由美國人阿瑟·塞繆爾(ArthurSamuel)首創(chuàng)的,他精通人工智能和電腦游戲。
從概念上講,機(jī)器學(xué)習(xí)模擬了人類的腦細(xì)胞交互模式。在大腦活動中,當(dāng)神經(jīng)元相互交流時(shí),這些神經(jīng)元反過來使人類能夠輕松地執(zhí)行各種功能和任務(wù),而不需要任何其他外部形式的支持。就像人類大腦中的神經(jīng)元根據(jù)情況來解剖每個(gè)任務(wù)一樣,在ML中,數(shù)據(jù)按照各種算法來預(yù)測、分類和表示,解決一個(gè)復(fù)雜問題并提出解決方案。
機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)模型也是基于DonaldHebb博士在TheOrganizationofBehavior中的理論。在制定機(jī)器學(xué)習(xí)概念方面的一些顯著貢獻(xiàn)是基于1950年代IBM的ArthurSamuel的進(jìn)化工作的逐步實(shí)施,他開發(fā)了一個(gè)計(jì)算機(jī)程序。該計(jì)算機(jī)程序涉及alpha-beta剪枝,用于測量跳棋游戲中每一方獲勝的機(jī)會。緊隨其后的是由FrankRosenblatt于1957年開發(fā)的定制機(jī)器感知器,專為圖像識別而構(gòu)建,導(dǎo)致了MercelloPelillo于1967年開發(fā)的用于基本模式識別的最近鄰算法。
機(jī)器學(xué)習(xí)算法和模型
機(jī)器學(xué)習(xí)是基于算法和模型的校準(zhǔn)功能。簡單地說,算法可以稱為利用結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生輸出的簡單過程。同時(shí),機(jī)器學(xué)習(xí)模型表示程序和程序(算法)的結(jié)合,即使用程序來達(dá)到預(yù)期的結(jié)果,完成預(yù)期的任務(wù)。
算法是一個(gè)公式,通過它可以做出預(yù)測;機(jī)器學(xué)習(xí)模型是實(shí)現(xiàn)算法后產(chǎn)生的輸出的更廣泛的方面。因此,在技術(shù)層面上,可以引用機(jī)器學(xué)習(xí)算法導(dǎo)致ML模型,而不是反之。為了理解ML算法的功能,讓我們先看看機(jī)器學(xué)習(xí)中的模型。
機(jī)器學(xué)習(xí)模型分為三大類:
監(jiān)督學(xué)習(xí):在監(jiān)督學(xué)習(xí)中,在不確定的情況下,通過計(jì)算證據(jù),從已知的數(shù)據(jù)集(輸入)和已知的數(shù)據(jù)響應(yīng)(輸出)做出預(yù)測,以開發(fā)新的數(shù)據(jù)或數(shù)據(jù)集作為響應(yīng)。監(jiān)督學(xué)習(xí)進(jìn)一步使用分類和回歸等技術(shù)來提出其他機(jī)器學(xué)習(xí)模型。無監(jiān)督學(xué)習(xí):無監(jiān)督學(xué)習(xí)包括從輸入數(shù)據(jù)中得出推論,而不從具有內(nèi)在數(shù)據(jù)集或結(jié)構(gòu)的隱藏模式中標(biāo)記出響應(yīng)。強(qiáng)化學(xué)習(xí):在機(jī)器學(xué)習(xí)的強(qiáng)化學(xué)習(xí)模型中,基于試錯(cuò)法,在復(fù)雜環(huán)境下做出一系列決策。根據(jù)所做決定的結(jié)果,獎勵和懲罰有助于最終引出回應(yīng)。
現(xiàn)在為了詳細(xì)說明機(jī)器算法做了什么,讓我們以一個(gè)基于聚類的機(jī)器學(xué)習(xí)算法K-means為例??紤]了幾個(gè)聚類,以k為變量。識別每個(gè)簇的中心或質(zhì)心,并在其基礎(chǔ)上定義一個(gè)數(shù)據(jù)點(diǎn)。在幾次迭代中,數(shù)據(jù)點(diǎn)和集群被重新識別,一旦定義了所有中心,數(shù)據(jù)點(diǎn)將與每個(gè)集群對齊,并與集群中心相接近。該算法在訓(xùn)練數(shù)據(jù)上表現(xiàn)出色,有助于分類各種人工智能程序的音頻檢測和圖像分割等復(fù)雜任務(wù)。
使機(jī)器學(xué)習(xí)成為一個(gè)進(jìn)步的領(lǐng)域,根據(jù)業(yè)務(wù)需求探索和發(fā)展的另一個(gè)方面是它對數(shù)據(jù)處理的需求。各種形式的訓(xùn)練數(shù)據(jù)是機(jī)器學(xué)習(xí)的基礎(chǔ)。從檢測用于安全目的的對象到預(yù)測業(yè)務(wù)趨勢,高效和高性能的算法本質(zhì)上是以數(shù)據(jù)為中心的;數(shù)據(jù)集越精確,算法產(chǎn)生的輸出就越準(zhǔn)確。
機(jī)器學(xué)習(xí)中數(shù)據(jù)驅(qū)動的算法
在物理世界中,人類互動的大部分方面都是基于與各種無形數(shù)據(jù)的動態(tài)關(guān)系,人類的大腦每天都會執(zhí)行許多簡單的數(shù)據(jù)驅(qū)動計(jì)算。類似地,計(jì)算是基于機(jī)器學(xué)習(xí)中的數(shù)據(jù)或標(biāo)記訓(xùn)練數(shù)據(jù),這有助于基于人工智能(AI)的程序工作來增加價(jià)值。與編寫程序代碼自動化處理過程或?qū)Υ罅繑?shù)據(jù)進(jìn)行深入調(diào)查相比,算法的使用要可靠得多,速度也快得多。
機(jī)器學(xué)習(xí)算法是一種數(shù)學(xué)方法,在提供的數(shù)據(jù)的幫助下產(chǎn)生一組結(jié)果。因此,在機(jī)器學(xué)習(xí)的過程中,數(shù)據(jù)的重要性是至關(guān)重要的。由ML驅(qū)動的人工智能程序的效率取決于輸入算法代碼的訓(xùn)練數(shù)據(jù)的質(zhì)量。不準(zhǔn)確的數(shù)據(jù)集也會降低性能。
對于一個(gè)ML算法產(chǎn)生高價(jià)值的輸出,可用性的高質(zhì)量的訓(xùn)練數(shù)據(jù)集是必須的。訓(xùn)練數(shù)據(jù)集是根據(jù)人工智能應(yīng)用程序的目標(biāo)開發(fā)的注釋或說明數(shù)據(jù)。
主要是兩種類型的數(shù)據(jù)推動了機(jī)器學(xué)習(xí)算法的工作。
1.手工數(shù)據(jù)標(biāo)簽
2.自動數(shù)據(jù)標(biāo)簽
3.人工智能輔助的數(shù)據(jù)標(biāo)注
在自動、手動和人工輔助數(shù)據(jù)標(biāo)注方面有一些關(guān)鍵的區(qū)別。在手動數(shù)據(jù)標(biāo)簽,人群強(qiáng)制標(biāo)簽的原始數(shù)據(jù)按照共享的指導(dǎo)方針或技術(shù)定義附加標(biāo)簽。而在自動數(shù)據(jù)標(biāo)注中,訓(xùn)練數(shù)據(jù)由程序標(biāo)注,并在加載執(zhí)行前檢查其準(zhǔn)確性。而且,人工智能輔助的數(shù)據(jù)標(biāo)記需要自動程序和人工努力來產(chǎn)生高質(zhì)量的訓(xùn)練數(shù)據(jù)。
基于數(shù)據(jù)的算法在現(xiàn)實(shí)世界中的應(yīng)用
算法和技術(shù)適用于各行業(yè)和經(jīng)濟(jì)部門。在數(shù)字技術(shù)和數(shù)據(jù)驅(qū)動的生態(tài)系統(tǒng)時(shí)代,復(fù)雜的需求面臨著高效數(shù)據(jù)創(chuàng)建和開發(fā)的挑戰(zhàn),在智慧城市、網(wǎng)絡(luò)安全、智能醫(yī)療、社交媒體和商業(yè)等領(lǐng)域,ML也在不斷實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)化和可用數(shù)據(jù)處理,以更好地做出決策。提高績效,增強(qiáng)業(yè)務(wù)可持續(xù)性。
在衛(wèi)生部門,人工智能程序正在執(zhí)行由高度可用的訓(xùn)練數(shù)據(jù)驅(qū)動的任務(wù)。這些數(shù)據(jù)使諸如二十億等健康應(yīng)用程序通過檢測對象、動作、屬性、視聽輸入、語音輸入、神經(jīng)網(wǎng)絡(luò)、語音輸出、身體控制等來幫助客戶跟蹤他們的健康訓(xùn)練計(jì)劃的進(jìn)度。,正在幫助支持AI的應(yīng)用程序解碼復(fù)雜的任務(wù),例如:
了解現(xiàn)場理解口語理解對象和動作通過聊天機(jī)器人生成口語控制助理的身體理解人類的姿勢將視覺概念與文字等聯(lián)系起來行為
在金融等領(lǐng)域,機(jī)器學(xué)習(xí)算法正在幫助企業(yè)發(fā)現(xiàn)未來的投資機(jī)會;同時(shí),對于政府部門,ML算法通過簡單地處理來自多個(gè)來源的復(fù)雜數(shù)據(jù),幫助處理欺詐、身份盜竊和提高公共工程的效率。此外,隨著數(shù)據(jù)量越來越大,機(jī)器學(xué)習(xí)(ML)正通過使用復(fù)雜的數(shù)據(jù)集來增加價(jià)值,幫助垂直企業(yè)應(yīng)對未來的諸多挑戰(zhàn)。
尾注
理想情況下,機(jī)器學(xué)習(xí)被用于處理涉及大量數(shù)據(jù)的復(fù)雜計(jì)算任務(wù),而沒有靜態(tài)公式來得出結(jié)果。多年來,隨著機(jī)器學(xué)習(xí)領(lǐng)域的不斷研究和發(fā)展,醫(yī)療、能源生產(chǎn)、汽車、航空航天、制造業(yè)和金融等商業(yè)部門都從機(jī)器學(xué)習(xí)模式中獲益。機(jī)器學(xué)習(xí)模型和算法正在幫助解決特定行業(yè)的問題,并通過對象檢測、信用評分、交易預(yù)測、DNA測序和預(yù)測性維護(hù)提供未來的全行業(yè)解決方案。
在未來幾年,隨著數(shù)據(jù)的持續(xù)增長和對可變數(shù)據(jù)的需求進(jìn)一步攀升,我們可以希望看到許多其他任務(wù)使用由機(jī)器學(xué)習(xí)算法支持的人工智能程序來執(zhí)行,這些程序的模型有助于閱讀和處理數(shù)據(jù),并為全球企業(yè)部門提供均衡的可持續(xù)性。