激情吃奶吻胸免费视频xxxx_虞姬打开双腿下面好紧_真实破女处免费视频_亚洲三级天堂

當(dāng)前位置:首頁 > 新聞中心 > 互聯(lián)網(wǎng)動(dòng)態(tài)
深圳網(wǎng)站建設(shè):大數(shù)據(jù)“殺熟”?算法該管一管了責(zé)任編輯 :李飛    文章來源 :星翼創(chuàng)想(aberdeenanguscattle.com)    發(fā)布時(shí)間 :2018-04-05    閱讀次數(shù):2041     專題 :網(wǎng)站運(yùn)營

為做好種種商業(yè)預(yù)測,越來越多企業(yè)現(xiàn)在求助于計(jì)算機(jī)算法——這種技術(shù)能以驚人速度完成超大規(guī)模分析過程。


算法能讓預(yù)測更準(zhǔn)確,但也會(huì)帶來風(fēng)險(xiǎn),尤其是在我們不理解這些算法的情況下。一個(gè)例子是社交媒體。很多社交網(wǎng)站通過算法決定推送哪些廣告和鏈接,如果設(shè)計(jì)算法時(shí)過于側(cè)重點(diǎn)擊量,“騙點(diǎn)擊”的內(nèi)容就會(huì)充斥網(wǎng)站。雖然點(diǎn)擊量上升了,但整體用戶滿意度可能直線下降。


這類問題可以避免。問題根源通常并非算法本身有漏洞,而是使用不當(dāng)。為避免犯錯(cuò),管理者須首先了解算法的功能和局限:它能解決哪些問題,不能解決哪些問題。



為何“聰明”算法反誤事?


越來越多證據(jù)顯示,將算法“人格化”更易讓人們接受。例如在自動(dòng)答復(fù)系統(tǒng)中,真實(shí)人聲要比模擬人聲的傳達(dá)效果好。然而根本問題在于,人們通常像對(duì)待人類同事一樣對(duì)待算法和計(jì)算機(jī),可算法和人類有兩大不同:


算法極其“單純”。在最新的《復(fù)仇者聯(lián)盟》(Avengers)電影中,鋼鐵俠托尼·斯塔克(Tony Stark)設(shè)計(jì)了人工智能防御系統(tǒng)奧創(chuàng)(Ultron)。奧創(chuàng)的任務(wù)是保衛(wèi)地球,但它完全按字面意思解讀任務(wù)要求,認(rèn)為拯救地球的最佳方法就是毀滅人類。在很多方面,奧創(chuàng)就像典型的算法,完全按命令行事,不顧及其他問題。如果使用算法時(shí)不夠謹(jǐn)慎,我們就會(huì)遇上麻煩。


社交網(wǎng)站如果突然充斥騙點(diǎn)擊內(nèi)容,就可能是落入了類似陷阱。這些網(wǎng)站目標(biāo)明確,即提供對(duì)用戶最有吸引力的內(nèi)容。在設(shè)計(jì)算法時(shí),網(wǎng)站管理者將這個(gè)目標(biāo)替換為:找到用戶最愿意點(diǎn)擊的內(nèi)容。這個(gè)指令邏輯上并不算錯(cuò),因?yàn)槿藗冿@然會(huì)點(diǎn)擊感興趣的內(nèi)容。但由于只根據(jù)潛在點(diǎn)擊量篩選內(nèi)容,網(wǎng)站迅速充滿無聊和帶攻擊性的內(nèi)容,導(dǎo)致聲譽(yù)受損。人們會(huì)理解網(wǎng)站管理者希望“最大化優(yōu)質(zhì)內(nèi)容點(diǎn)擊量”,而非“即便損害質(zhì)量也要最大化點(diǎn)擊量”;相反,算法則只按字面意思執(zhí)行指令。


算法是個(gè)黑箱。在莎士比亞作品《愷撒大帝》(Julius Caesar)中,一名預(yù)言者警告愷撒:“當(dāng)心3月15日”。這句話意思明確:愷撒最好有所防范。但同時(shí)又讓人完全無法理解:當(dāng)心什么?為什么?愷撒對(duì)這個(gè)信息非常困惑,于是把預(yù)言者打發(fā)走,宣稱:“他是個(gè)夢囈者,我們走吧。”最終,3月15日確實(shí)是愷撒大帝倒霉的日子,他在這天被刺。問題是預(yù)言者提供的是不完整信息,而且沒法猜到缺失的是什么,也不知道這條信息有多重要。


和莎翁筆下的預(yù)言者一樣,算法有時(shí)能非常準(zhǔn)確地預(yù)見未來,但不會(huì)告訴你事件背后的原因。算法可以通讀《紐約時(shí)報(bào)》文章,告訴你哪篇在Twitter上會(huì)火,但解釋不了人們?yōu)槭裁匆D(zhuǎn)發(fā);算法可以告訴你哪位員工最可能成功,但不能告訴你哪種特質(zhì)對(duì)成功最重要。


為更好地管理算法,認(rèn)識(shí)到上述兩項(xiàng)局限是第一步。現(xiàn)在我們再看看還需要做什么。


明確所有目標(biāo)


每個(gè)人都有自己的目標(biāo)和計(jì)劃,但很少有人會(huì)不擇手段。為了某些未明言的軟性目標(biāo),我們會(huì)做出權(quán)衡取舍:例如為了明天的聲譽(yù)放棄一部分今天的利益,或?yàn)閷?shí)現(xiàn)組織內(nèi)部平等付出短期代價(jià)。但算法只會(huì)一門心思追求給定目標(biāo)。因此在設(shè)計(jì)算法時(shí),你必須明確想要達(dá)到的所有目標(biāo)。


如果你在意某個(gè)軟性目標(biāo),就要明確指出、清晰定義,并設(shè)定其在總體目標(biāo)中的權(quán)重。由于軟性目標(biāo)較難衡量,實(shí)施算法所得結(jié)論時(shí)要特別留意。


我們最近對(duì)軟性目標(biāo)的重要性有了切身體會(huì)。本文作者之一與美國西海岸某市政府合作,幫助其提升餐飲業(yè)督查效率。幾十年來,該市的做法基本是隨機(jī)抽查,并重點(diǎn)關(guān)照有違規(guī)經(jīng)營記錄的單位。不過,選擇督查哪些餐館,很適合交給算法決定。除違規(guī)歷史外,我們的算法發(fā)現(xiàn)了很多相關(guān)變量,幫助政府衛(wèi)生部門更易發(fā)現(xiàn)違規(guī)餐館,提高督查效率。


政府對(duì)此非常感興趣,希望采用算法。我們問對(duì)方有何問題或顧慮,一陣尷尬的沉默后,有人舉手。“我不知道該怎么說,”她說,“但有個(gè)問題應(yīng)該討論一下。”她告訴我們,在有些人口密集的社區(qū),違規(guī)經(jīng)營更常見。這些社區(qū)低收入少數(shù)族裔比例較高,她不希望算法篩選出的餐館集中于這些社區(qū)。這涉及公平,即屬于軟性問題。我們的解決方法很簡單:設(shè)置各區(qū)域督查餐館數(shù)量上限。這樣做既能實(shí)現(xiàn)硬性目標(biāo),即找到最有可能違規(guī)的餐館,又照顧了軟性目標(biāo),即保證較落后區(qū)域得到公平對(duì)待。


為找到軟性目標(biāo),我們特別注意給每個(gè)人機(jī)會(huì)說出任何顧慮。我們發(fā)現(xiàn),人們經(jīng)常通過表達(dá)擔(dān)憂來提出軟性目標(biāo),所以明確征求意見能促進(jìn)開放和高質(zhì)量的討論。讓人們坦率表達(dá)觀點(diǎn),把平時(shí)私下說的話擺在桌面上,這點(diǎn)很關(guān)鍵。這讓很多問題浮出水面,不過我們遇到最多的還是公平問題,以及敏感局面處理問題。


明確核心目標(biāo)和其他考量后,設(shè)計(jì)者可以讓算法做出權(quán)衡取舍。為此,設(shè)計(jì)者通常須列出多項(xiàng)目標(biāo),并按重要性排序。


盡量避免短視


一家受歡迎的快消品公司從中國低價(jià)采購,然而銷往美國。該公司運(yùn)用算法預(yù)測哪些產(chǎn)品最好賣,銷量迅速提升。但良好勢頭只維持了幾個(gè)月,消費(fèi)者開始要求退貨。


盡管算法未能成功預(yù)測消費(fèi)者的反應(yīng),但驚人的高退貨率本可以預(yù)見到。公司當(dāng)然關(guān)注質(zhì)量,但在設(shè)計(jì)算法時(shí),沒有明確將質(zhì)量設(shè)為影響消費(fèi)者滿意度的重要因素,而過于關(guān)注銷量。調(diào)整后的新算法既能準(zhǔn)確預(yù)測產(chǎn)品銷售情況,同時(shí)也能預(yù)測產(chǎn)品的受歡迎程度和可持續(xù)度。公司現(xiàn)在推出的產(chǎn)品在亞馬遜等平臺(tái)上獲得極高評(píng)價(jià),退貨率大幅下降。


這家公司最初設(shè)計(jì)算法時(shí)落入了常見陷阱:算法關(guān)注當(dāng)下掌握的數(shù)據(jù),而這些數(shù)據(jù)通常與短期結(jié)果相關(guān),這造成算法本身有短視傾向。在短期利益和長期成功及企業(yè)整體目標(biāo)間可能存在張力,這對(duì)于人類不言自明,對(duì)算法則不然,除非你明確告訴它。


解決這個(gè)問題的方法是,在設(shè)置目標(biāo)時(shí)明確定義長期目標(biāo)。而在按照算法的預(yù)測采取行動(dòng)時(shí),管理者也要考慮算法的建議是否符合長期目標(biāo)。


過于關(guān)注點(diǎn)擊量而導(dǎo)致內(nèi)容質(zhì)量低劣的網(wǎng)站,其采用的算法也有短視問題。算法根據(jù)當(dāng)下目標(biāo)(讓用戶點(diǎn)擊鏈接)推薦內(nèi)容,卻未能考慮更重要的長期目標(biāo),即用戶滿意度和黏性。


選用合適數(shù)據(jù)源


要選擇合適的數(shù)據(jù)源,應(yīng)注意以下兩點(diǎn):


數(shù)據(jù)應(yīng)盡可能全面。企業(yè)常有的誤解,是把大數(shù)據(jù)看作“大量的數(shù)據(jù)”,例如從1萬名客戶擴(kuò)展到100萬名。但這樣只理解對(duì)了一半。設(shè)想你把數(shù)據(jù)做成表格,每行對(duì)應(yīng)一名客戶,那么客戶人數(shù)即為圖表長度;而你掌握的每名客戶的情況,即每行中的數(shù)據(jù),決定了圖表寬度。雖然數(shù)據(jù)總量能夠提升預(yù)測準(zhǔn)確度,但數(shù)據(jù)寬度才能讓大數(shù)據(jù)發(fā)揮全部威力。做預(yù)測最關(guān)鍵的就是信息的全面性。事件的每個(gè)新細(xì)節(jié)都是一條線索,能夠補(bǔ)充已掌握的情報(bào)。文字記錄就是典型的“寬”數(shù)據(jù),每個(gè)字都可以成為線索。


數(shù)據(jù)多元性很重要。從上文可以推出,數(shù)據(jù)應(yīng)盡可能多元,即各個(gè)數(shù)據(jù)源相關(guān)度低。這能讓算法的預(yù)測能力再上臺(tái)階。可以把每組數(shù)據(jù)看作一個(gè)朋友的推薦:如果朋友口味太相似,那么多幾個(gè)朋友推薦也不太有價(jià)值;反之,如果每個(gè)朋友視角不同,帶來的價(jià)值就大得多。


了解算法的局限


算法就是利用已有數(shù)據(jù)在稍有差異的情境中做預(yù)測,這些差異可能包括人員、時(shí)間等,對(duì)象事件也可能不同。本質(zhì)上,你在尋求把某項(xiàng)結(jié)論移植到另一個(gè)情境中。因此聰明的做法是,列出算法可能在新情境中失效的原因,并評(píng)估這些潛在原因。例如,某個(gè)算法根據(jù)外部網(wǎng)站評(píng)論和違規(guī)歷史,預(yù)測波士頓哪些餐館可能違反衛(wèi)生法規(guī)。而換到佛羅里達(dá)州的奧蘭多,該算法效果可能就沒那么好,因?yàn)槟抢锾鞖飧鼰幔称钒踩珕栴}與波士頓有差別。


同樣要記住,相關(guān)性不等于因果性。假設(shè)某個(gè)算法預(yù)測,較短的Twitter發(fā)言比較長發(fā)言轉(zhuǎn)發(fā)率高。這絕不是說你應(yīng)該縮短Twitter發(fā)言:這只是一項(xiàng)預(yù)測,而非建議。這項(xiàng)預(yù)測成立,是因?yàn)檩^短的Twitter發(fā)言更可能具備很多其他特征,使之更易被轉(zhuǎn)發(fā),而僅僅縮短你的發(fā)言,并不必然滿足那些條件,所以不一定能得到更多轉(zhuǎn)發(fā)。


eBay曾多年通過谷歌打廣告,發(fā)現(xiàn)看到廣告的人比沒看到的人更可能消費(fèi)。但eBay忽略的是,這些展示次數(shù)達(dá)數(shù)百萬的廣告,并不必然是人們訪問其網(wǎng)站的原因。畢竟,這些廣告針對(duì)的本來就是eBay用戶。為區(qū)分相關(guān)性和因果性,eBay進(jìn)行大規(guī)模試驗(yàn),隨機(jī)選擇廣告展示對(duì)象,結(jié)果證明大多數(shù)情況下廣告不起作用,因?yàn)榭吹綇V告的人已經(jīng)知道eBay,無論如何都會(huì)在上面消費(fèi)。


算法有很強(qiáng)預(yù)測能力。但在做因果推論時(shí),你必須多加留意,因?yàn)樗惴ú荒苋〈鷮?duì)照試驗(yàn)。不過在有些方面,算法能取得驚人成功:發(fā)現(xiàn)人類觀察不到的細(xì)微規(guī)律,并利用這些規(guī)律形成準(zhǔn)確洞察,助力決策。留給我們的課題是:了解算法的風(fēng)險(xiǎn)和局限,并通過高效管理,釋放它的巨大潛力。

深圳網(wǎng)站建設(shè)-本文轉(zhuǎn)載自網(wǎng)絡(luò),版權(quán)歸原作者所有


文章轉(zhuǎn)載請(qǐng)保留網(wǎng)址:http://aberdeenanguscattle.com/news/industry/2089.html

掃碼添加微信
159 8667 8737
24小時(shí)電話

返回頂部