? 色综合av男人的天堂伊人,婷婷开心色四房播播,特大巨黑吊性xxxx

亚洲 a v无 码免 费 成 人 a v,性欧美videofree高清精品,新国产三级在线观看播放,少妇人妻偷人精品一区二区,天干天干天啪啪夜爽爽av

當計算機讀懂了你的情緒,世界會變得更好嗎?

2021/07/20
導讀
數(shù)學知識是相對容易的部分,困難的實際上還是理解人類。
?


圖片來源:pixabay

撰文 | Dana Mackenzie

翻譯 | 嚴如風

責編 | 嶺   桐


一些企業(yè)和研究人員正在試圖用計算機來讀懂文字背后的情感:雖然情感分析產品還遠非完美,但已經能夠從大數(shù)據中提煉出一些東西,甚至在未來的某一天可以監(jiān)控人類的心理健康。

 

很多人認為2020年是有史以來最糟糕的一年,雖然這樣的描述可能過于主觀,但有一份數(shù)據可以支持這個結論。

 

Hedonometer(譯者注:Hedono是一個詞根,意為愉悅)是一種計算機化的評估方法,檢測我們的幸福與失落。它在佛蒙特大學的電腦上日復一日地運行,每天從推特上收集約5000萬條推文,然后對公眾的情感進行快速、粗略的解讀。根據Hedonometer的數(shù)據,2020年是它自2008年開始記錄以來最糟糕的一年。


情感分析已經有了多種使用場景。圖片來源:pexels


50多年來,計算機科學家一直在研究如何使用計算機來評估單詞的情感基調,Hedonometer是他們取得的比較新的進展。為了建立Hedonometer,佛蒙特大學的計算機科學家克里斯-丹佛斯需要教機器去理解這些推文背后的情感,畢竟人類不可能一一解讀所有推文。這一過程被稱為情感分析,已經在近年來取得了重大進展,并有了多種使用場景。

 

除了用來感知Twitter用戶的情緒狀況外,研究人員還利用情感分析來研究人們對氣候變化的看法以及驗證一般常識,比如在音樂中小和弦是否比大和弦更悲傷(以及悲傷的程度)等等。而一些覬覦客戶情感信息的企業(yè)正在利用情感分析來評估Yelp(美國最大點評網站)等平臺上的評論,也有一些企業(yè)正在利用它來感知工作中員工在內部社交網絡上的情緒。這種技術也可能在醫(yī)學上得到應用,例如識別需要幫助的抑郁癥患者。

 

丹佛斯表示,情緒分析可以幫助研究人員分析大量的數(shù)據,而這些數(shù)據在以前很難被收集,過程也很費時:“在社會科學中,我們傾向于測量那些容易的東西,如國內生產總值,而幸福本身是一個很重要但很難衡量的東西”。


01

如何讀懂你的詞


你可能認為情感分析的第一步是教計算機理解人類在說什么,但這是計算機科學家無法做到的,理解語言是人工智能中最臭名昭著的難題之一。其實書面文字背后有大量的情感線索,即使不理解文字的含義,計算機也能識別情感。

 

最早的情感分析方法是單詞計數(shù),這個想法很簡單,就是計算正面詞的數(shù)量和負面詞的數(shù)量。更好的辦法是根據單詞的含義進行加權,例如“優(yōu)秀(Excellent)”比“良好(Good)”表達了更強烈的情感,這些權重通常是由專家配置的:將一部分情感分析中經常使用的詞對應到情感的字典中,這一方法被稱為詞庫法(lexicons)


最簡單的情感分析辦法是詞庫法。圖片來源:pixabay


但僅僅計算字數(shù)有其固有的問題,其一是忽略了語序,只是把句子當成了詞的集合。此外計詞法可能會遺漏一些來自特定語境的線索,比如這個產品評論:“I’m so happy that my iPhone is nothing like my old ugly Droid. (我很高興,我的iPhone和我老舊丑陋的Android手機完全不一樣。)”這句話有三個負面的詞(“完全不一樣”、“老”、“丑”),只有一個正面的詞(“高興”);雖然人類能立即意識到“老舊”和“丑”指的是不同的手機,但對計算機來說,這都是負面的。同時,比較的語境會帶來更多的困難。“完全不一樣”是什么意思?說話者到底想不想把兩者做對比?語言在有些時候是令人困惑的。

 

為了解決這些問題,計算機科學家已經越來越多地轉向更加復雜的方法,將人類勞動完全排除在這個過程之外。他們正在使用機器學習教應用程序來識別一些范例,比如單詞之間的意義關系。例如計算機可以學習當“bank”和 “river”這兩個詞經常出現(xiàn)在一起時,“bank”會代表“河流”的意思,而當 “bank”和“money”出現(xiàn)在同一個句子中,那么它的意思可能就會是“銀行”。

 

2013年機器學習在這方面取得了重要的進展,Google Brain的研究員托馬斯-米科羅夫構建了一個叫做單詞嵌入(word embeddings)的工具,這個工具將每個詞映射到50到300個數(shù)字的列表,稱為一個向量。這些數(shù)字就像描述一個詞的指紋,可以描述它和其他詞語出現(xiàn)在一起時的特征。

 

為了獲得這些描述符,米克羅夫的程序整理了報紙文章中的數(shù)百萬個詞,并試圖在給定前面一個詞的情況下預測下一個詞。米克羅夫的嵌入法可以識別同義詞:像“錢”和“現(xiàn)金”這樣的詞有非常相似的映射。更巧妙的是,盡管這個工具實際上無法認清這些單詞的含義,但它可以捕捉到一些基本的類推:例如國王之于女王就像男孩之于女孩一樣。鑒于這種類推是美國高考(SAT)的考察范圍,能夠做到這樣已經是一個了不起的成就了。


神經網絡使得機器學習取得了驚人的進展。圖片來源:pixabay


米克羅夫的單詞嵌入是由一個具有隱藏層(譯者注:將輸入數(shù)據的特征通過一定的神經元結構轉換至另一個維度空間,使之可以被合理分類。)的神經網絡生成的。近年來,以人腦為松散模型的神經網絡使機器學習取得了驚人的進展,其杰出代表就是AlphaGo。米克羅夫的網絡是一個專門設計的淺層網絡,可以用于翻譯和話題分析等多種場景。

 

更深層的神經網絡,有更多的“皮層”,可以在一個特定的句子或文件的背景下提取個別詞語的情感信息。一個常見的參考任務是讓計算機閱讀互聯(lián)網電影數(shù)據庫(IMDb)上的影評,并預測評論者是給的好評還是差評。詞庫法最早達到了大約74%的準確率,往后更復雜的也只達到了87%的準確率;而最早的神經網絡方法在2011年就取得了89%的得分,如今它們的準確率高達94%以上,這已經接近于人類的水平。然而幽默和諷刺仍然是很大的絆腳石,此時語言表達可能會與預期情緒相反。

 

盡管神經網絡有諸多好處,但基于詞庫的方法仍然很受歡迎,丹佛斯也無意改變他的Hedonometer詞庫。神經網絡在一些問題的結果上可能更準確,但它們也是有代價的,單單是機器學習的訓練期就已經是電腦能運行最復雜的任務之一了。

 

“基本上,受限于你有多少電,”沃頓商學院的羅伯特·斯蒂恩說,他在《2019年度統(tǒng)計及其應用年度回顧》中介紹了情感分析的演變?!肮雀栌昧硕嗌匐妬碛柧欰lphaGo?我聽到的笑話是,這些電足以煮沸海洋?!?/span>

 

除了電力需求外,神經網絡還需要昂貴的硬件和一定的專業(yè)技術,而且機器學習的過程缺乏透明度,計算機是在自己摸索如何處理任務,而不是按部就班遵循程序員的指示。作為情感分析領域先驅,來自伊利諾伊大學芝加哥分校的劉兵教授也表示,用詞庫法更容易修正錯誤。


02

衡量心理健康


雖然情感分析通常屬于計算機科學家的職權范圍,但它在心理學中有著深厚的根基。1962年哈佛大學心理學家菲利普-斯通開發(fā)了General Inquirer,這是第一個用于心理學的計算機通用文本分析程序。20世紀90年代,社會心理學家詹姆斯·彭貝克開發(fā)了一個運用語言學調查和單詞計數(shù)的早期情感分析程序,用于觀察人們的心理世界。


這些早期的評估揭示并證實了專家們長期的觀察,即抑郁癥患者有獨特的寫作風格:例如他們會更經常地使用代詞“I”和“me”,更多使用有消極影響的詞語,言語里還會提及更多與死亡相關的詞語。


抑郁癥患者有著獨特的寫作風格。圖片來源:Pexels


通過分析社交媒體帖子,研究人員正在探究言論和寫作中表達的心理健康狀況。丹佛斯和哈佛大學心理學家安德魯-里斯分析了抑郁癥或創(chuàng)傷后應激障礙患者在被診斷之前的Twitter帖子,他發(fā)現(xiàn):抑郁癥的跡象早在九個月前就開始出現(xiàn)了。Facebook有一個專門的算法來檢測那些有疑似自殺風險的用戶,并由人工專家來審查這些案例,如果有必要會向用戶發(fā)送提示或提供熱線號碼。

 

然而,社交網絡數(shù)據距離用于病人的護理還有很長一段路要走。隱私是一個明顯的問題,此外還需要更多工作來證實有效性。西北大學的人本計算(譯者注:一種結合計算機科學和社會科學的系統(tǒng)工程方法論)專家史蒂夫·錢斯勒,她是一份針對75篇此類研究審查報告的共同作者,認為許多評估心理健康的研究未能正確定義他們的術語,或者沒有提供足夠的信息來重復結果。但她仍然認為情感分析對醫(yī)療是有幫助的,比如可以對新病人進行分流。而且即使沒有個人數(shù)據,情感分析也能識別出一些趨勢,如新冠期間大學生的總體壓力水平,或引發(fā)反復性飲食不規(guī)律的社交媒體互動類型。


03

讀懂情緒


情感分析也在用于解決一些輕松的問題,2016年柏林馬克斯·普朗克人類發(fā)展研究所的尼克·奧布拉多維奇分析了Facebook上約20億條推文和Twitter的10億條推文,研究了天氣對情緒的影響。25毫米的降雨使人們的幸福感降低了約1%,而零度以下的溫度使其降低了大約2%的幸福度。在一項后續(xù)的研究中,奧布拉多維奇及其同事通過Twitter來了解人們對氣候變化的感受,發(fā)現(xiàn)了一些令人沮喪的結果。他們發(fā)現(xiàn)在連續(xù)五年全球變暖后,推特用戶的一般意識發(fā)生了變化:他們不再在推特上談論氣候變暖。盡管如此,數(shù)據顯示用戶的幸福感仍然受之影響?!斑@就像溫水煮青蛙,”奧布拉多維奇說,“這是我所做過所有論文中最令人不安的經驗性發(fā)現(xiàn)之一?!?/span>

 

周一作為每個星期最糟糕的一天已然臭名昭著。盡管如此,丹佛斯的Hedonometer對推文的早期分析發(fā)現(xiàn),星期二實際上才是人們情緒最低落的一天。當然,周五和周六是最快樂的日子,這自然無需多談。然而在2016年美國大選之后,每星期的情緒模式發(fā)生了變化。雖然每周的情緒循環(huán)依然保留,但人們的注意力在此之外被其他事情所吸引,話題度甚至超過了生活的一般要素。丹佛斯表示:“在Twitter上,政治話題永不停歇,一周中任何一天都可能是最失意的一天?!?/span>

 

另一個受到驗證的理論是,在音樂中,大和弦被認為比小和弦更歡快。印第安納大學的計算社會科學專家安永燁通過分析12.3萬首歌曲中每個和弦所伴隨歌詞的情感來測試這一理論,結果發(fā)現(xiàn)大和弦確實與快樂的歌詞密切相關,在9分制中得分6.3分,超過小和弦的6.2分,雖然這個差異看上去微不足道,但在Hedonometer的計量維度上,是圣誕節(jié)和正常工作日之間情緒差異的也僅有0.2分。安永燁還比較了不同的音樂流派,發(fā)現(xiàn)1960年代的搖滾樂是在情緒上是最快樂的,而重金屬相比是最消極的。


04

商業(yè)敏銳度


商業(yè)世界也在廣泛使用情感分析,但許多公司并不會公開討論,所以準確衡量其受眾程度很難。劉兵介紹道:“微軟、谷歌、亞馬遜......每個公司都在做,有些公司還有多個研究小組?!币粋€容易獲得的衡量標準是目前公開的商業(yè)和學術情感分析程序的數(shù)量。2018年的一項基準比較分析詳細地介紹了28個此類程序。


情感分析已經被企業(yè)廣泛采用。圖片來源:Pixabay


一些公司使用情感分析來了解他們的用戶在社交媒體上說些什么。有一個看起來天方夜譚的例子:加拿大航司Expedia Canada在2013年開展了一次營銷活動,但反響事與愿違,人們討厭廣告中刺耳的小提琴背景音樂。Expedia很快就發(fā)布了一個新視頻對舊廣告進行自嘲,他們邀請了一位不滿的推特用戶砸碎了小提琴。人們認為Expedia是通過情緒分析獲得社交媒體反響的。雖然這很難被證實,但這肯定是情感分析可以做到的。

 

其他有一些公司通過監(jiān)測公司內部的社交網絡,使用情感分析來跟蹤員工的滿意度。IBM開發(fā)了一個名為Social Pulse的程序來監(jiān)控公司的內部網絡,以了解員工在抱怨什么。由于隱私原因,該軟件只查看了在整個公司公開的帖子。即便如此,這種趨勢仍然困擾著丹佛斯:“我擔心的是公司的底線逾越員工的隱私,這在道德上不是無可指摘的?!?/span>

 

隨著情感分析變得越來越普遍,道德問題可能會成為下一個隱憂。企業(yè)、心理健康專家和任何其他考慮使用情感分析的主體都應該牢記,即便情感分析前途無量,但實現(xiàn)這一理想仍然是充滿風險的。分析依托的數(shù)學知識是相對容易的部分,困難的實際上還是理解人類。正如劉兵所說,“我們甚至不明白什么是真正的理解”。


 版權聲明 

本文授權翻譯自Annual Reviews 旗下雜志 Knowable Magazine,點擊文末閱讀原文可訂閱其英文通訊。

Annual Reviews 是一家致力于向科研工作者們提供高度概括、綜合信息的非營利性機構,且專注于出版綜述期刊。

原文標題“How algorithms discern our mood from what we write online,作者Dana Mackenzie,發(fā)布于2020.09.14 Knowable Magazine。鏈接為https://knowablemagazine.org/article/technology/2020/how-algorithms-discern-our-mood-what-we-write-online。

制版編輯 | Morgan


參與討論
0 條評論
評論
暫無評論內容
《賽先生》微信公眾號創(chuàng)刊于2014年7月,創(chuàng)始人為饒毅、魯白、謝宇三位學者,成為國內首個由知名科學家創(chuàng)辦并擔任主編的科學傳播新媒體平臺,共同致力于讓科學文化在中國本土扎根。
訂閱Newsletter

我們會定期將電子期刊發(fā)送到您的郵箱

GO